Volver a todos los cuestionariosCuestionario vinculado a una guíaMedio Nivel5 Preguntas

Prueba de optimización de preferencias de ratio de probabilidades

Pruebe su comprensión de cómo ORPO unifica el ajuste y la alineación de preferencias.

Pregunta 1 de 5Correcto: 0

¿Cuál es la principal ventaja práctica de ORPO sobre métodos como DPO?