Volver a todos los cuestionariosCuestionario vinculado a una guíaMedio Nivel6 Preguntas

Prueba de modelado de recompensas de Bradley-Terry

Pon a prueba tu comprensión de cómo las preferencias por pares se convierten en recompensas numéricas por la alineación de la IA.

Rutas de guía relacionadas

Pregunta 1 de 6Correcto: 0

¿Qué convierte el modelo Bradley-Terry en puntuaciones numéricas?