← Volver a todos los cuestionariosCuestionario vinculado a una guía • Medio Nivel • 6 Preguntas
Prueba de modelado de recompensas de Bradley-Terry
Pon a prueba tu comprensión de cómo las preferencias por pares se convierten en recompensas numéricas por la alineación de la IA.
Pregunta 1 de 6Correcto: 0