← Volver a todos los cuestionariosCuestionario vinculado a una guía • Medio Nivel • 6 Preguntas
Prueba de Q-Learning
Pruebe su comprensión de cómo Q-Learning estima los valores de acción y converge hacia un comportamiento óptimo.
Pregunta 1 de 6Correcto: 0