Volver a todos los cuestionariosCuestionario vinculado a una guíaMedio Nivel6 Preguntas

Prueba de Q-Learning

Pruebe su comprensión de cómo Q-Learning estima los valores de acción y converge hacia un comportamiento óptimo.

Rutas de guía relacionadas

Pregunta 1 de 6Correcto: 0

¿Qué representa el valor Q Q(s, a)?