Вернуться ко всем викторинамВикторина, связанная с руководствомЖесткий Уровень6 Вопросы

Викторина по обучению обратному подкреплению

Проверьте свое понимание того, как IRL выводит вознаграждение из поведения и почему это сложно.

Связанные направляющие пути

Вопрос 1 из 6Правильно: 0

Что стремится восстановить обратное обучение с подкреплением?