← Назад към всички викториниТест, свързан с ръководство • трудно Ниво • 6 Въпроси
Нормализиране на групираната награда в RLHF тест
Тествайте разбирането си за нормализацията на групираната награда и алгоритъма GRPO.
Въпрос 1 на 6Правилно: 0
Тествайте разбирането си за нормализацията на групираната награда и алгоритъма GRPO.