← Kembali ke semua kuisKuis terkait panduan • Keras Tingkat • 6 Pertanyaan
Normalisasi Hadiah yang Dikelompokkan dalam Kuis RLHF
Uji pemahaman Anda tentang normalisasi imbalan berkelompok dan algoritma GRPO.
Pertanyaan 1 dari 6Benar: 0
Uji pemahaman Anda tentang normalisasi imbalan berkelompok dan algoritma GRPO.