← Kembali kepada semua kuizKuiz berkaitan panduan • Keras Tahap • 6 Soalan
Normalisasi Ganjaran Berkumpulan dalam Kuiz RLHF
Uji pemahaman anda tentang normalisasi ganjaran berkumpulan dan algoritma GRPO.
soalan 1 daripada 6Betul: 0
Uji pemahaman anda tentang normalisasi ganjaran berkumpulan dan algoritma GRPO.