← Kembali kepada semua kuizKuiz berkaitan panduan • Sederhana Tahap • 6 Soalan
Kuiz Pengoptimuman Dasar Proksimal
Uji pemahaman anda tentang cara PPO menstabilkan pembelajaran pengukuhan dan peranannya dalam RLHF.
soalan 1 daripada 6Betul: 0
Uji pemahaman anda tentang cara PPO menstabilkan pembelajaran pengukuhan dan peranannya dalam RLHF.