← Zpět ke všem kvízůmKvíz spojený s průvodcem • Těžko úroveň • 6 Otázky
Normalizace skupinových odměn v kvízu RLHF
Otestujte si své porozumění normalizaci seskupených odměn a algoritmu GRPO.
Otázka 1 z 6správně: 0
Otestujte si své porozumění normalizaci seskupených odměn a algoritmu GRPO.