Tilbake til alle quizerGuide-lenket quizHardt Nivå6 Spørsmål

Gruppert belønningsnormalisering i RLHF Quiz

Test din forståelse av gruppert belønningsnormalisering og GRPO-algoritmen.

Spørsmål 1 av 6Riktig: 0

I gruppert belønningsnormalisering, hva er hver responss belønning sammenlignet med?