Tilbake til alle quizerGuide-lenket quizHardt Nivå6 Spørsmål

Quiz for forsterkning og læring fra menneskelig tilbakemelding

Test din forståelse av stadiene og mekanismene bak RLHF.

Spørsmål 1 av 6Riktig: 0

Hva er hovedhensikten med RLHF for en språkmodell?