Tilbake til alle quizerGuide-lenket quizMiddels Nivå6 Spørsmål

Bradley-Terry Reward Modeling Quiz

Test din forståelse av hvordan parvise preferanser blir numeriske belønninger for AI-justering.

Spørsmål 1 av 6Riktig: 0

Hva konverterer Bradley-Terry-modellen til numeriske poengsummer?