Voltar para todos os questionáriosQuestionário vinculado ao guiaMédio Nível6 Perguntas

Questionário de modelagem de recompensa Bradley-Terry

Teste sua compreensão de como as preferências aos pares se tornam recompensas numéricas para o alinhamento da IA.

Caminhos de guia relacionados

Pergunta 1 de 6Correto: 0

O que o modelo Bradley-Terry converte em pontuações numéricas?