Voltar para todos os questionáriosQuestionário vinculado ao guiaDifícil Nível6 Perguntas

Questionário de aprendizagem por reforço com feedback humano

Teste sua compreensão dos estágios e mecanismos por trás do RLHF.

Pergunta 1 de 6Correto: 0

Qual é o objetivo principal do RLHF para um modelo de linguagem?