Tillbaka till alla frågesporterGuidelänkat frågesportHårt Nivå6 Frågor

Quiz för förstärkning att lära sig av mänsklig feedback

Testa din förståelse för stadierna och mekanismerna bakom RLHF.

Fråga 1 av 6Rätt: 0

Vad är huvudsyftet med RLHF för en språkmodell?