すべてのクイズに戻るガイド連動クイズハード レベル6 質問

人間のフィードバックからの強化学習クイズ

RLHF の背後にある段階とメカニズムについての理解をテストします。

質問 1 6正解: 0

言語モデルにおける RLHF の主な目的は何ですか?