← すべてのクイズに戻るガイド連動クイズ • ハードレベル • 6 質問

人間のフィードバックからの強化学習クイズ

RLHF の背後にある段階とメカニズムについての理解をテストします。

関連するガイドパス

人間のフィードバックからの強化学習

質問 1 の 6正解: 0

言語モデルにおける RLHF の主な目的は何ですか?