學習
新聞
工具
Jobs
術語表
認證
測驗
使命
支援
English
Search
⌘K
提交工具
捐款
English
Search
⌘K
學習
AI Guides & Foundations
新聞
Latest AI Developments
工具
Top AI Directory
Jobs
AI Hiring Board
術語表
AI Terms Dictionary
認證
Get Your AI Certificate
測驗
Interactive AI Assessments
使命
Why We Exist
支援
Help and Contact
提交工具
捐款
English
← 回傳所有測驗
引導式測驗 • 硬 等級 • 6 問題
根據人類回饋進行強化學習測驗
測試您對 RLHF 背後的階段和機制的理解。
相關引導路徑
從人類回饋中強化學習
問題 1 的 6
正確: 0
RLHF 對於語言模型的主要目的是什麼?
需要提示嗎?
增加模型的參數數量
使其輸出符合人類偏好,以提供幫助和安全
壓縮模型以加快推理速度
將模型翻譯成其他語言