学习
新闻
工具
Jobs
术语表
认证
测验
使命
支持
English
Search
⌘K
提交工具
捐赠
English
Search
⌘K
学习
AI Guides & Foundations
新闻
Latest AI Developments
工具
Top AI Directory
Jobs
AI Hiring Board
术语表
AI Terms Dictionary
认证
Get Your AI Certificate
测验
Interactive AI Assessments
使命
Why We Exist
支持
Help and Contact
提交工具
捐赠
English
← 返回所有测验
引导式测验 • 硬 级别 • 6 问题
根据人类反馈进行强化学习测验
测试您对 RLHF 背后的阶段和机制的理解。
相关引导路径
从人类反馈中强化学习
问题 1 的 6
正确: 0
RLHF 对于语言模型的主要目的是什么?
需要提示吗?
增加模型的参数数量
使其输出符合人类偏好,以提供帮助和安全
压缩模型以加快推理速度
将模型翻译成其他语言