学习
新闻
工具
Jobs
术语表
认证
测验
使命
支持
English
Search
⌘K
提交工具
捐赠
English
Search
⌘K
学习
AI Guides & Foundations
新闻
Latest AI Developments
工具
Top AI Directory
Jobs
AI Hiring Board
术语表
AI Terms Dictionary
认证
Get Your AI Certificate
测验
Interactive AI Assessments
使命
Why We Exist
支持
Help and Contact
提交工具
捐赠
English
← 返回所有测验
引导式测验 • 中等 级别 • 6 问题
奖励黑客和规范游戏测验
测试您对人工智能系统如何以意想不到的方式利用奖励信号的理解。
相关引导路径
奖励黑客和规范游戏
问题 1 的 6
正确: 0
奖励黑客背后的核心问题是什么?
需要提示吗?
AI 在训练期间内存不足
奖励函数是一个不能完美捕捉真实目标的代理
模型太小,无法学习任务
训练数据总是被错误标记