返回所有测验引导式测验中等 级别6 问题

奖励建模测验

检查您对奖励模型的作用及其训练方式的掌握。

相关引导路径

问题 1 6正确: 0

对于给定的提示响应对,奖励模型的主要输出是什么?