← 返回所有测验引导式测验 • 中等等级 • 6 问题

偏好优化测验中的长度标准化

测试您对在偏好优化期间应用长度归一化的原因和方式的理解。

相关引导路径

偏好优化中的长度归一化

问题 1 的 6正确： 0

DPO 中的长度标准化主要旨在防止哪些不良行为？