返回所有测验引导式测验中等 级别6 问题

偏好优化测验中的长度标准化

测试您对在偏好优化期间应用长度归一化的原因和方式的理解。

问题 1 6正确: 0

DPO 中的长度标准化主要旨在防止哪些不良行为?