← 回傳所有測驗引導式測驗 • 中等等級 • 6 問題

偏好優化測驗中的長度標準化

測試您對在偏好優化期間應用長度歸一化的原因和方式的理解。

相關引導路徑

偏好優化中的長度歸一化

問題 1 的 6正確： 0

DPO 中的長度標準化主要旨在防止哪些不良行為？