概述
驗證鏈(Cove)是一種提示方法,模型起草答案,產生自己的事實檢查問題,獨立回答這些問題,然後修改草稿。這很重要,因為它無需外部工具即可顯著減少自信但錯誤的製造。
減少幻覺的驗證鍊是語言人工智慧堆疊的一部分,用於大規模讀取、生成、分類和轉換文字和語音。
深入探討
當語言模型表達流暢但錯誤的內容時,就會出現幻覺。 Meta 人工智慧研究人員在 2023 年提出的驗證鏈透過結構化自我檢查來應對此問題。模型首先寫出一個基線答案。然後,它會規劃一系列有針對性的驗證問題,以探討該草案中的事實主張,例如「這個人何時出生?」或「哪家公司發布了該產品?」。至關重要的是,它獨立地回答每個驗證問題,最好是在沒有看到原始草稿的情況下,這樣它就不會只是對早期的錯誤蓋上橡皮圖章。最後,它將驗證答案與草稿進行比較,並產生更正的最終回應。在列出實體和撰寫傳記等任務中,與單一直接答案相比,Cove 減少了事實錯誤。
技術洞察
關鍵技巧是將驗證與草案脫鉤。如果模型在盯著原始文字的同時回答自己的檢查問題,它往往會確認其先前的標記。透過單獨回答問題或在單獨的呼叫中回答問題,該模型可以更誠實地檢索事實,揭示矛盾。該管道分為四個步驟:起草、計劃驗證、獨立執行驗證以及產生刪除或修復不受支援的聲明的修訂答案。
掌握減少幻覺的驗證鏈
驗證鏈(Cove)是一種提示方法,模型起草答案,產生自己的事實檢查問題,獨立回答這些問題,然後修改草稿。這很重要,因為它無需外部工具即可顯著減少自信但錯誤的製造。減少幻覺的驗證鍊是語言人工智慧堆疊的一部分,用於大規模讀取、生成、分類和轉換文字和語音。為了建立深入的理解,請將減少幻覺的驗證鏈視為一種操作模型,而不是單一功能:定義期望的結果,澄清假設,並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。
在實踐中,強大的團隊使用驗證鏈來減少幻覺,將提示、檢索和審查循環設計為一個整合的通訊系統。他們記錄明確的成功標準,根據實際數據和工作流程進行測試,並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。
語言工作流程可以在不犧牲一致性的情況下更快地移動。同時,幻覺事實可以悄悄地進入報告、支持流程或研究成果。最具彈性的方法是將實驗速度與治理規則結合:運行試點、捕獲證據、發布決策日誌,並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。
戰略影響
語言工作流程可以在不犧牲一致性的情況下更快地移動。
語言工作流程可以在不犧牲一致性的情況下更快地移動。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
它擴展了跨語言和溝通方式的訪問。
它擴展了跨語言和溝通方式的訪問。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
團隊可以花更多時間進行判斷,而自動化則可以處理重複。
團隊可以花更多時間進行判斷,而自動化則可以處理重複。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
現實世界的實施
研究助理在向使用者展示生成的傳記之前仔細檢查日期和姓名。
一個企業知識機器人根據自己的後續問題驗證其引用的產品規格。
產生實體清單(例如,「出生於波士頓的政治家」)並刪除未通過驗證的實體。
醫療資訊摘要器標記並修改其獨立檢查無法確認的聲明。
實施模式
實踐中減少幻覺的驗證鏈
研究助理在向使用者展示生成的傳記之前仔細檢查日期和姓名。
研究助理在向使用者展示生成的簡介之前會仔細檢查生成的簡介中的日期和姓名。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會得到更好的結果。
實踐中減少幻覺的驗證鏈
一個企業知識機器人根據自己的後續問題驗證其引用的產品規格。
企業知識機器人根據自己的後續問題驗證其引用的產品規格。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會得到更好的結果。
實踐中減少幻覺的驗證鏈
產生實體清單(例如,「出生於波士頓的政治家」)並刪除未通過驗證的實體。
產生實體清單(例如,「出生於波士頓的政治家」)並修剪那些未通過驗證的實體 當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移跟踪生產力增益和錯誤成本時,通常會獲得更好的結果。
實踐中減少幻覺的驗證鏈
醫療資訊摘要器標記並修改其獨立檢查無法確認的聲明。
醫療資訊總結者標記並修改了其獨立檢查無法確認的說法,當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移跟踪生產力增益和錯誤成本時,通常會獲得更好的結果。
風險與防護欄
幻覺的事實可以悄悄地進入報告、支持流程或研究成果。
及時的敏感性可能會在類似的請求中產生不一致的結果。
如果存取控制薄弱,敏感文字資料可能會暴露。
實施路線圖
在推出之前定義輸出格式、語氣和品質標準。
在推出之前定義輸出格式、語氣和品質標準。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
當準確性很重要時,請使用可信任來源進行地面回應。
當準確性很重要時,請使用可信任來源進行地面回應。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
為高風險輸出保留人工審查檢查點。
為高風險輸出保留人工審查檢查點。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
追蹤故障模式並定期重新訓練提示或工作流程。
追蹤故障模式並定期重新訓練提示或工作流程。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。