语言人工智能指南

减少幻觉的验证链

验证链(Cove)是一种提示方法,模型起草答案,生成自己的事实检查问题,独立回答这些问题,然后修改草案。

概述

验证链(Cove)是一种提示方法,模型起草答案,生成自己的事实检查问题,独立回答这些问题,然后修改草案。这很重要,因为它无需外部工具即可显着减少自信但错误的制造。

减少幻觉的验证链是语言人工智能堆栈的一部分,用于大规模读取、生成、分类和转换文本和语音。

深入探讨

当语言模型表述流畅但错误的内容时,就会出现幻觉。 Meta 人工智能研究人员于 2023 年提出的验证链通过结构化自我检查来应对这一问题。该模型首先写出一个基线答案。然后,它会计划一系列有针对性的验证问题,以探究该草案中的事实主张,例如“这个人何时出生?”或“哪家公司发布了该产品?”。至关重要的是,它独立地回答每个验证问题,最好是在没有看到原始草稿的情况下,这样它就不会只是对早期的错误盖上橡皮图章。最后,它将验证答案与草稿进行比较,并生成更正的最终响应。在列出实体和撰写传记等任务中,与单一直接答案相比,Cove 减少了事实错误。

技术洞察

关键技巧是将验证与草案脱钩。如果模型在盯着原始文本的同时回答自己的检查问题,它往往会确认其先前的标记。通过单独回答问题或在单独的调用中回答问题,该模型可以更诚实地检索事实,揭示矛盾。该管道分为四个步骤:起草、计划验证、独立执行验证以及生成删除或修复不受支持的声明的修订答案。

掌握减少幻觉的验证链

验证链(Cove)是一种提示方法,模型起草答案,生成自己的事实检查问题,独立回答这些问题,然后修改草案。这很重要,因为它无需外部工具即可显着减少自信但错误的制造。减少幻觉的验证链是语言人工智能堆栈的一部分,用于大规模读取、生成、分类和转换文本和语音。为了建立深入的理解,请将减少幻觉的验证链视为一种操作模型,而不是单一功能:定义期望的结果,澄清假设,并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中,强大的团队使用验证链来减少幻觉,将提示、检索和审查循环设计为一个集成的通信系统。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

语言工作流程可以在不牺牲一致性的情况下更快地移动。与此同时,幻觉事实可以悄悄地进入报告、支持流程或研究成果。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

语言工作流程可以在不牺牲一致性的情况下更快地移动。

语言工作流程可以在不牺牲一致性的情况下更快地移动。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

它扩展了跨语言和沟通方式的访问。

它扩展了跨语言和沟通方式的访问。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

团队可以花更多时间进行判断,而自动化则可以处理重复。

团队可以花更多时间进行判断,而自动化则可以处理重复。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

减少幻觉验证链的未来

CoVe 正在与检索和工具使用融合:验证问题将越来越多地通过搜索、计算器或数据库来回答,而不仅仅是模型的记忆,从而进一步提高准确性。期望代理框架能够融入自动验证循环,以及运行检查成本较低的更轻的蒸馏版本。与不确定性估计相结合,未来的系统可能仅对模型不确定的索赔触发验证,从而平衡成本与可靠性。

现实世界的实施

研究助理在向用户展示生成的传记之前仔细检查日期和姓名。

一个企业知识机器人根据自己的后续问题验证其引用的产品规格。

生成实体列表(例如,“出生于波士顿的政治家”)并删除未通过验证的实体。

医疗信息摘要器标记并修改其独立检查无法确认的声明。

实施模式

实践中减少幻觉的验证链

研究助理在向用户展示生成的传记之前仔细检查日期和姓名。

研究助理在向用户展示生成的简介之前会仔细检查生成的简介中的日期和姓名。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时,通常会得到更好的结果。

实践中减少幻觉的验证链

一个企业知识机器人根据自己的后续问题验证其引用的产品规格。

企业知识机器人根据自己的后续问题验证其引用的产品规格。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会得到更好的结果。

实践中减少幻觉的验证链

生成实体列表(例如,“出生于波士顿的政治家”)并删除未通过验证的实体。

生成实体列表(例如,“出生于波士顿的政治家”)并修剪那些未通过验证的实体 当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

实践中减少幻觉的验证链

医疗信息摘要器标记并修改其独立检查无法确认的声明。

医疗信息总结者标记并修改了其独立检查无法确认的说法,当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

风险与防护栏

!

幻觉的事实可以悄悄地进入报告、支持流程或研究成果。

!

及时的敏感性可能会在类似的请求中产生不一致的结果。

!

如果访问控制薄弱,敏感文本数据可能会暴露。

实施路线图

1

在推出之前定义输出格式、语气和质量标准。

在推出之前定义输出格式、语气和质量标准。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

2

当准确性很重要时,请使用可信来源进行地面响应。

当准确性很重要时,请使用可信来源进行地面响应。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

3

为高风险输出保留人工审查检查点。

为高风险输出保留人工审查检查点。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

4

跟踪故障模式并定期重新训练提示或工作流程。

跟踪故障模式并定期重新训练提示或工作流程。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

不断探索