基础知识指南

持续学习和灾难性遗忘

持续学习的目标是随着时间的推移训练人工智能执行一系列新任务，而不抹掉它已经知道的知识。

概述

持续学习的目标是随着时间的推移训练人工智能执行一系列新任务，而不抹掉它已经知道的知识。它的核心障碍是灾难性遗忘：当神经网络学习新任务时，梯度更新会覆盖编码早期任务的权重，旧的技能就会崩溃。

持续学习和灾难性遗忘位于核心人工智能工具包中。当你理解它时，其他人工智能主题就变得更容易评估和比较。

深入探讨

标准神经网络假设所有数据一次性可用。在现实世界中，数据是按顺序到达的，对新任务的天真微调会导致灾难性的遗忘——由于共享权重被重写，先前任务的性能直线下降。持续学习寻求平衡稳定性（保留旧知识）与可塑性（吸收新知识），这是典型的稳定性-可塑性困境。存在三个主要的解决方案：正则化方法，如弹性权重合并，惩罚对旧任务重要的权重的变化；重播方法存储或生成过去任务的样本并在训练期间交错它们；以及为每个任务分配新参数或模块的架构方法。没有一种方法可以完全解决这个问题，并且评估跨越任务、领域和类增量设置。

技术洞察

灾难性遗忘的出现是因为新任务的梯度下降将共享权重移向新的最优值，而没有限制留在适合旧任务的区域附近。弹性权重合并（Elastic Weight Consolidation）估计每个权重的重要性（通过 Fisher 信息矩阵），并添加二次惩罚，将重要权重锚定在其旧值附近。重放通过将存储或生成的旧示例混合到新批次中来近似原始联合分布，因此梯度反映了旧任务和新任务，从而减少了破坏性覆盖。

掌握持续学习和灾难性遗忘

为了建立深入的理解，请将持续学习和灾难性遗忘视为一种操作模型，而不是单一功能。定义期望的结果，澄清假设，并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中，使用持续学习和灾难性遗忘的强大团队首先构建强大的概念模型，然后将这些模型映射到实际的生产约束。他们记录明确的成功标准，根据实际数据和工作流程进行测试，并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

它可以帮助您将清晰的技术声明与营销语言分开。同时，不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。最具弹性的方法是将实验速度与治理规则结合起来：运行试点、捕获证据、发布决策日志，并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

它可以帮助您将清晰的技术声明与营销语言分开。

它可以帮助您将清晰的技术声明与营销语言分开。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

在花费金钱或时间之前，您可以提出更好的实施问题。

在花费金钱或时间之前，您可以提出更好的实施问题。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

具有共同理解的团队可以做出更好的产品、政策和学习决策。

具有共同理解的团队可以做出更好的产品、政策和学习决策。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

持续学习和灾难性遗忘的未来

持续学习对于保持大型模型的最新性越来越重要，而无需进行全面、昂贵的再培训。研究正在推动参数高效的持续更新（适配器、每个任务添加的 LoRA 模块）、使用生成模型更好地重放，以及更新基础模型中的知识同时避免遗忘和不必要的漂移的方法。期望与终生代理建立更紧密的联系，这些代理在设备上学习、保护隐私的重放，避免存储原始数据，以及更好地反映现实的非平稳数据流而不是整齐的任务边界的基准。

现实世界的实施

已部署的图像分类器必须每月学习新的产品类别，而不会忘记较早的产品类别。

设备上的个性化（键盘或语音助手）可以随着时间的推移适应用户，而不会失去总体准确性。

机器人可以依次获得新的操作技能，同时保留以前掌握的技能。

使用适配器使用新事实或域更新语言模型，从而保留先前的功能。

实施模式

实践中的持续学习和灾难性遗忘

已部署的图像分类器必须每月学习新的产品类别，而不会忘记较早的产品类别。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的持续学习和灾难性遗忘

设备上的个性化（键盘或语音助手）可以随着时间的推移适应用户，而不会失去总体准确性。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的持续学习和灾难性遗忘

机器人可以依次获得新的操作技能，同时保留以前掌握的技能。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的持续学习和灾难性遗忘

使用适配器使用新事实或域更新语言模型，从而保留先前的功能。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

风险与防护栏

不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。

基准测试可能看起来很强大，但实际性能却参差不齐。

忽视数据质量和评估计划通常会产生脆弱的结果。

实施路线图

从您需要的结果的简单语言定义开始。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

在测试之前选择一种成功指标和一种失败条件。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

使用代表性数据运行小型试点，而不是完善的演示集。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

记录持续学习和灾难性遗忘在哪些方面有帮助，以及哪些更简单的方法更好。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

不断探索

什么是人工智能？

在深入研究之前先了解基本概念。

阅读指南

人工智能如何学习

了解现代系统背后的培训过程。

阅读指南

Check your understanding

Test yourself: take the Continual Learning and Catastrophic Forgetting quiz

Start quiz →

持续学习和灾难性遗忘

概述

深入探讨

技术洞察

掌握持续学习和灾难性遗忘

战略影响

持续学习和灾难性遗忘的未来

现实世界的实施

实施模式

实践中的持续学习和灾难性遗忘

实践中的持续学习和灾难性遗忘

实践中的持续学习和灾难性遗忘

实践中的持续学习和灾难性遗忘

风险与防护栏

实施路线图

不断探索

什么是人工智能？

人工智能如何学习

Related guides