基礎知識指南

持續學習和災難性遺忘

持續學習的目標是隨著時間的推移訓練人工智慧執行一系列新任務，而不抹掉它已經知道的知識。

概述

持續學習的目標是隨著時間的推移訓練人工智慧執行一系列新任務，而不抹掉它已經知道的知識。它的核心障礙是災難性遺忘：當神經網路學習新任務時，梯度更新會覆蓋編碼早期任務的權重，舊的技能就會崩潰。

持續學習和災難性遺忘位於核心人工智慧工具包。當你理解它時，其他人工智慧主題就變得更容易評估和比較。

深入探討

標準神經網路假設所有數據一次性可用。在現實世界中，資料是按順序到達的，對新任務的天真微調會導致災難性的遺忘——由於共享權重被重寫，先前任務的效能直線下降。持續學習尋求平衡穩定（保留舊知識）與可塑性（吸收新知識），這是典型的穩定-可塑性困境。有三個主要的解決方案：正則化方法，如彈性權重合併，懲罰對舊任務重要的權重的變化；重播方法存儲或生成過去任務的樣本並在訓練期間交錯它們；以及為每個任務分配新參數或模組的架構方法。沒有一種方法可以完全解決這個問題，並且評估跨越任務、領域和類別增量設定。

技術洞察

災難性遺忘的出現是因為新任務的梯度下降將共享權重移向新的最優值，而沒有限制留在適合舊任務的區域附近。彈性權重合併（Elastic Weight Consolidation）估計每個權重的重要性（透過 Fisher 資訊矩陣），並添加二次懲罰，將重要權重錨定在其舊值附近。重播透過將儲存或產生的舊範例混合到新批次中來近似原始聯合分佈，因此梯度反映了舊任務和新任務，從而減少了破壞性覆蓋。

掌握持續學習和災難性遺忘

為了建立深入的理解，請將持續學習和災難性遺忘視為一種操作模型，而不是單一功能。定義期望的結果，澄清假設，並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。

在實踐中，使用持續學習和災難性遺忘的強大團隊首先建立強大的概念模型，然後將這些模型映射到實際的生產限制。他們記錄明確的成功標準，根據實際數據和工作流程進行測試，並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

它可以幫助您將清晰的技術聲明與行銷語言分開。同時，不同的團隊可能會以不同的方式使用相同術語，因此請儘早定義範圍。最具彈性的方法是將實驗速度與治理規則結合：運行試點、捕獲證據、發布決策日誌，並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

它可以幫助您將清晰的技術聲明與行銷語言分開。

它可以幫助您將清晰的技術聲明與行銷語言分開。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

在花費金錢或時間之前，您可以提出更好的實施問題。

在花費金錢或時間之前，您可以提出更好的實施問題。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

持續學習與災難性遺忘的未來

持續學習對於保持大型模型的最新性越來越重要，而無需進行全面、昂貴的再培訓。研究正在推動參數高效的持續更新（適配器、每個任務添加的 LoRA 模組）、使用生成模型更好地重播，以及更新基礎模型中的知識同時避免遺忘和不必要的漂移的方法。期望與終身代理建立更緊密的聯繫，這些代理在設備上學習、保護隱私的重放，避免存儲原始數據，以及更好地反映現實的非平穩數據流而不是整齊的任務邊界的基準。

現實世界的實施

已部署的影像分類器必須每月學習新的產品類別，而不會忘記較早的產品類別。

設備上的個人化（鍵盤或語音助理）可以隨著時間的推移適應用戶，而不會失去整體準確性。

機器人可以依序獲得新的操作技能，同時保留先前掌握的技能。

使用適配器使用新事實或領域更新語言模型，從而保留先前的功能。

實施模式

實踐中的持續學習與災難性遺忘

已部署的影像分類器必須每月學習新的產品類別，而不會忘記較早的產品類別。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

實踐中的持續學習與災難性遺忘

設備上的個人化（鍵盤或語音助理）可以隨著時間的推移適應用戶，而不會失去整體準確性。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

實踐中的持續學習與災難性遺忘

機器人可以依序獲得新的操作技能，同時保留先前掌握的技能。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

實踐中的持續學習與災難性遺忘

使用適配器使用新事實或領域更新語言模型，從而保留先前的功能。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

風險與防護欄

不同的團隊可能會以不同的方式使用相同術語，因此請儘早定義範圍。

基準測試可能看起來很強大，但實際效能卻參差不齊。

忽視數據品質和評估計劃通常會產生脆弱的結果。

實施路線圖

從您需要的結果的簡單語言定義開始。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

在測試之前選擇一種成功指標和一種失敗條件。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

使用代表性資料運行小型試點，而不是完善的演示集。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

記錄持續學習和災難性遺忘在哪些方面有幫助，以及哪些更簡單的方法更好。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

不斷探索

什麼是人工智慧？

在深入研究之前先了解基本概念。

閱讀指南

人工智慧如何學習

了解現代系統背後的訓練過程。

閱讀指南

Check your understanding

Test yourself: take the Continual Learning and Catastrophic Forgetting quiz

Start quiz →

持續學習和災難性遺忘

概述

深入探討

技術洞察

掌握持續學習和災難性遺忘

戰略影響

持續學習與災難性遺忘的未來

現實世界的實施

實施模式

實踐中的持續學習與災難性遺忘

實踐中的持續學習與災難性遺忘

實踐中的持續學習與災難性遺忘

實踐中的持續學習與災難性遺忘

風險與防護欄

實施路線圖

不斷探索

什麼是人工智慧？

人工智慧如何學習

Related guides