基礎知識指南

正規化

正則化是一組故意約束模型的技術,以便它可以推廣到新資料而不是記住訓練集。

概述

正則化是一組故意約束模型的技術,以便它可以推廣到新資料而不是記住訓練集。它是對抗過度擬合的主要工具包。

正則化位於核心人工智慧工具包中。當你理解它時,其他人工智慧主題就變得更容易評估和比較。

深入探討

如果不加以控制,靈活的模型將自行扭曲以適應訓練資料中的每個點,包括雜訊。正則化透過添加有利於更簡單解決方案的懲罰或約束來進行反擊。最常見的形式是根據模型權重的大小向損失函數添加一項。 L2 正則化(權重衰減)平滑地懲罰大權重,將其縮小到零並產生更平滑的模型。 L1 正規化會懲罰權重的絕對值,並且可以將權重的絕對值一直驅至零,從而有效地選擇特徵子集。除了權重懲罰之外,dropout 在訓練期間隨機關閉神經元,提前停止在過度擬合之前停止訓練,資料增強擴展了有效訓練集。每個都犧牲一點訓練準確度來換取更好的現實世界表現。

技術洞察

大多數正則化都會重塑優化器最小化的目標。您不是僅僅最小化預測誤差,而是最小化誤差加上 lambda 乘以權重懲罰,其中 lambda 控制強度。 L2加上權重的平方和,鼓勵很多小的權重; L1 增加絕對權重的總和,鼓勵精確零的稀疏性。 Dropout 的工作方式有所不同:透過將每一步的活化值隨機歸零,它可以防止神經元共同適應並近似訓練子網路的集合。所有這些都以稍微增加偏差為代價來減少變異數。

掌握正規化

正則化是一組故意約束模型的技術,以便它可以推廣到新資料而不是記住訓練集。它是對抗過度擬合的主要工具包。正則化位於核心人工智慧工具包中。當你理解它時,其他人工智慧主題就變得更容易評估和比較。為了建立深入的理解,請將正則化視為一種操作模型,而不是單一功能:定義期望的結果,澄清假設,並將系統可以可靠地執行的操作與仍需要專家判斷的操作分開。

在實踐中,使用正則化的強大團隊首先建立強大的概念模型,然後將這些模型映射到實際的生產限制。他們記錄明確的成功標準,根據實際數據和工作流程進行測試,並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

它可以幫助您將清晰的技術聲明與行銷語言分開。同時,不同的團隊可能會以不同的方式使用相同術語,因此請儘早定義範圍。最具彈性的方法是將實驗速度與治理規則結合:運行試點、捕獲證據、發布決策日誌,並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

它可以幫助您將清晰的技術聲明與行銷語言分開。

它可以幫助您將清晰的技術聲明與行銷語言分開。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

在花費金錢或時間之前,您可以提出更好的實施問題。

在花費金錢或時間之前,您可以提出更好的實施問題。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

正規化的未來

像 L2 和 dropout 這樣的明確懲罰仍然是標準的,但注意力正在轉向隱式正則化,即隨機梯度下降等優化器悄悄地將巨大的模型偏向通用解決方案,即使沒有額外的懲罰。標籤平滑、混合和更強的資料增強等技術對於訓練大型視覺和語言模型越來越重要。期待更多的研究來了解為什麼過度參數化網路能夠抵抗​​過度擬合,以及在訓練期間自動調整正則化強度而不是依賴手動搜尋的自適應方法。

現實世界的實施

將 L2 權重衰減添加到深度影像分類器中,使其能夠從數千張訓練照片泛化到看不見的照片。

在基因組學模型中使用 L1 正規化可以自動從數千個基因中選擇少數能夠實際預測結果的基因。

在推薦網路中套用 dropout,使其不會過度依賴任何單一使用者訊號。

一旦驗證損失停止改善,即使訓練損失可能繼續下降,也要儘早停止訓練。

實施模式

實踐中的正規化

將 L2 權重衰減添加到深度影像分類器中,使其能夠從數千張訓練照片泛化到看不見的照片。

將 L2 權重衰減添加到深度影像分類器中,使其能夠從數千張訓練照片推廣到未見過的照片。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

實踐中的正規化

在基因組學模型中使用 L1 正規化可以自動從數千個基因中選擇少數能夠實際預測結果的基因。

在基因組學模型中使用 L1 正規化,可以自動從數千個基因中選擇少數幾個能夠實際預測結果的基因。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

實踐中的正規化

在推薦網路中套用 dropout,使其不會過度依賴任何單一使用者訊號。

在推薦網路中套用 dropout,使其不會過度依賴任何單一使用者訊號。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

實踐中的正規化

一旦驗證損失停止改善,即使訓練損失可能繼續下降,也要儘早停止訓練。

一旦驗證損失停止改善,即使訓練損失可能持續下降,也要儘早停止訓練。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

風險與防護欄

!

不同的團隊可能會以不同的方式使用相同術語,因此請儘早定義範圍。

!

基準測試可能看起來很強大,但實際效能卻參差不齊。

!

忽視數據品質和評估計劃通常會產生脆弱的結果。

實施路線圖

1

從您需要的結果的簡單語言定義開始。

從您需要的結果的簡單語言定義開始。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

2

在測試之前選擇一種成功指標和一種失敗條件。

在測試之前選擇一種成功指標和一種失敗條件。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

3

使用代表性資料運行小型試點,而不是完善的演示集。

使用代表性資料運行小型試點,而不是完善的演示集。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

4

記錄正則化在哪些方面有幫助以及在哪些方面更簡單的方法更好。

記錄正則化在哪些方面有幫助以及在哪些方面更簡單的方法更好。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

不斷探索