基礎知識指南

變分自動編碼器

變分自編碼器 (VAE) 是一種生成神經網絡，它學習將資料壓縮到平滑的機率潛在空間，然後從中重建或產生新的範例。

概述

變分自編碼器 (VAE) 是一種生成神經網絡，它學習將資料壓縮到平滑的機率潛在空間，然後從中重建或產生新的範例。它們很重要，因為它們為深度學習提供了第一個有原則的、可採樣的資料模型之一——為影像生成、異常檢測和現代擴散模型內的潛在空間提供動力。

變分自動編碼器位於核心人工智慧工具包。當你理解它時，其他人工智慧主題就變得更容易評估和比較。

深入探討

VAE 有兩個部分：編碼器將輸入（例如圖像）映射到機率分佈（通常是具有學習均值和方差的高斯分佈），而不是將輸入（例如圖像）映射到單點；解碼器從從該分佈採樣的點重建輸入。訓練優化了證據下界（ELBO），它平衡了兩個壓力：重建精度（輸出應該類似於輸入）和 KL 散度正則化器，它將每個輸入的潛在分佈拉向標準正態。這種正則化是關鍵技巧：它迫使潛在空間連續且密集，以便解碼附近的隨機點產生合理的新樣本，而不是無意義的。這種平滑性正是 VAE 與一般自動編碼器的差異。

技術洞察

巧妙的工程是重新參數化技巧。您無法透過隨機採樣步驟進行反向傳播，因此 VAE 不是直接從 N(mu, sigma squared) 採樣 z，而是計算 z = mu + sigma * epsilon，其中 epsilon 是從固定標準法線中提取的。隨機性現在存在於 epsilon 中，epsilon 是輸入而不是參數，因此梯度可以乾淨地流過 mu 和 sigma，並且可以使用普通的隨機梯度下降來訓練編碼器。

掌握變分自動編碼器

為了加深理解，請將變分自動編碼器視為一種操作模型，而不是單一功能。定義期望的結果，澄清假設，並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。

在實踐中，使用變分自動編碼器的強大團隊首先建立強大的概念模型，然後將這些模型對應到實際的生產限制。他們記錄明確的成功標準，根據實際數據和工作流程進行測試，並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

它可以幫助您將清晰的技術聲明與行銷語言分開。同時，不同的團隊可能會以不同的方式使用相同術語，因此請儘早定義範圍。最具彈性的方法是將實驗速度與治理規則結合：運行試點、捕獲證據、發布決策日誌，並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

它可以幫助您將清晰的技術聲明與行銷語言分開。

它可以幫助您將清晰的技術聲明與行銷語言分開。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

在花費金錢或時間之前，您可以提出更好的實施問題。

在花費金錢或時間之前，您可以提出更好的實施問題。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。

具有共同理解的團隊可以做出更好的產品、政策和學習決策。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

變分自動編碼器的未來

純 VAE 很少能產生最清晰的影像，但它們的影響無所不在。穩定擴散等潛在擴散模型在 VAE 壓縮的潛在空間內運行擴散，從而大幅削減計算量。具有離散碼本的 VQ-VAE 支援許多饋入變壓器的音訊和影像標記器。期望 VAE 繼續作為大型生成系統下的高效、結構化壓縮層，並繼續在分子和蛋白質設計等科學領域中使用，在這些領域，平滑、可插值的潛在空間真正有用。

現實世界的實施

穩定擴散使用 VAE 將影像壓縮到實際發生擴散去噪的緊湊潛在空間中，然後解碼回像素。

透過標記 VAE 重建的輸入來偵測製造缺陷或詐欺交易，因為異常情況超出了習得的常態分佈。

透過在藥物研究中的化學潛在空間中平穩行走來產生和插入新型藥物分子。

透過學習健康解剖結構的低維表示，對 MRI 掃描等醫學影像進行壓縮和去噪。

實施模式

變分自動編碼器的實踐

穩定擴散使用 VAE 將影像壓縮到實際發生擴散去噪的緊湊潛在空間中，然後解碼回像素。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

變分自動編碼器的實踐

透過標記 VAE 重建的輸入來偵測製造缺陷或詐欺交易，因為異常情況超出了習得的常態分佈。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

變分自動編碼器的實踐

透過在藥物研究中的化學潛在空間中平穩行走來產生和插入新型藥物分子。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

變分自動編碼器的實踐

透過學習健康解剖結構的低維表示，對 MRI 掃描等醫學影像進行壓縮和去噪。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

風險與防護欄

不同的團隊可能會以不同的方式使用相同術語，因此請儘早定義範圍。

基準測試可能看起來很強大，但實際效能卻參差不齊。

忽視數據品質和評估計劃通常會產生脆弱的結果。

實施路線圖

從您需要的結果的簡單語言定義開始。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

在測試之前選擇一種成功指標和一種失敗條件。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

使用代表性資料運行小型試點，而不是完善的演示集。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

記錄變分自動編碼器在哪些方面有幫助以及在哪些方面更簡單的方法更好。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

不斷探索

什麼是人工智慧？

在深入研究之前先了解基本概念。

閱讀指南

人工智慧如何學習

了解現代系統背後的訓練過程。

閱讀指南

Check your understanding

Test yourself: take the Variational Autoencoders quiz

Start quiz →

變分自動編碼器

概述

深入探討

技術洞察

掌握變分自動編碼器

戰略影響

變分自動編碼器的未來

現實世界的實施

實施模式

變分自動編碼器的實踐

變分自動編碼器的實踐

變分自動編碼器的實踐

變分自動編碼器的實踐

風險與防護欄

實施路線圖

不斷探索

什麼是人工智慧？

人工智慧如何學習

Related guides