概述
推薦系統是人工智慧悄悄地選擇你接下來觀看、購買和滾動的內容。他們為 Netflix、亞馬遜、YouTube 和 Spotify 等公司帶來了巨大的參與和收入。
推薦系統中的人工智慧專注於實際部署:將模型功能轉化為可靠的日常工作流程,提供可衡量的價值。
深入探討
推薦器的工作是從龐大的目錄中預測使用者想要什麼。兩種經典方法是協作過濾,它可以跨用戶查找模式(「像您這樣的人也喜歡這個」),以及基於內容的過濾,它將專案功能與您過去的偏好相匹配。現代系統將這些結合起來並添加了深度學習:神經網路學習使用者和物品的密集嵌入,因此相似的品味在向量空間中彼此靠近。 Netflix 以其 100 萬美元的獎金普及了該領域,如今這些系統為 YouTube 的提要、亞馬遜的產品建議、Spotify 的 Discover Weekly 和 TikTok 的 For You 頁面提供支援。它們也是一個令人擔憂的問題,因為純粹為了參與而進行優化可能會產生過濾氣泡並放大令人上癮或兩極分化的內容。
技術洞察
矩陣分解是一個突破:將稀疏的使用者-項目評分矩陣表示為兩個較小的潛在因子矩陣的乘積,因此每個使用者和項目都成為一個短向量。使用者和項目向量的點積可預測評級。深度模型透過神經協同過濾和兩塔架構擴展了這一點,可以快速檢索候選者,然後排名模型對它們進行評分。冷啟動,推薦全新的用戶或商品,仍然是頑固的挑戰。
掌握推薦系統中的人工智慧
推薦系統是人工智慧悄悄地選擇你接下來觀看、購買和滾動的內容。他們為 Netflix、亞馬遜、YouTube 和 Spotify 等公司帶來了巨大的參與和收入。推薦系統中的人工智慧專注於實際部署:將模型功能轉化為可靠的日常工作流程,提供可衡量的價值。為了建立深入的理解,請將推薦系統中的人工智慧視為一種操作模型,而不是單一功能:定義期望的結果,澄清假設,並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。
在實踐中,在推薦系統中使用人工智慧的強大團隊專注於工作流程結果,而不是模型演示,並儘早定義人工檢查點。他們記錄明確的成功標準,根據實際數據和工作流程進行測試,並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。
應用級設計決定了人工智慧是否能改善實際結果。同時,將損壞的流程自動化可能會加劇現有的問題。最具彈性的方法是將實驗速度與治理規則結合:運行試點、捕獲證據、發布決策日誌,並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。
戰略影響
應用級設計決定了人工智慧是否能改善實際結果。
應用級設計決定了人工智慧是否能改善實際結果。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
良好的工作流程整合可以創造使用者值得信賴的生產力效益。
良好的工作流程整合可以創造使用者值得信賴的生產力效益。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
範圍明確的用例可以減少變更疲勞和實施風險。
範圍明確的用例可以減少變更疲勞和實施風險。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。
現實世界的實施
Netflix 推薦節目,甚至根據您的觀看歷史記錄自訂縮圖
Spotify 的 Discover Weekly 透過對具有相似品味的聽眾進行協作過濾來建立個人化播放列表
亞馬遜的「購買此產品的客戶也購買了」和主頁產品推薦推動了很大一部分銷售
TikTok 的 For You 頁面可透過觀看時間、重播和跳過來快速了解偏好,從而對短影片進行排名
實施模式
推薦系統中的人工智慧實踐
Netflix 推薦節目,甚至根據您的觀看歷史記錄自訂縮圖。
Netflix 根據您的觀看歷史記錄推薦節目,甚至客製化縮圖。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。
推薦系統中的人工智慧實踐
Spotify 的 Discover Weekly 透過對具有相似品味的聽眾進行協作過濾來建立個人化播放清單。
Spotify 的 Discover Weekly 透過在具有相似品味的聽眾之間進行協作過濾來建立個人化播放清單。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。
推薦系統中的人工智慧實踐
亞馬遜的「購買此產品的客戶也購買了」和主頁產品推薦推動了很大一部分銷售。
亞馬遜的「購買此產品的客戶也購買了」和主頁產品推薦推動了很大一部分銷售團隊在預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移跟踪生產力增益和錯誤成本時通常會獲得更好的結果。
推薦系統中的人工智慧實踐
TikTok 的 For You 頁面可透過觀看時間、重播和跳過來快速了解偏好,從而對短影片進行排名。
TikTok 的 For You 頁面可透過觀看時間、重播和跳過短影片來快速學習偏好。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。
風險與防護欄
將損壞的流程自動化可能會加劇現有問題。
團隊可能會過度自動化並消除所需的人工判斷。
如果不持續評估輸出,品質可能會出現偏差。
實施路線圖
繪製目前工作流程並確定摩擦最大的步驟。
繪製目前工作流程並確定摩擦最大的步驟。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
在完全自動化之前定義人工檢查點。
在完全自動化之前定義人工檢查點。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
對使用者進行提示、升級路徑和品質標準的訓練。
對使用者進行提示、升級路徑和品質標準的訓練。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。
追蹤任務級結果以確認持續價值。
追蹤任務級結果以確認持續價值。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。