行業指南

皮膚科人工智慧

皮膚是人體最大、最明顯的器官,因此皮膚病學非常適合基於圖像的人工智慧。

概述

皮膚是人體最大、最明顯的器官,因此皮膚病學非常適合基於圖像的人工智慧。深度學習可以從照片中對皮膚病變(包括潛在致命的黑色素瘤)進行分類,其水平可與經過委員會認證的皮膚科醫生相媲美。

皮膚科中的人工智慧將人工智慧應用於特定領域的環境中,在這些環境中,法規、操作和風險承受能力強烈影響設計選擇。

深入探討

史丹佛大學研究人員在 2017 年《自然》雜誌上進行的一項關鍵研究使用大約 130,000 張臨床圖像訓練了一個卷積神經網絡,結果表明該網絡可以對皮膚癌(包括黑色素瘤和癌)進行分類,準確度可與 21 名經過委員會認證的皮膚科醫生一樣準確。從那時起,模型就內建在智慧型手機應用程式和皮膚鏡檢查工具中,用於分析皮膚科醫生用來檢查痣的放大的偏振圖像。我們的承諾是分診:幫助初級保健醫生和患者決定哪些部位需要緊急活檢,特別是在皮膚科醫生稀缺的地方。但皮膚科暴露了一個明顯的公平問題。大多數訓練資料集以淺色皮膚為主,因此模型通常在深色膚色上表現較差,其中黑色素瘤較為罕見,但如果錯過,則更致命。建立 Fitzpatrick 17k 和 Diverse Dermatology Images 等多樣化資料集現在是首要任務。

技術洞察

這些系統通常是 CNN 或視覺轉換器,在標記的臨床和皮膚鏡影像上進行訓練,通常根據活檢確認的診斷(黃金標準)進行驗證。皮膚鏡檢查增加了放大倍率和交叉偏振光,可顯示肉眼看不見的皮下色素和血管圖案。一個已知的陷阱:模型可以學習虛假的捷徑,例如將手術皮膚標記或尺子旁邊拍攝的病變標記為惡性,因為這些標記在訓練期間主要出現在癌症影像中。

掌握皮膚科人工智慧

皮膚是人體最大、最明顯的器官,因此皮膚病學非常適合基於圖像的人工智慧。深度學習可以從照片中對皮膚病變(包括潛在致命的黑色素瘤)進行分類,其水平可與經過委員會認證的皮膚科醫生相媲美。皮膚科中的人工智慧將人工智慧應用於特定領域的環境中,在這些環境中,法規、操作和風險承受能力強烈影響設計選擇。為了建立深入的理解,請將皮膚病學中的人工智慧視為一種操作模型,而不是單一功能:定義期望的結果,澄清假設,並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。

在實踐中,在皮膚科使用人工智慧的強大團隊將技術能力與領域政策、可審計性和第一線決策結合。他們記錄明確的成功標準,根據實際數據和工作流程進行測試,並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

產業背景決定了人工智慧創意能否與現實接觸。同時,監管要求可能會使原本強大的原型失效。最具彈性的方法是將實驗速度與治理規則結合:運行試點、捕獲證據、發布決策日誌,並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

產業背景決定了人工智慧創意能否與現實接觸。

產業背景決定了人工智慧創意能否與現實接觸。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

領域約束會影響可接受的錯誤率和監督模型。

領域約束會影響可接受的錯誤率和監督模型。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

成功的部署使技術能力與第一線工作流程保持一致。

成功的部署使技術能力與第一線工作流程保持一致。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

人工智慧在皮膚科的未來

受監管的分流應用程式和皮膚鏡檢查助理將成為常規的第一線工具,將專家級篩檢擴展到全科診所和服務不足的領域。透過不同的數據集縮小膚色性能差距是該領域的核心公平挑戰和積極的研究推動。具有人工智慧變化檢測功能的全身攝影將隨著時間的推移追蹤每一顆痣,而將影像與患者病史甚至遺傳風險相結合的多模態模型應該會讓真正需要活檢的人更加清晰。

現實世界的實施

2017 年史丹佛大學 CNN 從約 13 萬張圖像中對皮膚癌進行了分類,與 21 位經過委員會認證的皮膚科醫生的結果相當,這是該領域的基礎性結果。

智慧型手機和皮膚鏡應用程式可以對可疑的痣進行分類,幫助患者和初級保健醫生決定哪些部位需要緊急專家檢查。

全身攝影系統使用人工智慧來比較一段時間內的影像,並標記高風險患者中新的或變化的病變。

正在建立 Fitzpatrick 17k 和 Diverse Dermatology Images 等多樣化資料集,以減少人工智慧對深色膚色的準確度較差的情況。

實施模式

人工智慧在皮膚科的實踐

2017 年史丹佛大學 CNN 從約 13 萬張圖像中對皮膚癌進行了分類,與 21 位經過委員會認證的皮膚科醫生的結果相當,這是該領域的基礎性結果。

2017 年史丹佛大學 CNN 對約 13 萬張圖像中的皮膚癌進行了分類,與 21 位經過委員會認證的皮膚科醫生的水平相當,這是該領域的基礎結果。當團隊預先定義品質閾值、為邊緣情況保留人性化的升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

人工智慧在皮膚科的實踐

智慧型手機和皮膚鏡應用程式可以對可疑的痣進行分類,幫助患者和初級保健醫生決定哪些部位需要緊急專家檢查。

智慧型手機和皮膚鏡應用程式對可疑的痣進行分類,幫助患者和初級保健醫生決定需要緊急專家審查的內容。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會得到更好的結果。

人工智慧在皮膚科的實踐

全身攝影系統使用人工智慧來比較一段時間內的影像,並標記高風險患者中新的或變化的病變。

全身攝影系統使用人工智慧來比較一段時間內的影像,並標記高風險患者中新的或變化的病變。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤隨著時間的推移提高的生產力和錯誤成本時,通常會得到更好的結果。

人工智慧在皮膚科的實踐

正在建立 Fitzpatrick 17k 和 Diverse Dermatology Images 等多樣化資料集,以減少人工智慧對深色膚色的準確度較差的情況。

正在建立 Fitzpatrick 17k 和 Diverse Dermatology Images 等多樣化資料集,以減少深色膚色上較差的 AI 準確性。當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

風險與防護欄

!

監理要求可能會使原本強大的原型失效。

!

歷史資料可能會編碼損害特定社區的偏見。

!

遺留系統可能會造成整合瓶頸和隱性成本。

實施路線圖

1

讓領域專家參與從問題框架到評估的整個過程。

讓領域專家參與從問題框架到評估的整個過程。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

2

在啟動前設計審計追蹤和文件。

在啟動前設計審計追蹤和文件。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

3

儘早驗證合規性和安全義務。

儘早驗證合規性和安全義務。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

4

分階段推出,並有明確的停止和回滾標準。

分階段推出,並有明確的停止和回滾標準。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

不斷探索