社團指南

NIST 人工智慧風險管理框架

NIST 人工智慧風險管理框架 (AI RMF) 是美國政府自願制定的手冊，旨在透過識別和管理整個生命週期的風險來建立值得信賴的人工智慧。

概述

NIST 人工智慧風險管理框架 (AI RMF) 是美國政府自願制定的手冊，旨在透過識別和管理整個生命週期的風險來建立值得信賴的人工智慧。這很重要，因為它為組織提供了一個實用、靈活的結構來實施負責任的人工智慧，而無需成為具有約束力的法律。

NIST 人工智慧風險管理框架位於能力、權力和公共選擇的交叉點——安全、治理和合法性決定先進人工智慧是否大規模有益或有害。

深入探討

AI RMF 1.0 由美國國家標準與技術研究所於 2023 年 1 月發布，是自願的且與產業無關。它圍繞著四個核心職能進行組織：治理（建立人工智慧風險文化和政策）、繪製（了解背景並識別風險）、測量（使用指標分析和追蹤風險）和管理（確定風險的優先順序並針對這些風險採取行動）。該框架定義了值得信賴的人工智慧的特徵：有效和可靠、安全、可靠和有彈性、負責和透明、可解釋和解釋、隱私增強、公平且有害偏見得到管理。 NIST 還發布了一本包含具體建議行動的配套手冊，並於 2024 年添加了生成式 AI 配置文件，以解決大型語言模型特有的風險，例如虛構、資料外洩和有害內容。

技術洞察

與清單不同，RMF 將可信度視為一組需要平衡的權衡，因為改進一個屬性（例如，準確性）可能會降低另一個屬性（例如，隱私或公平性）。治理職能是跨領域的，並為其他三個職能提供支援。 Measure 強調使用定量指標和定性方法，包括紅隊和人工評估，因為許多人工智慧危害無法純數位捕捉。框架指定的是結果，而不是具體工具。

掌握 NIST AI 風險管理框架

為了加深理解，請將 NIST AI 風險管理框架視為一種操作模型，而不是單一功能。定義期望的結果，澄清假設，並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。

在實踐中，使用 NIST 人工智慧風險管理框架的強大團隊將能力成長與治理、安全和明確的問責結構結合。他們記錄明確的成功標準，根據實際數據和工作流程進行測試，並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

災難性和日常的人工智慧危害都取決於誰了解風險以及誰能夠採取行動。同時，在能力複合的同時，將存在風險視為科幻小說。最具彈性的方法是將實驗速度與治理規則結合：運行試點、捕獲證據、發布決策日誌，並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

災難性和日常的人工智慧危害都取決於誰了解風險以及誰能夠採取行動。

災難性和日常的人工智慧危害都取決於誰了解風險以及誰能夠採取行動。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

民眾和專業素養決定強而有力的安全政策在政治上是否可行。

民眾和專業素養決定強而有力的安全政策在政治上是否可行。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

清晰的解釋可以減少炒作、實驗室公關和模糊道德劇場的影響。

清晰的解釋可以減少炒作、實驗室公關和模糊道德劇場的影響。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

NIST 人工智慧風險管理框架的未來

預計 RMF 將成為通用參考基線，映射到歐盟人工智慧法案和新興美國州法律等具有約束力的製度，從而簡化多司法管轄區的合規性。 NIST 繼續發布針對特定環境和技術的配置文件，其中生成式人工智慧是主要關注點。聯邦採購和機構指南越來越多地指向 RMF，而 ISO/IEC 42001 等標準的交叉路口也在不斷增加，使其成為全球人工智慧治理的結締組織，儘管它仍然是自願的。

現實世界的實施

一家科技公司繪製了新招聘人工智慧的背景圖，在發布任何程式碼之前列出了受影響的群體和潛在危害，從而實現了地圖功能。

一家銀行設立了人工智慧治理委員會並制定了風險政策，以滿足其所有模型的治理職能。

團隊使用紅隊和偏差指標來量化測量功能下聊天機器人的故障模式。

一家健康保險公司遵循生成式 AI 配置文件來解決面向客戶的法學碩士中的混淆和資料外洩風險。

實施模式

NIST 人工智慧風險管理框架的實踐

一家科技公司繪製了新招聘人工智慧的背景圖，在發布任何程式碼之前列出了受影響的群體和潛在危害，從而實現了地圖功能。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

NIST 人工智慧風險管理框架的實踐

一家銀行設立了人工智慧治理委員會並制定了風險政策，以滿足其所有模型的治理職能。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

NIST 人工智慧風險管理框架的實踐

團隊使用紅隊和偏差指標來量化測量功能下聊天機器人的故障模式。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

NIST 人工智慧風險管理框架的實踐

一家健康保險公司遵循生成式 AI 配置文件來解決面向客戶的法學碩士中的混淆和資料外洩風險。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

風險與防護欄

將存在風險視為科幻小說，同時能力複合。

混淆了表面產品安全與高度自治下的對準。

只給非英語和非專業觀眾留下低品質的資源。

實施路線圖

單獨的產品危害、誤用和失控/失調風險。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

詢問哪些證據會改變您對時間表和嚴重性的看法。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

比起行銷主張，更喜歡主要來源和具體評估。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

確定一條行動路徑：職業、政策、資金或技能——而不僅僅是意識。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

Check your understanding

Test yourself: take the NIST AI Risk Management Framework quiz

Start quiz →

NIST 人工智慧風險管理框架

概述

深入探討

技術洞察

掌握 NIST AI 風險管理框架

戰略影響

NIST 人工智慧風險管理框架的未來

現實世界的實施

實施模式

NIST 人工智慧風險管理框架的實踐

NIST 人工智慧風險管理框架的實踐

NIST 人工智慧風險管理框架的實踐

NIST 人工智慧風險管理框架的實踐

風險與防護欄

實施路線圖

不斷探索

人工智慧安全

人工智慧對齊

通用人工智慧

人工智慧治理

Related guides