應用指南

人在環代理

人機互動 (HITL) 代理是一種人工智慧系統，它會在採取相應行動之前暫停以獲取人們的批准、糾正或輸入。

概述

人機互動 (HITL) 代理是一種人工智慧系統，它會在採取相應行動之前暫停以獲取人們的批准、糾正或輸入。他們讓人類對高風險的決策負責，同時仍讓自動化完成繁重的工作。

人在環代理專注於實際部署：將模型功能轉化為可靠的日常工作流程，提供可衡量的價值。

深入探討

完全自主的代理人自行決定並採取行動；人機循環代理會插入一個檢查點，人員會在代理執行建議的操作之前對其進行檢查。常見的模式包括批准門（代理商起草電子郵件或退款並等待點擊發送）、基於置信度的升級（只有當確定性低於閾值時才會打斷人員）和主動學習（不確定的案例被發送給人們，他們的答案將成為未來的訓練數據）。目標是將自動化的速度和規模與人類的判斷、責任以及在錯誤造成損害之前發現錯誤的能力結合起來。對於非營利組織來說，這可能意味著代理起草撥款回复，但絕不會發送與工作人員簽署無關的回复。

技術洞察

從技術上講，HITL 被實作為代理控制循環中的中斷或工具呼叫閘。當代理提出敏感操作時，協調器會暫停執行，序列化代理的狀態，並發出人工審核請求。一個人批准、編輯或拒絕；該回應作為上下文回饋，然後循環繼續。置信度分數、不確定性估計或策略規則決定哪些操作觸發暫停或自動運行。

掌握人在環代理

為了建立深入的理解，請將人在環代理視為一種操作模型，而不是單一功能。定義期望的結果，澄清假設，並將系統可以可靠地完成的任務與仍需要專家判斷的任務分開。

在實踐中，使用人在環代理的強大團隊專注於工作流程結果，而不是模型演示，並儘早定義人工檢查點。他們記錄明確的成功標準，根據實際數據和工作流程進行測試，並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

應用級設計決定了人工智慧是否能改善實際結果。同時，將損壞的流程自動化可能會加劇現有的問題。最具彈性的方法是將實驗速度與治理規則結合：運行試點、捕獲證據、發布決策日誌，並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

應用級設計決定了人工智慧是否能改善實際結果。

應用級設計決定了人工智慧是否能改善實際結果。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

良好的工作流程整合可以創造使用者值得信賴的生產力效益。

良好的工作流程整合可以創造使用者值得信賴的生產力效益。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

範圍明確的用例可以減少變更疲勞和實施風險。

範圍明確的用例可以減少變更疲勞和實施風險。在高品質部署中，這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式，以便團隊可以增強信心，而不是擴大模糊性。

人在環代理的未來

期望比二元批准/拒絕更細緻的控制。客服人員將越來越多地提出澄清問題，提出幾種需要權衡的選項，並了解每個用戶的風險承受能力，以便隨著時間的推移減少干擾。歐盟人工智慧法案等法規推動了對高風險用途的人工監督，因此 HITL 檢查點正在成為合規性要求，而不僅僅是設計選擇。用於非同步批准、審計追蹤和「暫停和恢復」代理狀態的工具正在快速成熟。

現實世界的實施

客戶支援代理起草退款批准書，但將任何超過 500 美元的退款轉交給人工經理進行一鍵式簽署。

醫療編碼人工智慧會標記不明確的診斷，供經過認證的編碼員確認而不是猜測。

內容審核系統會自動刪除明顯的垃圾郵件，但會將邊界貼文升級給人工審核員。

編碼代理提出資料庫遷移並等待開發人員批准，然後再在生產中運行。

實施模式

人在環代理的實踐

客戶支援代理起草退款批准書，但將任何超過 500 美元的退款轉交給人工經理進行一鍵式簽署。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

人在環代理的實踐

醫療編碼人工智慧會標記不明確的診斷，供經過認證的編碼員確認而不是猜測。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

人在環代理的實踐

內容審核系統會自動刪除明顯的垃圾郵件，但會將邊界貼文升級給人工審核員。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

人在環代理的實踐

編碼代理提出資料庫遷移並等待開發人員批准，然後再在生產中運行。

當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時，通常會獲得更好的結果。

風險與防護欄

將損壞的流程自動化可能會加劇現有問題。

團隊可能會過度自動化並消除所需的人工判斷。

如果不持續評估輸出，品質可能會出現偏差。

實施路線圖

繪製目前工作流程並確定摩擦最大的步驟。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

在完全自動化之前定義人工檢查點。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

對使用者進行提示、升級路徑和品質標準的訓練。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

追蹤任務級結果以確認持續價值。

將此視為證據門：如果不符合標準，則暫停推出，縮小差距，然後再擴大使用。

不斷探索

人工智慧助手

設計助理工作流程保持有用且值得信賴。

閱讀指南

人工智慧編碼

了解應用人工智慧如何改善軟體交付。

閱讀指南

Check your understanding

Test yourself: take the Human-in-the-Loop Agents quiz

Start quiz →

人在環代理

概述

深入探討

技術洞察

掌握人在環代理

戰略影響

人在環代理的未來

現實世界的實施

實施模式

人在環代理的實踐

人在環代理的實踐

人在環代理的實踐

人在環代理的實踐

風險與防護欄

實施路線圖

不斷探索

人工智慧助手

人工智慧編碼

Related guides