دليل وكلاء Human-in-the-Loop

نظرة عامة

وكلاء Human-in-the-loop (HITL) عبارة عن أنظمة ذكاء اصطناعي تتوقف مؤقتًا للحصول على موافقة الشخص أو تصحيحه أو إدخاله قبل اتخاذ الإجراءات اللاحقة. إنهم يبقون الإنسان مسؤولاً عن القرارات عالية المخاطر بينما يسمحون للأتمتة بالقيام بالمهمة الثقيلة.

يركز Human-in-the-Loop Agents على النشر العملي: تحويل قدرة النموذج إلى سير عمل يومي موثوق به يقدم قيمة قابلة للقياس.

الغوص العميق

الوكيل المستقل تمامًا يقرر ويتصرف من تلقاء نفسه؛ يقوم وكيل الإنسان في الحلقة بإدخال نقطة تفتيش حيث يقوم الشخص بمراجعة الإجراء المقترح للوكيل قبل تنفيذه. تشمل الأنماط الشائعة بوابات الموافقة (يقوم الوكيل بصياغة بريد إلكتروني أو استرداد أموال وينتظر نقرة للإرسال)، والتصعيد القائم على الثقة (إنه يقاطع الإنسان فقط عندما ينخفض يقينه إلى ما دون الحد الأدنى)، والتعلم النشط (يتم توجيه الحالات غير المؤكدة إلى الأشخاص، الذين تصبح إجاباتهم بيانات تدريب مستقبلية). الهدف هو الجمع بين سرعة وحجم الأتمتة مع الحكم البشري، والمساءلة، والقدرة على اكتشاف الأخطاء قبل أن تسبب الضرر. بالنسبة إلى منظمة غير ربحية، قد يعني هذا وكيلًا يقوم بصياغة استجابات المنح ولكنه لا يرسل أبدًا وكيلًا غير تابع مع تسجيل خروج الموظفين.

البصيرة الفنية

من الناحية الفنية، يتم تنفيذ HITL كمقاطعة أو بوابة استدعاء أداة في حلقة التحكم الخاصة بالوكيل. عندما يقترح الوكيل إجراءً حساسًا، يقوم المنسق بتعليق التنفيذ، وإجراء تسلسل لحالة الوكيل، وإرسال طلب للمراجعة البشرية. يوافق الشخص أو يعدل أو يرفض؛ يتم تغذية هذه الاستجابة كسياق وتستأنف الحلقة. تحدد درجات الثقة أو تقديرات عدم اليقين أو قواعد السياسة الإجراءات التي تؤدي إلى الإيقاف المؤقت مقابل التشغيل تلقائيًا.

إتقان وكلاء الإنسان في الحلقة

لبناء فهم عميق، تعامل مع الوكلاء البشريين كنموذج تشغيل، وليس كميزة واحدة. تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تركز الفرق القوية التي تستخدم وكلاء Human-in-the-Loop على نتائج سير العمل، وليس العروض التوضيحية النموذجية، وتحدد نقاط التفتيش البشرية مبكرًا. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي الوقت نفسه، يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل وكلاء الإنسان في الحلقة

توقع تحكمًا أكثر دقة من الموافقة/الرفض الثنائي. سوف يطرح الوكلاء بشكل متزايد أسئلة توضيحية، ويقدمون العديد من الخيارات مع المقايضات، ويتعلمون مدى تحمل كل مستخدم للمخاطر بحيث يقل انقطاعهم بمرور الوقت. وتدفع اللوائح التنظيمية مثل قانون الاتحاد الأوروبي للذكاء الاصطناعي إلى الإشراف البشري على الاستخدامات عالية المخاطر، لذا أصبحت نقاط تفتيش HITL من متطلبات الامتثال، وليس مجرد اختيار تصميم. إن أدوات الموافقات غير المتزامنة، ومسارات التدقيق، وحالة وكيل "الإيقاف المؤقت والاستئناف" تنضج بسرعة.

التنفيذ في العالم الحقيقي

يقوم وكيل دعم العملاء بصياغة موافقات استرداد الأموال ولكنه يقوم بتوجيه أي استرداد يزيد عن 500 دولار إلى مدير بشري لتسجيل الخروج بنقرة واحدة.

يشير الذكاء الاصطناعي للترميز الطبي إلى تشخيصات غامضة ليقوم المبرمج المعتمد بتأكيدها بدلاً من التخمين.

يقوم نظام الإشراف على المحتوى بإزالة الرسائل غير المرغوب فيها بشكل تلقائي ولكنه يؤدي إلى تصعيد المشاركات الحدودية إلى المراجعين البشريين.

يقترح وكيل الترميز ترحيل قاعدة البيانات وينتظر موافقة المطور قبل تشغيله في الإنتاج.

أنماط التنفيذ

وكلاء الإنسان في الحلقة في الممارسة العملية

يقوم وكيل دعم العملاء بصياغة موافقات استرداد الأموال ولكنه يقوم بتوجيه أي استرداد يزيد عن 500 دولار إلى مدير بشري لتسجيل الخروج بنقرة واحدة.

عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

وكلاء الإنسان في الحلقة في الممارسة العملية

يشير الذكاء الاصطناعي للترميز الطبي إلى تشخيصات غامضة ليقوم المبرمج المعتمد بتأكيدها بدلاً من التخمين.

عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

وكلاء الإنسان في الحلقة في الممارسة العملية

يقوم نظام الإشراف على المحتوى بإزالة الرسائل غير المرغوب فيها بشكل تلقائي ولكنه يؤدي إلى تصعيد المشاركات الحدودية إلى المراجعين البشريين.

عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

وكلاء الإنسان في الحلقة في الممارسة العملية

يقترح وكيل الترميز ترحيل قاعدة البيانات وينتظر موافقة المطور قبل تشغيله في الإنتاج.

عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة.

!

قد تقوم الفرق بالإفراط في أتمتة وإزالة الحكم البشري المطلوب.

!

يمكن أن تنحرف الجودة إذا لم يتم تقييم المخرجات بشكل مستمر.

خارطة طريق التنفيذ

1

قم بتخطيط سير العمل الحالي وحدد خطوة الاحتكاك الأعلى.

تعامل مع هذا كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف الطرح مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

تحديد نقاط التفتيش البشرية قبل الأتمتة الكاملة.

تعامل مع هذا كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف الطرح مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

تدريب المستخدمين على المطالبات ومسارات التصعيد ومعايير الجودة.

تعامل مع هذا كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف الطرح مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

تتبع النتائج على مستوى المهمة لتأكيد القيمة المستدامة.

تعامل مع هذا كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف الطرح مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف

مساعدو الذكاء الاصطناعي

تصميم سير عمل مساعد يظل مفيدًا وجديرًا بالثقة.

قراءة الدليل

ترميز الذكاء الاصطناعي

تعرف على كيفية تحسين الذكاء الاصطناعي المطبق لتقديم البرامج.

قراءة الدليل

وكلاء الإنسان في الحلقة

نظرة عامة

الغوص العميق

البصيرة الفنية

إتقان وكلاء الإنسان في الحلقة

التأثير الاستراتيجي

مستقبل وكلاء الإنسان في الحلقة

التنفيذ في العالم الحقيقي

أنماط التنفيذ

وكلاء الإنسان في الحلقة في الممارسة العملية

وكلاء الإنسان في الحلقة في الممارسة العملية

وكلاء الإنسان في الحلقة في الممارسة العملية

وكلاء الإنسان في الحلقة في الممارسة العملية

المخاطر والدرابزين

خارطة طريق التنفيذ

استمر في الاستكشاف

مساعدو الذكاء الاصطناعي

ترميز الذكاء الاصطناعي

Related guides