الدليل الفني

الوكلاء المولدون والمجتمعات المحاكية

الوكلاء التوليديون هم شخصيات ذكاء اصطناعي مدعومة بنماذج لغوية تتذكر وتخطط وتتفاعل مثل الأشخاص المعقولين.

نظرة عامة

الوكلاء التوليديون هم شخصيات ذكاء اصطناعي مدعومة بنماذج لغوية تتذكر وتخطط وتتفاعل مثل الأشخاص المعقولين. وبوضعهم معًا في عالم محاكاة، يشكلون مجتمعات صغيرة حيث ينشأ السلوك الاجتماعي من تلقاء نفسه.

يعد الوكلاء التوليديون والمجتمعات المحاكية بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع.

الغوص العميق

في مشروع ستانفورد وGoogle لعام 2023 المسمى سمولفيل، وضع الباحثون 25 عميلًا يقودهم GPT-3.5 في بلدة رملية وشاهدوهم يتصرفون كمجتمع. كان لكل عميل سيرة ذاتية قصيرة واستيقظ، وأعد وجبة الإفطار، وذهب إلى العمل، وتحدث مع الجيران. والأهم من ذلك، أن السلوك لم يكن مكتوبًا. قرر أحد الوكلاء إقامة حفلة في عيد الحب، وعلى مدى يومين من محاكاة اليومين، انتشرت الدعوة شفهيًا، وقام الوكلاء بتنسيق الأوقات، وظهر العديد منهم معًا. تجمع البنية بين تدفق الذاكرة، والاسترجاع، والتفكير، والتخطيط، بحيث يتصرف الوكلاء بشكل متسق عبر فترات زمنية طويلة بدلاً من نسيان ما حدث قبل دقائق.

البصيرة الفنية

الحيلة الأساسية هي تدفق الذاكرة: سجل طويل ذو طابع زمني لكل شيء يلاحظه العميل. للقيام بذلك، يسترد الوكيل الذكريات ذات الصلة التي تم تسجيلها حسب الحداثة والأهمية والتشابه مع الوضع الحالي، ثم يقوم بإدخالها في موجه نموذج اللغة. تلخص خطوات التفكير الدورية الذكريات الأولية في رؤى عالية المستوى (على سبيل المثال، استنتاج أن شخصًا ما متحمسًا للبحث)، والتي يتم تخزينها مرة أخرى وتوجيه التخطيط والحوار المستقبلي.

إتقان الوكلاء المولدين والمجتمعات المحاكية

الوكلاء التوليديون هم شخصيات ذكاء اصطناعي مدعومة بنماذج لغوية تتذكر وتخطط وتتفاعل مثل الأشخاص المعقولين. وبوضعهم معًا في عالم محاكاة، يشكلون مجتمعات صغيرة حيث ينشأ السلوك الاجتماعي من تلقاء نفسه. يعد الوكلاء التوليديون والمجتمعات المحاكية بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع. لبناء فهم عميق، يجب التعامل مع الوكلاء التوليديين والمجتمعات المحاكية كنموذج تشغيلي، وليس كميزة واحدة: تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تعمل الفرق القوية التي تستخدم الوكلاء التوليديين والمجتمعات المحاكاة على تحسين خيارات البنية والبيانات والبنية التحتية مقابل الموثوقية والتكلفة. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي الوقت نفسه، يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل الوكلاء المولدين والمجتمعات المحاكية

توقع وجود وكلاء منتجين لتشغيل الشخصيات الأكثر ثراءً من غير اللاعبين في الألعاب، ومحاكاة التدريب للتفاوض أو الاستجابة للأزمات، ومجموعات الاختبار الاصطناعية لدراسة كيفية انتشار الشائعات أو الأسعار أو السياسات قبل طرحها في العالم الحقيقي. ومع انخفاض تكلفة النماذج واتساع نوافذ السياق، ستتراوح عمليات المحاكاة من عشرات إلى آلاف الوكلاء. ويقوم الباحثون أيضًا بفحصها باعتبارها مختبرات للعلوم الاجتماعية، في حين يثيرون أسئلة مفتوحة حول التحيز، والتلاعب، ومدى دقة هذه المجتمعات اللعبة في عكس البشر.

التنفيذ في العالم الحقيقي

محاكاة سمولفيل في جامعة ستانفورد حيث قام 25 عميلاً بتنظيم وحضور حفلة عيد الحب بشكل مستقل

شخصيات غير قابلة للعب (NPCs) موثوقة تعتمد على الذاكرة في ألعاب الفيديو وتتذكر تفاعلات اللاعبين السابقة وتحمل الضغائن أو الصداقات

مجموعات التركيز الاصطناعية التي تلعب دور شخصيات العملاء المتنوعة لاختبار الرسائل التسويقية أو ميزات المنتج مسبقًا

أجهزة محاكاة التدريب حيث يتفاعل سكان مدينة الذكاء الاصطناعي مع قرارات المتدرب أثناء الاستجابة للكوارث أو التدريبات الدبلوماسية

أنماط التنفيذ

الوكلاء المولدون والجمعيات المحاكية في الممارسة العملية

محاكاة سمولفيل في جامعة ستانفورد حيث قام 25 عميلاً بتنظيم وحضور حفلة عيد الحب بشكل مستقل.

محاكاة سمولفيل في جامعة ستانفورد، حيث قام 25 وكيلًا بتنظيم وحضور حفلة عيد الحب بشكل مستقل. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الوكلاء المولدون والجمعيات المحاكية في الممارسة العملية

شخصيات غير قابلة للعب (NPCs) موثوقة تعتمد على الذاكرة في ألعاب الفيديو وتتذكر تفاعلات اللاعبين السابقة وتحمل ضغينة أو صداقات.

شخصيات غير قابلة للعب (NPCs) موثوقة تعتمد على الذاكرة في ألعاب الفيديو وتتذكر تفاعلات اللاعبين السابقة وتحمل ضغينة أو صداقات. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الوكلاء المولدون والجمعيات المحاكية في الممارسة العملية

مجموعات التركيز الاصطناعية التي تلعب دور شخصيات العملاء المتنوعة لاختبار الرسائل التسويقية أو ميزات المنتج مسبقًا.

مجموعات التركيز الاصطناعية التي تلعب دور شخصيات متنوعة من العملاء لاختبار الرسائل التسويقية أو ميزات المنتج مسبقًا، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الوكلاء المولدون والجمعيات المحاكية في الممارسة العملية

أجهزة محاكاة التدريب حيث يتفاعل سكان مدينة الذكاء الاصطناعي مع قرارات المتدرب أثناء الاستجابة للكوارث أو التدريبات الدبلوماسية.

أجهزة محاكاة التدريب حيث يتفاعل سكان مدينة الذكاء الاصطناعي مع قرارات المتدرب أثناء الاستجابة للكوارث أو التدريبات الدبلوماسية. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع.

!

غالبًا ما يتم التقليل من تكاليف البنية التحتية والصيانة.

!

يمكن أن تنمو الفجوات الأمنية وقابلية المراقبة عندما تصبح الأنظمة أكثر تعقيدًا.

خارطة طريق التنفيذ

1

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ.

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

المعيار في ظل ظروف التحميل والبيانات الواقعية.

المعيار في ظل ظروف التحميل والبيانات الواقعية. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم.

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس.

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف