الدليل الفني

صانع الأدوات واستخدام الأدوات التي يتم تدريسها ذاتيًا

Toolformer هي طريقة Meta للذكاء الاصطناعي لعام 2023 تتيح لنموذج اللغة تعليم نفسه متى وكيف يتم استدعاء الأدوات الخارجية مثل الآلات الحاسبة ومحركات البحث والمترجمين.

نظرة عامة

Toolformer هي طريقة Meta للذكاء الاصطناعي لعام 2023 تتيح لنموذج اللغة تعليم نفسه متى وكيف يتم استدعاء الأدوات الخارجية مثل الآلات الحاسبة ومحركات البحث والمترجمين. فبدلاً من تصنيف البشر لاستدعاءات الأداة، يقوم النموذج بإنشاء وتصفية أمثلة التدريب الخاصة به، ثم يقوم بضبط تلك التي تساعد بالفعل.

يعتبر Toolformer وSelf-Taughted Tool Use بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع.

الغوص العميق

Toolformer، من شيك وآخرون. في Meta AI، يعالج مفارقة: النماذج الكبيرة رائعة في اللغة ولكنها سيئة في الحساب، والحقائق الجديدة، وعمليات البحث الدقيقة. حلقة التدريب تخضع للإشراف الذاتي. يتم إعطاء النموذج مجموعة من الأمثلة المكتوبة بواسطة الإنسان والتي تعرض بنية استدعاء واجهة برمجة التطبيقات (API)، ثم تتم مطالبته بإدراج استدعاءات مرشحة (ملفوفة برموز خاصة) في العديد من المواضع عبر مجموعة نصية كبيرة. يتم تنفيذ كل استدعاء مرشح فعليًا، ويتم دمج النتيجة. تحافظ خطوة التصفية الرئيسية على استدعاء الأداة فقط إذا كان الحصول على نتيجة واجهة برمجة التطبيقات (API) يقلل من حيرة النموذج بشأن النص الحقيقي القادم أكثر من عدم الاتصال، أو الاتصال بشكل مختلف. يتم بعد ذلك ضبط النموذج على مجموعة البيانات المفلترة والمولدة ذاتيًا، وتعلم كيفية استدعاء خمس أدوات: آلة حاسبة، ونظام ضمان الجودة، ومحرك بحث، ومترجم، وتقويم.

البصيرة الفنية

الفكرة الحاسمة هي هدف التصفية الخاضع للإشراف الذاتي. بالنسبة لكل منصب مرشح، يقوم Toolformer بمقارنة فقدان التنبؤ بالرموز المميزة التالية مع نتيجة واجهة برمجة التطبيقات (API) المُدرجة مقابل عدم وجودها. يتم الاحتفاظ بالمكالمات التي تقلل الخسارة بما يزيد عن الحد الأدنى؛ يتم تجاهل المكالمات غير المفيدة أو المزعجة. وهذا يعني عدم الحاجة إلى أي تعليق توضيحي بشري للاستخدام "الصحيح" للأداة، ويقرر النموذج نفسه أي الاستدعاءات كانت مفيدة حقًا، ويتعلم الموضع والحجج معًا.

إتقان صانع الأدوات واستخدام الأدوات التي يتم تدريسها ذاتيًا

Toolformer هي طريقة Meta للذكاء الاصطناعي لعام 2023 تتيح لنموذج اللغة تعليم نفسه متى وكيف يتم استدعاء الأدوات الخارجية مثل الآلات الحاسبة ومحركات البحث والمترجمين. فبدلاً من تصنيف البشر لاستدعاءات الأداة، يقوم النموذج بإنشاء وتصفية أمثلة التدريب الخاصة به، ثم يقوم بضبط تلك التي تساعد بالفعل. يعتبر Toolformer وSelf-Taughted Tool Use بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع. لبناء فهم عميق، تعامل مع Toolformer وSelf-Teaching Tool Use كنموذج تشغيل، وليس كميزة واحدة: حدد النتائج المرغوبة، ووضح الافتراضات، وافصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تعمل الفرق القوية التي تستخدم Toolformer وSelf-Taught Tool Use على تحسين خيارات البنية والبيانات والبنية التحتية مقابل الموثوقية والتكلفة. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي الوقت نفسه، يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل استخدام الأدوات والأدوات التي يتم تدريسها ذاتيًا

قام Toolformer بزرع وكلاء استخدام الأدوات واستدعاء الوظائف اليوم. وتنتقل الحدود من مجموعة ثابتة من الأدوات إلى العشرات أو المئات التي يتم اكتشافها في وقت التشغيل، مع نماذج تفكر في الأداة التي يجب استدعاؤها، وتسلسل الاستدعاءات، والتعامل مع حالات الفشل. توقع تكاملًا أكثر إحكامًا مع التعلم المعزز وحلقات الوكيل، بالإضافة إلى التعلم الفوري لواجهات برمجة التطبيقات الجديدة، بحيث يصبح استخدام الأدوات المدروسة ذاتيًا قدرة قياسية بدلاً من ضبط دقيق متخصص.

التنفيذ في العالم الحقيقي

استدعاء منتصف الجملة لواجهة برمجة تطبيقات الآلة الحاسبة للحصول على عملية حسابية دقيقة بدلاً من تخمين إجابة رقمية.

الاستعلام عن نظام بحث أو ضمان الجودة لجلب معلومات واقعية محدثة أو نادرًا ما يتم عرضها.

استدعاء أداة الترجمة الآلية لعرض عبارة بلغة أخرى داخل النص الذي تم إنشاؤه.

استخدام أداة التقويم/التاريخ لحل المراجع النسبية مثل "الجمعة القادمة" إلى تاريخ محدد.

أنماط التنفيذ

استخدام أداة صانع الأدوات والأداة التي يتم تدريسها ذاتيًا في الممارسة العملية

استدعاء منتصف الجملة لواجهة برمجة تطبيقات الآلة الحاسبة للحصول على عملية حسابية دقيقة بدلاً من تخمين إجابة رقمية.

استدعاء منتصف الجملة لواجهة برمجة تطبيقات الآلة الحاسبة للحصول على عمليات حسابية دقيقة بدلاً من تخمين إجابة رقمية، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

استخدام أداة صانع الأدوات والأداة التي يتم تدريسها ذاتيًا في الممارسة العملية

الاستعلام عن نظام بحث أو ضمان الجودة لجلب معلومات واقعية محدثة أو نادرًا ما يتم عرضها.

الاستعلام عن نظام بحث أو ضمان الجودة لجلب معلومات واقعية محدثة أو نادرًا ما تحصل الفرق عادةً على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

استخدام أداة صانع الأدوات والأداة التي يتم تدريسها ذاتيًا في الممارسة العملية

استدعاء أداة الترجمة الآلية لعرض عبارة بلغة أخرى داخل النص الذي تم إنشاؤه.

استدعاء أداة ترجمة آلية لعرض عبارة بلغة أخرى داخل النص الذي تم إنشاؤه، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

استخدام أداة صانع الأدوات والأداة التي يتم تدريسها ذاتيًا في الممارسة العملية

استخدام أداة التقويم/التاريخ لحل المراجع النسبية مثل "الجمعة القادمة" إلى تاريخ محدد.

استخدام أداة التقويم/التاريخ لحل المراجع النسبية مثل "الجمعة القادمة" إلى تاريخ محدد، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع.

!

غالبًا ما يتم التقليل من تكاليف البنية التحتية والصيانة.

!

يمكن أن تنمو الفجوات الأمنية وقابلية المراقبة عندما تصبح الأنظمة أكثر تعقيدًا.

خارطة طريق التنفيذ

1

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ.

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

المعيار في ظل ظروف التحميل والبيانات الواقعية.

المعيار في ظل ظروف التحميل والبيانات الواقعية. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم.

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس.

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف