نظرة عامة
Self-RAG هو إطار عمل حيث يقرر نموذج اللغة متى يتم استرجاعه، ثم ينتقد كلاً من المقاطع المستردة ومخرجاته باستخدام رموز انعكاس خاصة. إنه أمر مهم لأنه يجعل عملية الاسترجاع المعززة قابلة للتكيف والتحقق الذاتي بدلاً من جلب المستندات بشكل أعمى لكل استعلام.
يعد Self-RAG والاسترجاع العاكس جزءًا من حزمة لغة الذكاء الاصطناعي المستخدمة لقراءة وإنشاء وتصنيف وتحويل النص والكلام على نطاق واسع.
الغوص العميق
يسترد Standard RAG عددًا ثابتًا من المقاطع لكل إدخال، حتى في حالة عدم الحاجة إلى أي منها، ولا يتحقق أبدًا مما إذا كانت الإجابة مدعومة بالفعل. يقوم نظام Self RAG، الذي قدمه Asai وزملاؤه في عام 2023، بتدريب نموذج واحد للقيام بثلاثة أشياء عند الطلب. أولاً، يقوم بإصدار رمز "استرجاع" مميز لتحديد ما إذا كانت هناك حاجة إلى معرفة خارجية على الإطلاق. ثانيًا، بعد الاسترداد، يصدر رموزًا نقدية "IsRelevant" للحكم على ما إذا كان كل فقرة مفيدة أم لا. ثالثًا، يقوم بإنشاء رموز "IsSupported" و"IsUseful" لتقييم ما إذا كانت تصريحاته مستندة إلى الأدلة ومدى جودة الاستجابة. تسمح رموز الانعكاس هذه للنظام بالاسترداد فقط عند الضرورة، وتصفية المقاطع غير ذات الصلة، وتفضيل المخرجات التي يصنفها النموذج نفسه على أنها مدعومة جيدًا، مما يقلل من الهلوسة.
البصيرة الفنية
يتم تدريب Self-RAG من خلال التعلم الخاضع للإشراف على البيانات المصنفة برموز الانعكاس، والتي غالبًا ما يتم استخلاصها من نموذج أقوى مثل GPT-4. عند الاستدلال، يقوم النموذج بتشذير رموز النص العادية مع رموز التحكم الخاصة هذه. يمكن للبحث الشعاعي على مستوى المقطع تسجيل استمراريات المرشح باستخدام احتمالات الرموز المميزة للنقد، مما يسمح للمطورين بضبط السلوك في وقت التشغيل - على سبيل المثال، ترجيح "IsSupported" بشكل أكبر لتحقيق أقصى قدر من التأريض الواقعي مقابل الطلاقة.
إتقان RAG الذاتي والاسترجاع العاكس
Self-RAG هو إطار عمل حيث يقرر نموذج اللغة متى يتم استرجاعه، ثم ينتقد كلاً من المقاطع المستردة ومخرجاته باستخدام رموز انعكاس خاصة. إنه أمر مهم لأنه يجعل عملية الاسترجاع المعززة قابلة للتكيف والتحقق الذاتي بدلاً من جلب المستندات بشكل أعمى لكل استعلام. يعد Self-RAG والاسترجاع العاكس جزءًا من حزمة لغة الذكاء الاصطناعي المستخدمة لقراءة وإنشاء وتصنيف وتحويل النص والكلام على نطاق واسع. لبناء فهم عميق، تعامل مع RAG الذاتي والاسترجاع العاكس كنموذج تشغيلي، وليس كميزة واحدة: تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.
من الناحية العملية، تعمل الفرق القوية التي تستخدم Self-RAG وتصميم الاسترجاع العاكس على المطالبة بحلقات الاسترجاع والمراجعة كنظام اتصال متكامل واحد. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.
يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق. وفي الوقت نفسه، يمكن للحقائق المهلوسة أن تدخل التقارير أو التدفقات الداعمة أو مخرجات البحث بهدوء. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.
التأثير الاستراتيجي
يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق.
يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
فهو يوسع الوصول عبر اللغات وأنماط الاتصال.
فهو يوسع الوصول عبر اللغات وأنماط الاتصال. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
يمكن للفرق قضاء المزيد من الوقت في الحكم بينما تتعامل الأتمتة مع التكرار.
يمكن للفرق قضاء المزيد من الوقت في الحكم بينما تتعامل الأتمتة مع التكرار. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
التنفيذ في العالم الحقيقي
يقوم مساعد الأسئلة والأجوبة الطبية باسترداد الإرشادات الخاصة بالأسئلة السريرية فقط ويتخطى الاسترداد للتحيات، وذلك باستخدام رمز القرار "الاسترداد" الخاص به.
يقوم مساعد البحث بتصفية نتائج البحث خارج الموضوع عن طريق التحقق من نقد "هل هو ذو صلة" لكل مقطع قبل الكتابة.
يفضل برنامج الدردشة الآلي الخاص بالمؤسسة الإجابات التي تحمل علامة "IsSupported" بحيث تظل بياناته مستندة إلى مستندات الشركة، مما يقلل من الهلوسة.
تستخدم أداة التحقق من الحقائق درجة "IsUseful" لتصنيف إجابات المرشحين المتعددة وإظهار الإجابات الأفضل إثباتًا.
أنماط التنفيذ
RAG الذاتي والاسترجاع العاكس في الممارسة العملية
يقوم مساعد الأسئلة والأجوبة الطبية باسترداد الإرشادات الخاصة بالأسئلة السريرية فقط ويتخطى الاسترداد للتحيات، وذلك باستخدام رمز القرار "الاسترداد" الخاص به.
يقوم مساعد الأسئلة والأجوبة الطبي باسترداد الإرشادات فقط للأسئلة السريرية ويتخطى استرجاع التحيات، باستخدام رمز القرار "الاسترداد" الخاص به، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الخطأ مع مرور الوقت.
RAG الذاتي والاسترجاع العاكس في الممارسة العملية
يقوم مساعد البحث بتصفية نتائج البحث خارج الموضوع عن طريق التحقق من نقد "هل هو ذو صلة" لكل مقطع قبل الكتابة.
يقوم مساعد البحث بتصفية نتائج البحث خارج الموضوع عن طريق التحقق من نقد "هل هو ذو صلة" لكل مقطع قبل الكتابة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
RAG الذاتي والاسترجاع العاكس في الممارسة العملية
يفضل برنامج الدردشة الآلي الخاص بالمؤسسة الإجابات التي تحمل علامة "IsSupported" بحيث تظل بياناته مستندة إلى مستندات الشركة، مما يقلل من الهلوسة.
يفضل برنامج الدردشة الآلي الخاص بالمؤسسة الإجابات التي تحمل علامة "IsSupported" بحيث تظل بياناته مستندة إلى مستندات الشركة، مما يقلل من الهلوسة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
RAG الذاتي والاسترجاع العاكس في الممارسة العملية
تستخدم أداة التحقق من الحقائق درجة "IsUseful" لتصنيف إجابات المرشحين المتعددة وإظهار الإجابات الأفضل إثباتًا.
تستخدم أداة التحقق من الحقائق درجة "IsUseful" لتصنيف إجابات المرشحين المتعددة وإظهار الإجابات الأفضل إثباتًا. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
المخاطر والدرابزين
يمكن للحقائق المهلوسة إدخال التقارير أو تدفقات الدعم أو مخرجات البحث بهدوء.
يمكن أن تؤدي الحساسية السريعة إلى نتائج غير متناسقة عبر الطلبات المماثلة.
قد يتم كشف البيانات النصية الحساسة إذا كانت عناصر التحكم في الوصول ضعيفة.
خارطة طريق التنفيذ
حدد تنسيق الإخراج والنغمة ومعايير الجودة قبل بدء التشغيل.
حدد تنسيق الإخراج والنغمة ومعايير الجودة قبل بدء التشغيل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
استجابات أرضية من مصادر موثوقة عندما تكون الدقة مهمة.
استجابات أرضية من مصادر موثوقة عندما تكون الدقة مهمة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
احتفظ بنقطة تفتيش للمراجعة البشرية للمخرجات عالية المخاطر.
احتفظ بنقطة تفتيش للمراجعة البشرية للمخرجات عالية المخاطر. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
تتبع أنماط الفشل وأعد تدريب المطالبات أو سير العمل بانتظام.
تتبع أنماط الفشل وأعد تدريب المطالبات أو سير العمل بانتظام. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.