دليل اللغة AI

الحد الأقصى من الصلة الهامشية

الحد الأقصى للملاءمة الهامشية (MMR) هو أسلوب إعادة تصنيف يوازن بين مدى ملاءمة النتيجة ومدى اختلافها عن النتائج التي تم اختيارها بالفعل.

نظرة عامة

الحد الأقصى للملاءمة الهامشية (MMR) هو أسلوب إعادة تصنيف يوازن بين مدى ملاءمة النتيجة ومدى اختلافها عن النتائج التي تم اختيارها بالفعل. إنه أمر مهم لأن تصنيف الملاءمة الخالصة غالبًا ما يُرجع مقاطع شبه مكررة تهدر المساحة في نافذة سياق RAG.

يعد الحد الأقصى للملاءمة الهامشية جزءًا من مجموعة لغات الذكاء الاصطناعي المستخدمة لقراءة النص والكلام وإنشائه وتصنيفه وتحويله على نطاق واسع.

الغوص العميق

عندما يقوم نظام بحث بتقييم المستندات حسب صلتها بالاستعلام فقط، فإن النتائج العليا تكون متكررة في كثير من الأحيان - خمس فقرات كلها تقول نفس الشيء. MMR، الذي قدمه كاربونيل وغولدشتاين في عام 1998، يصلح هذه المشكلة عن طريق اختيار النتائج واحدة تلو الأخرى. في كل خطوة، يختار المرشح الذي يزيد من المزيج الموزون إلى أقصى حد: لامدا مضروبًا في مدى صلته بالاستعلام، ناقص (1 ناقص لامدا) مضروبًا في الحد الأقصى للتشابه مع أي شيء محدد بالفعل. لامدا بالقرب من 1 تفضل الملاءمة الخالصة؛ بالقرب من 0 فهو يفضل التنوع. في الجيل المعزز بالاسترجاع، تحظى MMR بشعبية لجلب مجموعة متنوعة من القطع بحيث يرى نموذج اللغة أدلة تكميلية بدلاً من تكرار نفس الحقيقة، مما يحسن التغطية دون توسيع السياق.

البصيرة الفنية

MMR هي خوارزمية جشعة ومتكررة. عادةً ما يتم حساب كل من الملاءمة والتشابه بين المستندات على أنها تشابه جيب التمام بين ناقلات التضمين. صيغة التسجيل هي: MMR = argmax على المستندات المتبقية من [ lambda * sim(doc, query) - (1 - lambda) * max sim(doc, Selected)]. نظرًا لأنه يُعاد تقييمه مقابل المجموعة المحددة المتزايدة في كل جولة، فإنه يعتمد على الترتيب ويتم تشغيله تقريبًا في مقارنات تشابه O(k*n) لاختيارات k من n من المرشحين.

إتقان الحد الأقصى من الملاءمة الهامشية

الحد الأقصى للملاءمة الهامشية (MMR) هو أسلوب إعادة تصنيف يوازن بين مدى ملاءمة النتيجة ومدى اختلافها عن النتائج التي تم اختيارها بالفعل. إنه أمر مهم لأن تصنيف الملاءمة الخالصة غالبًا ما يُرجع مقاطع شبه مكررة تهدر المساحة في نافذة سياق RAG. يعد الحد الأقصى للملاءمة الهامشية جزءًا من مجموعة لغات الذكاء الاصطناعي المستخدمة لقراءة النص والكلام وإنشائه وتصنيفه وتحويله على نطاق واسع. لبناء فهم عميق، يجب التعامل مع الحد الأقصى من الملاءمة الهامشية كنموذج تشغيلي، وليس كميزة واحدة: تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تستخدم الفرق القوية حلقات التصميم ذات الصلة الهامشية القصوى للمطالبة والاسترجاع والمراجعة كنظام اتصال متكامل واحد. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق. وفي الوقت نفسه، يمكن للحقائق المهلوسة أن تدخل التقارير أو التدفقات الداعمة أو مخرجات البحث بهدوء. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق.

يمكن أن تتحرك مسارات عمل اللغة بشكل أسرع دون التضحية بالاتساق. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

فهو يوسع الوصول عبر اللغات وأنماط الاتصال.

فهو يوسع الوصول عبر اللغات وأنماط الاتصال. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يمكن للفرق قضاء المزيد من الوقت في الحكم بينما تتعامل الأتمتة مع التكرار.

يمكن للفرق قضاء المزيد من الوقت في الحكم بينما تتعامل الأتمتة مع التكرار. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل الحد الأقصى من الملاءمة الهامشية

يظل MMR هو الوضع الافتراضي الخفيف في عملاء قواعد البيانات المتجهة مثل LangChain وChroma، حيث يتم تقديمه كوضع استرجاع من سطر واحد. تعمل الأنظمة المستقبلية على ربطها بشكل متزايد بأهداف التنوع المستفادة، والاختيار القائم على الكتلة، وإعادة ترتيب التشفير المتقاطع الذي يحكم على الجدة بشكل أكثر دلاليًا من مسافة جيب التمام. ومع نمو نوافذ السياق، يتحول التركيز من توفير المساحة إلى تنسيق الأدلة التكميلية الحقيقية، والحفاظ على الاختيار المراعي للتنوع مثل معدل وفيات الأمهات حتى عندما تكون القدرة الخام وفيرة.

التنفيذ في العالم الحقيقي

يستخدم برنامج RAG chatbot استرجاع MMR بحيث تغطي الأجزاء الخمسة الأولى جوانب مختلفة من السياسة بدلاً من خمس عبارات من نفس الفقرة.

تقوم أداة تلخيص البحث بتطبيق MMR لاختيار المقاطع التي تقلل من التداخل، مما يؤدي إلى إنتاج ملخص أوسع وأقل تكرارًا.

يقوم مجمع الأخبار بتصنيف المقالات باستخدام MMR لإظهار تغطية متنوعة لحدث ما بدلاً من عشرة منافذ تكرر قصة سلكية واحدة.

يكشف مسترد مخزن المتجهات الخاص بـ LangChain عن search_type='mmr' باستخدام fetch_k وlamda_mult لتنويع المستندات التي يتم إرجاعها.

أنماط التنفيذ

الحد الأقصى من الصلة الهامشية في الممارسة العملية

يستخدم برنامج RAG chatbot استرجاع MMR بحيث تغطي الأجزاء الخمسة الأولى جوانب مختلفة من السياسة بدلاً من خمس عبارات من نفس الفقرة.

يستخدم روبوت الدردشة RAG استرجاع MMR بحيث تغطي الأجزاء الخمسة الأولى جوانب مختلفة من السياسة بدلاً من خمس عبارات من نفس الفقرة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتبع كل من مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الحد الأقصى من الصلة الهامشية في الممارسة العملية

تقوم أداة تلخيص البحث بتطبيق MMR لاختيار المقاطع التي تقلل من التداخل، مما يؤدي إلى إنتاج ملخص أوسع وأقل تكرارًا.

تطبق أداة تلخيص البحث MMR لاختيار المقاطع التي تقلل من التداخل، وتنتج ملخصًا أوسع نطاقًا وأقل تكرارًا. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الحد الأقصى من الصلة الهامشية في الممارسة العملية

يقوم مجمع الأخبار بتصنيف المقالات باستخدام MMR لإظهار تغطية متنوعة لحدث ما بدلاً من عشرة منافذ تكرر قصة سلكية واحدة.

يقوم مجمع الأخبار بتصنيف المقالات باستخدام MMR لإظهار تغطية متنوعة لحدث ما بدلاً من عشرة منافذ تكرر قصة سلكية واحدة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الحد الأقصى من الصلة الهامشية في الممارسة العملية

يكشف مسترد مخزن المتجهات الخاص بـ LangChain عن search_type='mmr' باستخدام fetch_k وlamda_mult لتنويع المستندات التي يتم إرجاعها.

يكشف مسترد مخزن المتجهات الخاص بـ LangChain عن search_type='mmr' مع fetch_k و lambda_mult لتنويع المستندات التي يتم إرجاعها، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن للحقائق المهلوسة إدخال التقارير أو تدفقات الدعم أو مخرجات البحث بهدوء.

!

يمكن أن تؤدي الحساسية السريعة إلى نتائج غير متناسقة عبر الطلبات المماثلة.

!

قد يتم كشف البيانات النصية الحساسة إذا كانت عناصر التحكم في الوصول ضعيفة.

خارطة طريق التنفيذ

1

حدد تنسيق الإخراج والنغمة ومعايير الجودة قبل بدء التشغيل.

حدد تنسيق الإخراج والنغمة ومعايير الجودة قبل بدء التشغيل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

استجابات أرضية من مصادر موثوقة عندما تكون الدقة مهمة.

استجابات أرضية من مصادر موثوقة عندما تكون الدقة مهمة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

احتفظ بنقطة تفتيش للمراجعة البشرية للمخرجات عالية المخاطر.

احتفظ بنقطة تفتيش للمراجعة البشرية للمخرجات عالية المخاطر. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

تتبع أنماط الفشل وأعد تدريب المطالبات أو سير العمل بانتظام.

تتبع أنماط الفشل وأعد تدريب المطالبات أو سير العمل بانتظام. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف