الدليل الفني

MLflow وتتبع دورة حياة النموذج

MLflow عبارة عن منصة مفتوحة المصدر لإدارة دورة حياة التعلم الآلي، بدءًا من تتبع التجربة وحتى تعبئة النماذج ونشرها.

نظرة عامة

MLflow عبارة عن منصة مفتوحة المصدر لإدارة دورة حياة التعلم الآلي، بدءًا من تتبع التجربة وحتى تعبئة النماذج ونشرها. إنها مهمة لأنها تجلب النظام وإمكانية التكرار إلى العملية الفوضوية والمتكررة لبناء النماذج.

يعد تتبع دورة حياة النموذج وMLflow بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع.

الغوص العميق

تم إنشاء MLflow بواسطة Databricks وتم إصداره في عام 2018، وهو يعالج مشكلة شائعة: يقوم علماء البيانات بإجراء مئات التجارب ويفقدون تتبع المعلمات والتعليمات البرمجية والبيانات التي أنتجت أفضل نموذج. ينظم MLflow هذا حول أربعة مكونات. تتبع معلمات السجلات والمقاييس وإصدارات التعليمات البرمجية وعناصر الإخراج لكل عملية تشغيل حتى تكون النتائج قابلة للمقارنة. كود حزمة المشاريع بتنسيق قابل لإعادة الاستخدام وقابل للتكرار مع بيئات محددة. توفر النماذج تنسيقًا قياسيًا بحيث يمكن نشر نفس النموذج على العديد من أهداف الخدمة. يضيف السجل النموذجي الإصدارات، والانتقالات المرحلية (مثل التدريج إلى الإنتاج)، وسير عمل الموافقة. MLflow لا يعتمد على إطار العمل، ويعمل مع scikit-learn وPyTorch وTensorFlow وXGBoost والمزيد، ولهذا السبب أصبح معيارًا فعليًا لإدارة التجارب وعمليات MLOps خفيفة الوزن.

البصيرة الفنية

يعمل تتبع MLflow من خلال واجهة برمجة تطبيقات التسجيل: في البرنامج النصي للتدريب الخاص بك، يمكنك استدعاء الوظائف لتسجيل المعلمات والمقاييس والعناصر، والتي تتم كتابتها إلى خادم تتبع مدعوم بقاعدة بيانات ومخزن للعناصر. يحصل كل تشغيل على معرف فريد وينتمي إلى تجربة. يغلف تنسيق النموذج نموذجًا مُدربًا بنكهة (إطار العمل الخاص به) بالإضافة إلى البيانات الوصفية، بحيث يمكن تحميل قطعة أثرية واحدة مرة أخرى أو تقديمها عبر REST دون إعادة كتابة كود الاستدلال.

إتقان MLflow وتتبع دورة حياة النموذج

MLflow عبارة عن منصة مفتوحة المصدر لإدارة دورة حياة التعلم الآلي، بدءًا من تتبع التجربة وحتى تعبئة النماذج ونشرها. إنها مهمة لأنها تجلب النظام وإمكانية التكرار إلى العملية الفوضوية والمتكررة لبناء النماذج. يعد تتبع دورة حياة النموذج وMLflow بمثابة لبنة بناء تقنية تؤثر على جودة النموذج وتكلفة البنية التحتية وزمن الوصول والموثوقية على نطاق واسع. لبناء فهم عميق، تعامل مع MLflow وتتبع دورة حياة النموذج كنموذج تشغيل، وليس كميزة واحدة: تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تعمل الفرق القوية التي تستخدم MLflow وتتبع دورة حياة النموذج على تحسين خيارات البنية والبيانات والبنية التحتية مقابل الموثوقية والتكلفة. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي الوقت نفسه، يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات.

تؤدي قرارات الهندسة المعمارية إلى زيادة الأداء وتكلفة التشغيل لسنوات. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث.

يساعد التعليم الفني الفرق على اختيار المجموعة المناسبة، وليس فقط المجموعة الأحدث. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج.

تعمل الخيارات الهندسية الأفضل على تقليل حوادث الموثوقية في الإنتاج. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل MLflow وتتبع دورة حياة النموذج

يتوسع MLflow بقوة في مجال الذكاء الاصطناعي التوليدي، ويضيف التتبع لتطبيقات LLM، والإدارة السريعة، وأدوات التقييم للسلاسل والوكلاء. توقع دعمًا أعمق لتتبع مخرجات LLM غير الحتمية ومجموعة البيانات والإصدارات السريعة والتكامل مع مجموعة إمكانية المراقبة الأوسع. مع نضوج السجل، فإنه يعمل بشكل متزايد كمركز حوكمة حيث تقوم الفرق بالموافقة والتدقيق والتراجع عن النماذج الكلاسيكية وأنظمة الذكاء الاصطناعي التوليدية عبر بيئات الإنتاج.

التنفيذ في العالم الحقيقي

يقوم فريق علوم البيانات بتسجيل كل تدريب باستخدام MLflow Tracking، ثم يقارن العشرات من عمليات التشغيل في واجهة المستخدم لاختيار النموذج الأفضل أداءً.

تستخدم شركة التأمين السجل النموذجي للترويج لنموذج المخاطر من التدريج إلى الإنتاج فقط بعد موافقة المراجع على النقل.

يقوم الفريق بحزم نموذج بتنسيق MLflow مرة واحدة، ثم ينشر الأداة المتطابقة إلى نقطة نهاية REST، ومهمة مجمعة، ومنصة سحابية.

يستخدم فريق تطبيق LLM تتبع MLflow لتسجيل المطالبات والاستجابات ووقت الاستجابة لكل مكالمة، وتصحيح أخطاء الوكيل الذي يسيء التصرف.

أنماط التنفيذ

MLflow وتتبع دورة حياة النموذج في الممارسة العملية

يقوم فريق علوم البيانات بتسجيل كل تدريب باستخدام MLflow Tracking، ثم يقارن العشرات من عمليات التشغيل في واجهة المستخدم لاختيار النموذج الأفضل أداءً.

يقوم فريق علوم البيانات بتسجيل كل تدريب يتم تشغيله باستخدام MLflow Tracking، ثم يقارن العشرات من عمليات التشغيل في واجهة المستخدم لاختيار النموذج الأفضل أداءً. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

MLflow وتتبع دورة حياة النموذج في الممارسة العملية

تستخدم شركة التأمين السجل النموذجي للترويج لنموذج المخاطر من التدريج إلى الإنتاج فقط بعد موافقة المراجع على النقل.

تستخدم شركة التأمين "السجل النموذجي" لتعزيز نموذج المخاطر من المرحلة إلى الإنتاج فقط بعد موافقة المراجع على الانتقال. وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الخطأ مع مرور الوقت.

MLflow وتتبع دورة حياة النموذج في الممارسة العملية

يقوم الفريق بحزم نموذج بتنسيق MLflow مرة واحدة، ثم ينشر الأداة المتطابقة إلى نقطة نهاية REST، ومهمة مجمعة، ومنصة سحابية.

يقوم الفريق بحزم نموذج بتنسيق MLflow مرة واحدة، ثم ينشر الأداة المتطابقة إلى نقطة نهاية REST، ومهمة مجمعة، ومنصة سحابية. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

MLflow وتتبع دورة حياة النموذج في الممارسة العملية

يستخدم فريق تطبيق LLM تتبع MLflow لتسجيل المطالبات والاستجابات ووقت الاستجابة لكل مكالمة، وتصحيح أخطاء الوكيل الذي يسيء التصرف.

يستخدم فريق تطبيق LLM تتبع MLflow لتسجيل المطالبات والاستجابات ووقت الاستجابة لكل مكالمة، وتصحيح أخطاء الوكيل الذي يسيء التصرف، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتبع كل من مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن يؤدي تحسين معيار واحد إلى إخفاء نقاط ضعف النظام الأوسع.

!

غالبًا ما يتم التقليل من تكاليف البنية التحتية والصيانة.

!

يمكن أن تنمو الفجوات الأمنية وقابلية المراقبة عندما تصبح الأنظمة أكثر تعقيدًا.

خارطة طريق التنفيذ

1

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ.

تحديد الكمون والجودة وأهداف التكلفة قبل التنفيذ. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

المعيار في ظل ظروف التحميل والبيانات الواقعية.

المعيار في ظل ظروف التحميل والبيانات الواقعية. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم.

مراقبة الأدوات للأخطاء والانجراف وتأثير المستخدم. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس.

قم بإعداد مسارات التراجع والاستجابة للحوادث قبل القياس. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف