نظرة عامة
يقوم التعلم الخاضع للإشراف الذاتي بتدريب النماذج على البيانات غير المسماة عن طريق اختراع مهمة تكون إجابتها مخفية داخل البيانات نفسها. إنها الطريقة التي تتعلم بها نماذج أسس اللغة والرؤية الحديثة من الإنترنت الخام بدون جيوش من واضعي العلامات البشرية.
يقع التعلم الخاضع للإشراف الذاتي في مجموعة أدوات الذكاء الاصطناعي الأساسية. عندما تفهمها، يصبح تقييم موضوعات الذكاء الاصطناعي الأخرى ومقارنتها أسهل.
الغوص العميق
يعد تصنيف البيانات يدويًا بطيئًا ومكلفًا، ومع ذلك فإن العالم مليء بالنصوص والصور والصوت والفيديو غير المصنفة. ويفتحها التعلم الخاضع للإشراف الذاتي عن طريق إنشاء "مهام ذريعة" حيث توفر البيانات إجابتها الخاصة. المثال الكلاسيكي هو نمذجة اللغة المقنعة، التي يستخدمها بيرت: إخفاء بعض الكلمات في الجملة وتدريب النموذج على التنبؤ بها من السياق. تتنبأ نماذج نمط GPT بالكلمة التالية. في الرؤية، تُظهر الأساليب التفاضلية مثل SimCLR للنموذج محصولين معززين من نفس الصورة وتعلمه أنهما ينتميان معًا بينما تفصل الصور المختلفة عن بعضها البعض. إن حل هذه الألغاز ذاتية الصنع يجبر النموذج على بناء تمثيلات داخلية غنية للمعنى والبنية. ثم تنتقل هذه التمثيلات بقوة إلى المهام النهائية الحقيقية مع القليل من البيانات المصنفة أو معدومة.
البصيرة الفنية
الحيلة هي توليد إشارة إشراف مجاناً. في النمذجة المقنعة، يكون الرمز المخفي هو الملصق، لذلك يمكن حساب الخسارة دون أي تعليق توضيحي بشري. في التعلم المتباين، تشكل زيادتان لصورة واحدة "زوجًا إيجابيًا" يجب أن يكون قريبًا في مساحة التضمين، في حين تكون الصور الأخرى "سلبية" مدفوعة بعيدًا. وفي كلتا الحالتين، يتم تحسين النموذج على تسميات مشتقة تمامًا من بنية البيانات الخاصة، وتعلم الميزات العامة التي تحتاج فيما بعد إلى ضبط دقيق فقط.
إتقان التعلم الخاضع للإشراف الذاتي
يقوم التعلم الخاضع للإشراف الذاتي بتدريب النماذج على البيانات غير المسماة عن طريق اختراع مهمة تكون إجابتها مخفية داخل البيانات نفسها. إنها الطريقة التي تتعلم بها نماذج أسس اللغة والرؤية الحديثة من الإنترنت الخام بدون جيوش من واضعي العلامات البشرية. يقع التعلم الخاضع للإشراف الذاتي في مجموعة أدوات الذكاء الاصطناعي الأساسية. عندما تفهمها، يصبح تقييم موضوعات الذكاء الاصطناعي الأخرى ومقارنتها أسهل. لبناء فهم عميق، تعامل مع التعلم الخاضع للإشراف الذاتي كنموذج تشغيلي، وليس كميزة واحدة: حدد النتائج المرغوبة، ووضح الافتراضات، وافصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.
من الناحية العملية، تقوم الفرق القوية التي تستخدم التعلم الخاضع للإشراف الذاتي ببناء نماذج مفاهيمية قوية أولاً، ثم تقوم بتعيين تلك النماذج لقيود الإنتاج الحقيقية. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.
يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق. وفي الوقت نفسه، قد تستخدم الفرق المختلفة نفس المصطلح بشكل مختلف، لذا حدد النطاق مبكرًا. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.
التأثير الاستراتيجي
يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق.
يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
يمكنك طرح أسئلة تنفيذ أفضل قبل إنفاق المال أو الوقت.
يمكنك طرح أسئلة تنفيذ أفضل قبل إنفاق المال أو الوقت. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
تتخذ الفرق ذات الفهم المشترك قرارات أفضل بشأن المنتجات والسياسات والتعلم.
تتخذ الفرق ذات الفهم المشترك قرارات أفضل بشأن المنتجات والسياسات والتعلم. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.
التنفيذ في العالم الحقيقي
يتعلم BERT اللغة عن طريق التنبؤ بالكلمات المقنعة، ثم يتم ضبطها بدقة للبحث أو المشاعر أو الإجابة على الأسئلة
يقوم SimCLR بالتدريب المسبق لبرنامج تشفير الصور على الصور غير المسماة حتى يتمكن من تصنيفها لاحقًا باستخدام عدد قليل جدًا من التصنيفات
تتعلم نماذج نمط GPT الكتابة من خلال التنبؤ المتكرر بالرمز التالي عبر مجموعات نصية ضخمة
نماذج الكلام التي تم تدريبها مسبقًا على الصوت الخام غير المسمى (تتنبأ بمقاطع الصوت المقنعة) قبل تكييفها مع النسخ
أنماط التنفيذ
التعلم تحت الإشراف الذاتي في الممارسة العملية
يتعلم BERT اللغة عن طريق التنبؤ بالكلمات المقنعة، ثم يتم ضبطها بدقة للبحث أو المشاعر أو الإجابة على الأسئلة.
يتعلم BERT اللغة من خلال التنبؤ بالكلمات المقنعة، ثم يتم ضبطها بدقة للبحث أو المشاعر أو الإجابة على الأسئلة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
التعلم تحت الإشراف الذاتي في الممارسة العملية
يقوم SimCLR بتدريب برنامج تشفير الصور مسبقًا على الصور غير المسماة حتى يتمكن من تصنيفها لاحقًا باستخدام عدد قليل جدًا من التصنيفات.
يقوم SimCLR بتدريب برنامج ترميز الصور مسبقًا على الصور غير المسماة حتى يتمكن من التصنيف لاحقًا باستخدام عدد قليل جدًا من التسميات. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
التعلم تحت الإشراف الذاتي في الممارسة العملية
تتعلم نماذج نمط GPT الكتابة من خلال التنبؤ المتكرر بالرمز التالي عبر مجموعات نصية ضخمة.
تتعلم نماذج نمط GPT الكتابة من خلال التنبؤ المتكرر بالرمز المميز التالي عبر مجموعات نصية ضخمة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.
التعلم تحت الإشراف الذاتي في الممارسة العملية
نماذج الكلام التي تم تدريبها مسبقًا على الصوت الخام غير المسمى (تتنبأ بمقاطع الصوت المقنعة) قبل تكييفها مع النسخ.
نماذج الكلام التي تم تدريبها مسبقًا على الصوت الخام غير المسمى (تتنبأ بمقاطع الصوت المقنعة) قبل تكييفها مع النسخ، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الخطأ مع مرور الوقت.
المخاطر والدرابزين
قد تستخدم الفرق المختلفة نفس المصطلح بشكل مختلف، لذا حدد النطاق مبكرًا.
يمكن أن تبدو المعايير قوية بينما يكون الأداء في العالم الحقيقي غير متساوٍ.
غالبًا ما يؤدي تجاهل جودة البيانات وخطط التقييم إلى نتائج هشة.
خارطة طريق التنفيذ
ابدأ بتعريف لغة واضحة للنتيجة التي تحتاجها.
ابدأ بتعريف لغة واضحة للنتيجة التي تحتاجها. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
اختر مقياس نجاح واحد وحالة فشل واحدة قبل الاختبار.
اختر مقياس نجاح واحد وحالة فشل واحدة قبل الاختبار. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
قم بتشغيل برنامج تجريبي صغير يحتوي على بيانات تمثيلية، وليس مجموعة تجريبية مصقولة.
قم بتشغيل برنامج تجريبي صغير يحتوي على بيانات تمثيلية، وليس مجموعة تجريبية مصقولة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.
قم بالتوثيق حيث يساعد التعلم تحت الإشراف الذاتي وأين تكون الأساليب الأبسط أفضل.
قم بالتوثيق حيث يساعد التعلم تحت الإشراف الذاتي وأين تكون الأساليب الأبسط أفضل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.