دليل الأساسيات

قوانين التوسع للشبكات العصبية

قوانين القياس هي صيغ تجريبية توضح أن خسارة الشبكة العصبية تنخفض بشكل متوقع مع زيادة حجم النموذج وحجم مجموعة البيانات والحوسبة.

نظرة عامة

قوانين القياس هي صيغ تجريبية توضح أن خسارة الشبكة العصبية تنخفض بشكل متوقع مع زيادة حجم النموذج وحجم مجموعة البيانات والحوسبة. إنها مهمة لأنها تسمح للباحثين بالتنبؤ بالأداء قبل إنفاق الملايين على تدريب نموذج عملاق.

توجد قوانين التوسع في الشبكات العصبية في مجموعة أدوات الذكاء الاصطناعي الأساسية. عندما تفهمها، يصبح تقييم موضوعات الذكاء الاصطناعي الأخرى ومقارنتها أسهل.

الغوص العميق

وجدت قوانين القياس، التي تم نشرها في بحث OpenAI لعام 2020 الذي أعده كابلان وزملاؤه، أن فقدان الاختبار يتناقص كقانون قوة سلس في ثلاث كميات: عدد المعلمات (N)، ورموز التدريب (D)، والحوسبة الإجمالية (C). تم رسمها على محاور سجل السجل، وتشكل الخسارة مقابل كل عامل خطًا مستقيمًا تقريبًا يمتد على العديد من أوامر الحجم. تأخذ العلاقات شكل الخسارة ≈ a + b·X^(-c)، حيث X هو عامل القياس. وبشكل حاسم، أشار العمل الأصلي إلى أن حجم النموذج له أهمية أكبر من البيانات، مما أدى إلى سباق نحو نماذج أكبر من أي وقت مضى مثل معلمات GPT-3 البالغ عددها 175 مليارًا. حولت قوانين التوسع التعلم العميق من التخمين إلى نظام هندسي يمكن التنبؤ به، مما سمح للفرق بالتنبؤ بالنتائج واسعة النطاق من تجارب صغيرة ورخيصة.

البصيرة الفنية

ويعني نموذج قانون القوة أن كل زيادة مضاعفة ثابتة في الحساب تؤدي إلى انخفاض إضافي ثابت تقريبًا في الخسارة. يتم قياس الخسارة بالناتس أو البتات لكل رمز من الإنتروبيا المتقاطعة. نظرًا لأن الأس c صغير (غالبًا ما يكون حوالي 0.05-0.1)، فإن المكاسب تكون حقيقية ولكنها تتضاءل: تساعد مضاعفة الحوسبة بشكل أقل بكثير من المضاعفات الأولى. الأهم من ذلك، أن هذه القوانين تصف الخسارة غير القابلة للاختزال بالإضافة إلى الخسارة، حيث يلتقط المصطلح الثابت الإنتروبيا الجوهرية للبيانات التي لا يمكن لأي نموذج التغلب عليها.

إتقان قوانين القياس للشبكات العصبية

قوانين القياس هي صيغ تجريبية توضح أن خسارة الشبكة العصبية تنخفض بشكل متوقع مع زيادة حجم النموذج وحجم مجموعة البيانات والحوسبة. إنها مهمة لأنها تسمح للباحثين بالتنبؤ بالأداء قبل إنفاق الملايين على تدريب نموذج عملاق. توجد قوانين التوسع في الشبكات العصبية في مجموعة أدوات الذكاء الاصطناعي الأساسية. عندما تفهمها، يصبح تقييم موضوعات الذكاء الاصطناعي الأخرى ومقارنتها أسهل. لبناء فهم عميق، يجب التعامل مع قوانين القياس للشبكات العصبية كنموذج تشغيل، وليس كميزة واحدة: تحديد النتائج المرجوة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تقوم الفرق القوية التي تستخدم قوانين القياس للشبكات العصبية ببناء نماذج مفاهيمية قوية أولاً، ثم تقوم بتخطيط تلك النماذج لقيود الإنتاج الحقيقية. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق. وفي الوقت نفسه، قد تستخدم الفرق المختلفة نفس المصطلح بشكل مختلف، لذا حدد النطاق مبكرًا. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق.

يساعدك على فصل المطالبات الفنية الواضحة عن لغة التسويق. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يمكنك طرح أسئلة تنفيذ أفضل قبل إنفاق المال أو الوقت.

يمكنك طرح أسئلة تنفيذ أفضل قبل إنفاق المال أو الوقت. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تتخذ الفرق ذات الفهم المشترك قرارات أفضل بشأن المنتجات والسياسات والتعلم.

تتخذ الفرق ذات الفهم المشترك قرارات أفضل بشأن المنتجات والسياسات والتعلم. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل قوانين التوسع في الشبكات العصبية

يقوم الباحثون بتوسيع قوانين القياس إلى ما هو أبعد من خسارة التدريب المسبق لتشمل دقة المهام النهائية، والنماذج متعددة الوسائط، وحساب وقت الاستدلال، حيث تنفق نماذج الاستدلال مزيدًا من التفكير لكل استعلام. ومع ندرة النصوص عالية الجودة، يتحول الاهتمام إلى جودة البيانات، والبيانات الاصطناعية، وقوانين قياس البيانات المتكررة. يجادل البعض بأن التوسع الأولي يصل إلى الحدود العملية للمال والطاقة والنص المتاح، مما يدفع المجال نحو الكفاءة الخوارزمية والبنى الجديدة بدلاً من مجرد بناء أكبر.

التنفيذ في العالم الحقيقي

التنبؤ بالخسارة النهائية لنموذج مخطط له 70 مليار معلمة من سلسلة من الاختبارات الصغيرة التي تحتوي على 100 مليون معلمة قبل الالتزام بميزانية وحدة معالجة الرسومات.

تحديد عدد تريليونات الرموز التي سيتم جمعها حتى لا يتم إهدار ميزانية الحوسبة الثابتة على نموذج غير مدرب.

مقارنة بنائين بتكلفة زهيدة عن طريق ملاءمة منحنيات القياس الخاصة بهما على نطاق صغير بدلاً من تدريب كليهما بالحجم الكامل.

وضع توقعات دقة واقعية للمستثمرين أو مراجعي المنح من خلال استقراء منحنى الخسارة إلى مستوى حساب مستهدف.

أنماط التنفيذ

توسيع نطاق القوانين للشبكات العصبية في الممارسة العملية

التنبؤ بالخسارة النهائية لنموذج مخطط له 70 مليار معلمة من سلسلة من الاختبارات الصغيرة التي تحتوي على 100 مليون معلمة قبل الالتزام بميزانية وحدة معالجة الرسومات.

التنبؤ بالخسارة النهائية لنموذج مخطط له 70 مليار معلمة من سلسلة من الاختبارات الصغيرة التي تحتوي على 100 مليون معلمة قبل الالتزام بميزانية وحدة معالجة الرسومات (GPU) تحصل الفرق عادةً على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتبع كل من مكاسب الإنتاجية وتكاليف الخطأ بمرور الوقت.

توسيع نطاق القوانين للشبكات العصبية في الممارسة العملية

تحديد عدد تريليونات الرموز التي سيتم جمعها حتى لا يتم إهدار ميزانية الحوسبة الثابتة على نموذج غير مدرب.

تحديد عدد تريليونات الرموز المميزة التي سيتم جمعها حتى لا يتم إهدار ميزانية الحوسبة الثابتة على نموذج غير مدرب عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

توسيع نطاق القوانين للشبكات العصبية في الممارسة العملية

مقارنة بنائين بتكلفة زهيدة عن طريق ملاءمة منحنيات القياس الخاصة بهما على نطاق صغير بدلاً من تدريب كليهما بالحجم الكامل.

مقارنة بنيتين بتكلفة زهيدة عن طريق ملاءمة منحنيات القياس الخاصة بهما على نطاق صغير بدلاً من تدريب كليهما بالحجم الكامل، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

توسيع نطاق القوانين للشبكات العصبية في الممارسة العملية

وضع توقعات دقة واقعية للمستثمرين أو مراجعي المنح من خلال استقراء منحنى الخسارة إلى مستوى حساب مستهدف.

وضع توقعات واقعية للدقة للمستثمرين أو مراجعي المنح من خلال استقراء منحنى الخسارة إلى مستوى حساب مستهدف، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء مع مرور الوقت.

المخاطر والدرابزين

!

قد تستخدم الفرق المختلفة نفس المصطلح بشكل مختلف، لذا حدد النطاق مبكرًا.

!

يمكن أن تبدو المعايير قوية بينما يكون الأداء في العالم الحقيقي غير متساوٍ.

!

غالبًا ما يؤدي تجاهل جودة البيانات وخطط التقييم إلى نتائج هشة.

خارطة طريق التنفيذ

1

ابدأ بتعريف لغة واضحة للنتيجة التي تحتاجها.

ابدأ بتعريف لغة واضحة للنتيجة التي تحتاجها. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

اختر مقياس نجاح واحد وحالة فشل واحدة قبل الاختبار.

اختر مقياس نجاح واحد وحالة فشل واحدة قبل الاختبار. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

قم بتشغيل برنامج تجريبي صغير يحتوي على بيانات تمثيلية، وليس مجموعة تجريبية مصقولة.

قم بتشغيل برنامج تجريبي صغير يحتوي على بيانات تمثيلية، وليس مجموعة تجريبية مصقولة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

قم بالتوثيق حيث تساعد قوانين القياس للشبكات العصبية وأين تكون الطرق الأبسط أفضل.

قم بالتوثيق حيث تساعد قوانين القياس للشبكات العصبية وأين تكون الطرق الأبسط أفضل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف