دليل الشركات

الذكاء الجسدي وبي صفر

الذكاء الفيزيائي (غالبًا ما يتم تصميمه بالرمز pi) هو شركة ناشئة في سان فرانسيسكو تعمل على بناء ذكاء اصطناعي للأغراض العامة للروبوتات، وpi-zero هو نموذج الرؤية واللغة والحركة الرائد.

نظرة عامة

الذكاء الفيزيائي (غالبًا ما يتم تصميمه بالرمز pi) هو شركة ناشئة في سان فرانسيسكو تعمل على بناء ذكاء اصطناعي للأغراض العامة للروبوتات، وpi-zero هو نموذج الرؤية واللغة والحركة الرائد. هذا مهم لأن pi-zero يُظهر أن نموذجًا واحدًا يمكنه طي الغسيل، وطاولات النقل، وتجميع الصناديق عبر روبوتات مختلفة، والانتقال نحو سياسة تحكم عالمية في الروبوتات.

من الأفضل فهم الذكاء المادي وpi-zero في سياق الإستراتيجية والوصول إلى النماذج وقرارات النظام الأساسي وشراكات النظام البيئي.

الغوص العميق

تأسست شركة Physical Intelligence (التي غالبًا ما تُكتب بالحرف اليوناني pi) في عام 2024 من قبل باحثين من بينهم كارول هاوسمان وسيرجي ليفين وبريان إيشتر وتشيلسي فين، وقد جمعت حوالي 400 مليون دولار بتقييم يبلغ حوالي 2 مليار دولار من داعمين مثل جيف بيزوس وOpenAI وThrive وLux. نموذجها الأول، pi-zero، هو نموذج رؤية ولغة وعمل (VLA) يلتقط صور الكاميرا وتعليمات اللغة الطبيعية ويخرج أوامر محرك الروبوت المستمرة. من خلال تدريبها على البيانات المستمدة من العديد من منصات ومهام الروبوتات، أظهرت pi-zero أعمالًا منزلية بارعة في العالم الحقيقي، وأشهرها طي الغسيل من المجفف، بالإضافة إلى تنظيف الطاولات، وتسوية الصناديق، وتعبئة العناصر. هدف الشركة هو البرمجيات أولاً: نموذج أساسي يوفر ذكاءً جسديًا مرنًا وشاملاً للروبوتات المتنوعة بدلاً من مهارة واحدة مخصصة لكل جهاز.

البصيرة الفنية

يعتمد pi-zero على نموذج لغة رؤية تم تدريبه مسبقًا ويضيف "خبيرًا" للحركة ينتج تحكمًا مستمرًا عبر مطابقة التدفق، وهي تقنية تشبه الانتشار تولد مسارات حركية سلسة وعالية التردد (حوالي 50 هرتز). يتيح ذلك للنموذج التعامل مع التعديلات الدقيقة والسريعة التي تتطلبها المهام مثل طي الغسيل. من خلال وراثة الفهم الدلالي الواسع من العمود الفقري لـ VLM والضبط الدقيق لبيانات الروبوت المتقاطعة، تتبع pi-zero تعليمات اللغة مع تعميم المهارات عبر أذرع ومهام الروبوت المختلفة.

إتقان الذكاء الجسدي وpi-zero

الذكاء الفيزيائي (غالبًا ما يتم تصميمه بالرمز pi) هو شركة ناشئة في سان فرانسيسكو تعمل على بناء ذكاء اصطناعي للأغراض العامة للروبوتات، وpi-zero هو نموذج الرؤية واللغة والحركة الرائد. هذا مهم لأن pi-zero يُظهر أن نموذجًا واحدًا يمكنه طي الغسيل، وطاولات النقل، وتجميع الصناديق عبر روبوتات مختلفة، والانتقال نحو سياسة تحكم عالمية في الروبوتات. من الأفضل فهم الذكاء المادي وpi-zero في سياق الإستراتيجية والوصول إلى النماذج وقرارات النظام الأساسي وشراكات النظام البيئي. لبناء فهم عميق، يجب التعامل مع الذكاء الجسدي وpi-zero كنموذج تشغيلي، وليس كميزة واحدة: تحديد النتائج المرغوبة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تقوم الفرق القوية التي تستخدم الذكاء الفيزيائي وpi-zero بتقييم استراتيجية البائع وموثوقية خريطة الطريق ومخاطر القفل قبل الالتزام. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك. وفي الوقت نفسه، قد تتجاوز إعلانات الإطلاق الاستقرار في سير عمل الإنتاج الحقيقي. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك.

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تؤثر الشروط التجارية وخيارات النشر على التكلفة والمخاطر على المدى الطويل.

تؤثر الشروط التجارية وخيارات النشر على التكلفة والمخاطر على المدى الطويل. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل حوافز الشركة على تشكيل الإعدادات الافتراضية للمنتج، ووضعية السلامة، والانفتاح.

تعمل حوافز الشركة على تشكيل الإعدادات الافتراضية للمنتج، ووضعية السلامة، والانفتاح. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل الذكاء الجسدي وpi-zero

يسعى الذكاء الجسدي إلى اتباع نماذج عامة أكثر من أي وقت مضى (الإصدارات اللاحقة والإصدارات المفتوحة مثل متغيرات pi-zero) التي تتبع تعليمات مفتوحة ومهام متسلسلة طويلة المدى. توقع موثوقية أفضل على الكائنات الجديدة، وتكيفًا أسرع مع الروبوتات الجديدة، والتفكير المنطقي الذي يربط تخطيط اللغة بالتحكم منخفض المستوى. ويظل التحدي الرئيسي هو جمع ما يكفي من بيانات التلاعب المتنوعة والعالية الجودة في العالم الحقيقي. إذا نجح الأمر، فقد يصبح "عقل الروبوت" الوحيد القابل للتنزيل بنية تحتية قياسية لصناعة الروبوتات.

التنفيذ في العالم الحقيقي

يستخدم الروبوت ذو الذراعين pi-zero لأخذ الملابس المجعدة من المجفف وطيها بشكل أنيق على الطاولة.

يقوم روبوت المطعم بنقل الطاولات وتنظيف الأطباق والقمامة باتباع تعليمات اللغة الطبيعية.

يقوم روبوت المستودع بتسوية الصناديق الكرتونية وأكياس البقالة باستخدام نفس السياسة العامة.

تعمل مختبرات الروبوتات على ضبط pi-zero على أذرعها لتعزيز مهارات التلاعب الجديدة دون تدريب النموذج من الصفر.

أنماط التنفيذ

الذكاء الجسدي وباي صفر في الممارسة العملية

يستخدم الروبوت ذو الذراعين pi-zero لأخذ الملابس المجعدة من المجفف وطيها بشكل أنيق على الطاولة.

يستخدم الروبوت ذو الذراعين pi-zero لأخذ الملابس المجعدة من المجفف وطيها بشكل أنيق على الطاولة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري للحالات الطرفية، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الجسدي وباي صفر في الممارسة العملية

يقوم روبوت المطعم بنقل الطاولات وتنظيف الأطباق والقمامة باتباع تعليمات اللغة الطبيعية.

يقوم روبوت المطعم بنقل الطاولات وتنظيف الأطباق والقمامة، باتباع تعليمات اللغة الطبيعية، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري للحالات الطرفية، وتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الجسدي وباي صفر في الممارسة العملية

يقوم روبوت المستودع بتسوية الصناديق الكرتونية وأكياس البقالة باستخدام نفس السياسة العامة.

يقوم روبوت المستودع بتسوية الصناديق الكرتونية وأكياس مواد البقالة باستخدام نفس السياسة العامة. عادة ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الجسدي وباي صفر في الممارسة العملية

تعمل مختبرات الروبوتات على ضبط pi-zero على أذرعها لتعزيز مهارات التلاعب الجديدة دون تدريب النموذج من الصفر.

تعمل مختبرات الروبوتات على ضبط pi-zero على أذرعها لبدء مهارات معالجة جديدة دون تدريب نموذج من الصفر. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

قد تتجاوز إعلانات الإطلاق الاستقرار في سير عمل الإنتاج الحقيقي.

!

يمكن أن يؤدي تسعير واجهة برمجة التطبيقات (API) أو تغيرات السياسة إلى كسر الافتراضات بين عشية وضحاها.

!

يؤدي الاعتماد على بائع واحد إلى زيادة تكاليف الحجز والترحيل.

خارطة طريق التنفيذ

1

قم بتقييم مقدمي الخدمة باستخدام المهام ومجموعات البيانات الخاصة بك.

قم بتقييم مقدمي الخدمة باستخدام المهام ومجموعات البيانات الخاصة بك. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

راجع الخصوصية والأمان والمصطلحات القانونية قبل التكامل.

راجع الخصوصية والأمان والمصطلحات القانونية قبل التكامل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

احتفظ بخطة احتياطية عبر النماذج أو البائعين.

احتفظ بخطة احتياطية عبر النماذج أو البائعين. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

راقب ملاحظات الإصدار حتى لا تفاجئ التغييرات في خارطة الطريق الفرق.

راقب ملاحظات الإصدار حتى لا تفاجئ التغييرات في خارطة الطريق الفرق. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف