دليل الذكاء الاصطناعي المرئي

تقدير الوضع البشري

يكتشف تقدير وضعية الإنسان مواقع مفاصل الجسم، مثل المرفقين والركبتين والكتفين، لبناء هيكل عظمي رقمي للشخص من الصور أو الفيديو.

نظرة عامة

يكتشف تقدير وضعية الإنسان مواقع مفاصل الجسم، مثل المرفقين والركبتين والكتفين، لبناء هيكل عظمي رقمي للشخص من الصور أو الفيديو. فهو يحول وحدات البكسل الأولية إلى بيانات منظمة حول كيفية تحرك الأشخاص.

ينتمي تقدير الوضع البشري إلى سير عمل الرؤية الحاسوبية التي تفسر أو تولد وسائط مرئية للتحليل والعمليات والإبداع.

الغوص العميق

يحدد تقدير الوضعية مجموعة من نقاط الجسم الرئيسية (عادةً من 17 إلى 33 مفصلاً) ويربطها بالهيكل العظمي. توجد استراتيجيتان رئيسيتان. تكتشف الطرق من أعلى إلى أسفل أولاً كل شخص لديه صندوق محيط، ثم تقدر المفاصل بداخله؛ فهي دقيقة ولكنها بطيئة عند وجود العديد من الأشخاص. تكتشف الأساليب من أسفل إلى أعلى، مثل OpenPose، جميع النقاط الرئيسية في الصورة مرة واحدة ثم تقوم بتجميعها في مجموعات فردية، وهو ما يتوسع بشكل أفضل في الحشود. يمكن للنماذج إخراج إحداثيات ثنائية الأبعاد أو تحويلها إلى إحداثيات ثلاثية الأبعاد. تشمل الأدوات الشائعة OpenPose وMoveNet وMediaPipe من Google وHRNet، التي تحافظ على الميزات عالية الدقة للتوطين المشترك الدقيق. تعمل هذه التقنية على تشغيل تطبيقات اللياقة البدنية والتقاط الحركة والتحليلات الرياضية.

البصيرة الفنية

بدلًا من تراجع إحداثيات المفاصل مباشرةً، تتنبأ النماذج الأكثر دقة بخريطة حرارية لكل مفصل، وهي خريطة احتمالية تحدد بيكسلاتها الأكثر سطوعًا الموقع المشترك المحتمل. تضيف الأنظمة من الأسفل إلى الأعلى حقول تقارب الأجزاء، وهي خرائط متجهة تشفر اتجاه الأطراف، بحيث يمكن ربط نقاط المفاتيح المكتشفة بالهياكل العظمية الصحيحة حتى مع الأشخاص المتداخلين. تحافظ الهياكل الأساسية عالية الدقة مثل HRNet على تفاصيل مكانية دقيقة في جميع أنحاء الشبكة، مما يؤدي إلى تحسين الدقة للمفاصل الصغيرة أو المتقاربة.

إتقان تقدير الموقف البشري

يكتشف تقدير وضعية الإنسان مواقع مفاصل الجسم، مثل المرفقين والركبتين والكتفين، لبناء هيكل عظمي رقمي للشخص من الصور أو الفيديو. فهو يحول وحدات البكسل الأولية إلى بيانات منظمة حول كيفية تحرك الأشخاص. ينتمي تقدير الوضع البشري إلى سير عمل الرؤية الحاسوبية التي تفسر أو تولد وسائط مرئية للتحليل والعمليات والإبداع. لبناء فهم عميق، تعامل مع تقدير الوضع البشري كنموذج تشغيلي، وليس كميزة واحدة: حدد النتائج المرغوبة، ووضح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تستخدم الفرق القوية تقنية Human Pose Estimation لموازنة الدقة مع الحقائق التشغيلية مثل جودة البيانات، وتباين الإضاءة، واتساق الملصقات. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يمكن للذكاء الاصطناعي المرئي أتمتة مهام الفحص والكشف ووضع العلامات على نطاق واسع. وفي الوقت نفسه، يمكن أن تصبح حقوق الصور والموافقة مخاطر قانونية إذا كان المصدر غير واضح. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يمكن للذكاء الاصطناعي المرئي أتمتة مهام الفحص والكشف ووضع العلامات على نطاق واسع.

يمكن للذكاء الاصطناعي المرئي أتمتة مهام الفحص والكشف ووضع العلامات على نطاق واسع. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يمكن للفرق الإبداعية إنشاء نماذج أولية للمفاهيم بشكل أسرع مع عدد أقل من المراجعات اليدوية.

يمكن للفرق الإبداعية إنشاء نماذج أولية للمفاهيم بشكل أسرع مع عدد أقل من المراجعات اليدوية. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يمكن أن تستخدم العمليات إشارات الصور والفيديو التي كان من الصعب معالجتها في السابق.

يمكن أن تستخدم العمليات إشارات الصور والفيديو التي كان من الصعب معالجتها في السابق. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل تقدير الوضع البشري

يتجه تقدير الوضعية نحو التصوير ثلاثي الأبعاد في الوقت الفعلي على الأجهزة الاستهلاكية، والتتبع القوي لعدة أشخاص، ونماذج الجسم بالكامل بالإضافة إلى اليد والوجه لالتقاط تعبيرات أكثر ثراءً. يحل التقاط الحركة بدون علامات محل بدلات الاستوديو باهظة الثمن في الأفلام والميكانيكا الحيوية. توقع اندماجًا أكثر صرامة مع التعرف على الحركة لفهم ليس فقط الوضعية بل النشاط، والاستخدام المتزايد في الرعاية الصحية لتحليل المشية وإعادة التأهيل، والنماذج الموجودة على الجهاز التي تحمي الخصوصية من خلال عدم إرسال الفيديو إلى السحابة مطلقًا.

التنفيذ في العالم الحقيقي

تطبيقات اللياقة البدنية واليوجا التي تتحقق من شكل المستخدم وتحسب التكرارات من كاميرا الهاتف

التقاط حركة بدون علامات لتحريك الشخصيات في الأفلام وألعاب الفيديو

تحليلات رياضية تقيس زوايا مفصل الرياضي وخطوته وتقنياته

العلاج الطبيعي وتحليل المشية يتتبع تعافي المريض وجودة حركته

أنماط التنفيذ

تقدير وضع الإنسان في الممارسة العملية

تطبيقات اللياقة البدنية واليوجا التي تتحقق من شكل المستخدم وتحسب التكرارات من كاميرا الهاتف.

تطبيقات اللياقة البدنية واليوجا التي تتحقق من نموذج المستخدم وتحسب التكرارات من كاميرا الهاتف، عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

تقدير وضع الإنسان في الممارسة العملية

التقاط حركة بدون علامات لتحريك الشخصيات في الأفلام وألعاب الفيديو.

التقاط حركة بدون علامات لتحريك الشخصيات في الأفلام وألعاب الفيديو عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

تقدير وضع الإنسان في الممارسة العملية

تحليلات رياضية تقيس زوايا مفصل الرياضي وخطوته وتقنياته.

تحليلات رياضية تقيس زوايا المفاصل والخطوات والتقنيات للرياضي عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحافظ على مسار التصعيد البشري للحالات الطرفية، وتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

تقدير وضع الإنسان في الممارسة العملية

العلاج الطبيعي وتحليل المشية يتتبع تعافي المريض وجودة حركته.

العلاج الطبيعي وتحليل المشية الذي يتتبع تعافي المريض وجودة الحركة عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحافظ على مسار تصعيد بشري للحالات الطرفية، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن تصبح حقوق الصور والموافقة مخاطر قانونية إذا كان المصدر غير واضح.

!

يمكن أن يختلف أداء النموذج عبر الإضاءة والتركيبة السكانية والبيئات.

!

قد تمر الإيجابيات الكاذبة دون أن يلاحظها أحد ما لم تتم مراقبة عتبات الثقة.

خارطة طريق التنفيذ

1

تحديد معايير القبول لتكاليف الدقة والاستدعاء والخطأ.

تحديد معايير القبول لتكاليف الدقة والاستدعاء والخطأ. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

اختبار مع البيانات التي تتوافق مع ظروف الإنتاج الحقيقية.

اختبار مع البيانات التي تتوافق مع ظروف الإنتاج الحقيقية. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

أضف مراجعة بشرية للتنبؤات منخفضة الثقة أو عالية التأثير.

أضف مراجعة بشرية للتنبؤات منخفضة الثقة أو عالية التأثير. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

تتبع انحراف النموذج وإعادة التحقق من صحته بعد تغيير الكاميرا أو مجموعة البيانات.

تتبع انحراف النموذج وإعادة التحقق من صحته بعد تغيير الكاميرا أو مجموعة البيانات. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف