دليل التطبيقات

الذكاء الاصطناعي في الإشراف على محتوى الفيديو

يقوم الذكاء الاصطناعي بمراجعة مقاطع الفيديو التي تم تحميلها وبثها مباشرة للكشف عن المواد الضارة مثل العنف أو العري أو خطاب الكراهية بشكل أسرع بكثير مما يستطيع المشرفون البشريون القيام به بمفردهم.

نظرة عامة

يقوم الذكاء الاصطناعي بمراجعة مقاطع الفيديو التي تم تحميلها وبثها مباشرة للكشف عن المواد الضارة مثل العنف أو العري أو خطاب الكراهية بشكل أسرع بكثير مما يستطيع المشرفون البشريون القيام به بمفردهم. وهذا مهم لأن المنصات تتلقى مئات الساعات من الفيديو كل دقيقة، مما يجعل المراجعة اليدوية مستحيلة على نطاق واسع.

يركز الذكاء الاصطناعي في إدارة محتوى الفيديو على النشر العملي: تحويل قدرة النموذج إلى سير عمل يومي موثوق به يقدم قيمة قابلة للقياس.

الغوص العميق

يعد الإشراف على الفيديو متعدد الوسائط: مقطع واحد يحمل الصور والحركة والصوت والنص الذي يظهر على الشاشة. تقوم الأنظمة باختبار الإطارات وتشغيل مصنفات الرؤية الحاسوبية لاكتشاف العري أو الأسلحة أو الدماء أو الرموز المتطرفة؛ ويقومون بتحليل الحركة عبر الإطارات للإبلاغ عن أعمال العنف؛ يقوم تحويل الكلام إلى نص بنسخ الصوت حتى تتمكن نماذج البرمجة اللغوية العصبية من اكتشاف خطاب الكراهية أو التهديدات؛ ويقوم التعرف البصري على الأحرف بقراءة النص المتراكب على الفيديو. إحدى التقنيات الحاسمة هي التجزئة: يتم تحويل مقاطع الفيديو الضارة المعروفة (مثل الدعاية الإرهابية أو مواد إساءة معاملة الأطفال) إلى بصمات أصابع رقمية بحيث يتم حظر إعادة التحميل على الفور دون إعادة تحليل. نظرًا لأن السياق مهم، فإن التقرير الإخباري الذي يظهر العنف يختلف عن تمجيده، وتستخدم معظم المنصات الذكاء الاصطناعي لفرز الحالات وتحديد الأولويات، ثم توجيه الحالات الغامضة إلى المراجعين البشريين.

البصيرة الفنية

تؤدي التجزئة الإدراكية (مثل PhotoDNA وPDQ للصور، بالإضافة إلى متغيرات تجزئة الفيديو) إلى إنشاء بصمة قوية لتغيير الحجم أو إعادة الضغط أو التعديلات البسيطة، لذا فإن إعادة التحميل التي تم تغييرها قليلاً لا تزال تتطابق مع إدخال معروف سيئ في قواعد بيانات الصناعة المشتركة. بالنسبة للمحتوى الجديد، تعمل المصنفات العميقة على إطارات ومقاطع صوتية تم أخذ عينات منها، مما ينتج عنه درجات الثقة؛ يتم تصعيد العناصر القريبة فقط من حدود القرار إلى البشر، مما يبقي التكلفة ووقت الاستجابة تحت السيطرة عند مليارات التحميلات.

إتقان الذكاء الاصطناعي في الإشراف على محتوى الفيديو

يقوم الذكاء الاصطناعي بمراجعة مقاطع الفيديو التي تم تحميلها وبثها مباشرة للكشف عن المواد الضارة مثل العنف أو العري أو خطاب الكراهية بشكل أسرع بكثير مما يستطيع المشرفون البشريون القيام به بمفردهم. وهذا مهم لأن المنصات تتلقى مئات الساعات من الفيديو كل دقيقة، مما يجعل المراجعة اليدوية مستحيلة على نطاق واسع. يركز الذكاء الاصطناعي في إدارة محتوى الفيديو على النشر العملي: تحويل قدرة النموذج إلى سير عمل يومي موثوق به يقدم قيمة قابلة للقياس. لبناء فهم عميق، تعامل مع الذكاء الاصطناعي في الإشراف على محتوى الفيديو كنموذج تشغيل، وليس كميزة واحدة: حدد النتائج المرغوبة، ووضح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تركز الفرق القوية التي تستخدم الذكاء الاصطناعي في الإشراف على محتوى الفيديو على نتائج سير العمل، وليس العروض التوضيحية النموذجية، وتحدد نقاط التفتيش البشرية مبكرًا. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي الوقت نفسه، يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل الذكاء الاصطناعي في الإشراف على محتوى الفيديو

تتجه النماذج نحو الفهم الحقيقي للفيديو، والتفكير في سرد ​​مقطع كامل بدلاً من الإطارات المنعزلة، مما يساعد على فصل التوثيق عن التمجيد. يعد الإشراف على البث المباشر في الوقت الفعلي محورًا رئيسيًا بعد الإخفاقات البارزة. وفي الوقت نفسه، يعمل الذكاء الاصطناعي التوليدي على تسهيل إنتاج المحتوى المزيف العميق ومحتوى الإساءة الاصطناعية، لذا أصبح اكتشاف مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتلاعب بها، بالإضافة إلى تصنيفات المصدر، أمرًا أساسيًا في أعمال الثقة والسلامة.

التنفيذ في العالم الحقيقي

يكتشف YouTube تلقائيًا ويقيد العمر أو يزيل العنف المصور والعري في التحميلات

Meta ومنصات أخرى تستخدم قواعد بيانات التجزئة المشتركة (عبر GIFCT) لمنع الدعاية الإرهابية المعروفة عبر الخدمات

يقوم TikTok بمسح البث المباشر في الوقت الفعلي تقريبًا لمقاطعة محتوى العري أو إيذاء النفس

تقوم المنصات بنسخ الصوت لالتقاط خطاب الكراهية والتهديدات المنطوقة في مقاطع الفيديو، وليس فقط إظهارها بشكل مرئي

أنماط التنفيذ

الذكاء الاصطناعي في الإشراف على محتوى الفيديو عمليًا

يكتشف YouTube تلقائيًا ويقيد العمر أو يزيل العنف المصور والعري في التحميلات.

يكتشف YouTube تلقائيًا العنف المصور والعُري ويقيدهما حسب العمر أو يزيلهما في التحميلات، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في الإشراف على محتوى الفيديو عمليًا

Meta ومنصات أخرى تستخدم قواعد بيانات التجزئة المشتركة (عبر GIFCT) لمنع الدعاية الإرهابية المعروفة عبر الخدمات.

Meta ومنصات أخرى تستخدم قواعد بيانات التجزئة المشتركة (عبر GIFCT) لمنع الدعاية الإرهابية المعروفة عبر الخدمات. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في الإشراف على محتوى الفيديو عمليًا

يقوم TikTok بمسح البث المباشر في الوقت الفعلي تقريبًا لمقاطعة محتوى العري أو إيذاء النفس.

تقوم TikTok بمسح البث المباشر في الوقت الفعلي تقريبًا لمقاطعة محتوى العري أو محتوى الأذى الذاتي. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في الإشراف على محتوى الفيديو عمليًا

تقوم المنصات بنسخ الصوت لالتقاط خطاب الكراهية والتهديدات المنطوقة في مقاطع الفيديو، وليس فقط إظهارها بشكل مرئي.

تقوم الأنظمة الأساسية بنسخ الصوت لالتقاط خطاب الكراهية والتهديدات المنطوقة في مقاطع الفيديو، ولا تظهر فقط بشكل مرئي. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة.

!

قد تقوم الفرق بالإفراط في أتمتة وإزالة الحكم البشري المطلوب.

!

يمكن أن تنحرف الجودة إذا لم يتم تقييم المخرجات بشكل مستمر.

خارطة طريق التنفيذ

1

قم بتخطيط سير العمل الحالي وحدد خطوة الاحتكاك الأعلى.

قم بتخطيط سير العمل الحالي وحدد خطوة الاحتكاك الأعلى. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

تحديد نقاط التفتيش البشرية قبل الأتمتة الكاملة.

تحديد نقاط التفتيش البشرية قبل الأتمتة الكاملة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

تدريب المستخدمين على المطالبات ومسارات التصعيد ومعايير الجودة.

تدريب المستخدمين على المطالبات ومسارات التصعيد ومعايير الجودة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

تتبع النتائج على مستوى المهمة لتأكيد القيمة المستدامة.

تتبع النتائج على مستوى المهمة لتأكيد القيمة المستدامة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف