دليل التطبيقات

الذكاء الاصطناعي في أنظمة التوصية بالموسيقى

يقرر الذكاء الاصطناعي الأغنية التي سيتم تشغيلها بعد ذلك من خلال التعرف على ذوقك من مليارات إشارات الاستماع وصوت الموسيقى نفسها.

نظرة عامة

يقرر الذكاء الاصطناعي الأغنية التي سيتم تشغيلها بعد ذلك من خلال التعرف على ذوقك من مليارات إشارات الاستماع وصوت الموسيقى نفسها. إنه أمر مهم لأنه يشكل كيفية اكتشاف معظم الأشخاص للموسيقى اليوم وكيفية وصول الفنانين إلى معجبين جدد.

يركز الذكاء الاصطناعي في أنظمة توصية الموسيقى على النشر العملي: تحويل قدرة النموذج إلى سير عمل يومي موثوق به يقدم قيمة قابلة للقياس.

الغوص العميق

يمزج موصيو الموسيقى بين عدة تقنيات. تعمل التصفية التعاونية على العثور على مستمعين لديهم عادات مماثلة وتقترح ما استمتعوا به ("الأشخاص الذين يحبون هذا يحبون هذا أيضًا")، وهو أمر قوي ولكنه يعاني من المسارات الجديدة أو الغامضة، مشكلة "البداية الباردة". لإصلاح ذلك، تقوم الخدمات بتحليل الصوت نفسه: تقوم الشبكات العصبية بتحويل الأغنية إلى مخطط طيفي وتتعلم ميزات مثل الإيقاع والطاقة والمفتاح والحالة المزاجية، بحيث يمكن مطابقة التحميل الجديد مع موسيقى ذات صوت مماثل بدون تشغيل. تعمل نماذج اللغة الطبيعية على استخراج المراجعات وقوائم التشغيل وكلمات الأغاني من أجل السياق. على سبيل المثال، تجمع خدمة Discover Weekly من Spotify بين الإشارات التعاونية والنماذج الصوتية وتحليل كيفية تجميع الأغاني معًا في قوائم التشغيل التي أنشأها المستخدم لإنشاء مزيج مخصص مكون من 30 مسارًا كل أسبوع.

البصيرة الفنية

تمثل العديد من الأنظمة كل مستخدم وكل مسار كمتجهات في مساحة "تضمين" مشتركة، ويتم تعلمها عن طريق تحليل المصفوفة أو الشبكات العصبية ذات البرجين. كلما اقترب المتجهان، كلما كانت المطابقة أفضل، لذلك تصبح التوصية بحثًا سريعًا عن أقرب جار عبر ملايين العناصر. تضيف نماذج المحتوى الصوتي برجًا ثانيًا يقوم بتعيين شكل موجة خام أو مخطط طيفي في نفس المساحة، مما يسمح بوضع أغنية لم يتم تشغيلها من قبل بالقرب من الأغاني المشابهة صوتيًا.

إتقان الذكاء الاصطناعي في أنظمة التوصية الموسيقية

يقرر الذكاء الاصطناعي الأغنية التي سيتم تشغيلها بعد ذلك من خلال التعرف على ذوقك من مليارات إشارات الاستماع وصوت الموسيقى نفسها. إنه أمر مهم لأنه يشكل كيفية اكتشاف معظم الأشخاص للموسيقى اليوم وكيفية وصول الفنانين إلى معجبين جدد. يركز الذكاء الاصطناعي في أنظمة توصية الموسيقى على النشر العملي: تحويل قدرة النموذج إلى سير عمل يومي موثوق به يقدم قيمة قابلة للقياس. لبناء فهم عميق، يجب التعامل مع الذكاء الاصطناعي في أنظمة التوصية الموسيقية كنموذج تشغيل، وليس كميزة واحدة: تحديد النتائج المرجوة، وتوضيح الافتراضات، وفصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تركز الفرق القوية التي تستخدم الذكاء الاصطناعي في أنظمة التوصية الموسيقية على نتائج سير العمل، وليس العروض التوضيحية النموذجية، وتحدد نقاط التفتيش البشرية مبكرًا. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي الوقت نفسه، يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية.

يحدد التصميم على مستوى التطبيق ما إذا كان الذكاء الاصطناعي سيحسن النتائج الحقيقية. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها.

يؤدي التكامل الجيد لسير العمل إلى تحقيق مكاسب إنتاجية يمكن للمستخدمين الوثوق بها. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ.

تعمل حالات الاستخدام ذات النطاق الجيد على تقليل إجهاد التغيير ومخاطر التنفيذ. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل الذكاء الاصطناعي في أنظمة التوصية الموسيقية

توقع أن يصبح مقدمو التوصيات أكثر تحادثًا ووعيًا بالسياق: ستطلب بلغة واضحة "موسيقى تركيز مبهجة بدون غناء"، وسوف تستجيب الأنظمة باستخدام نماذج متعددة الوسائط. يثير الذكاء الاصطناعي التوليدي أسئلة جديدة بينما يتتبع الذكاء الاصطناعي كتالوجات الفيضان، وستحتاج المنصات إلى اكتشافها وتصنيفها وتحديد كيفية ظهورها. هناك أيضًا اهتمام متزايد بالعدالة، مما يدفع الاكتشاف نحو الفنانين الصغار بدلاً من تعزيز عدد قليل من الأغاني الناجحة.

التنفيذ في العالم الحقيقي

تعمل ميزة Discover Weekly وDaily Mixes من Spotify على إنشاء قوائم تشغيل مخصصة من سجل الاستماع والتحليل الصوتي

يقوم YouTube Music وApple Music بتشغيل راديو مستمر يحتوي على مسارات مماثلة تلقائيًا بعد انتهاء قائمة الانتظار

يقوم مشروع Pandora's Music Genome بوضع علامات على الأغاني حسب السمات الموسيقية التفصيلية لتوصيات محطة الوقود

يتميز نمط Shazam بتحديد الأغنية ثم اقتراح فنانين مشابهين لاستكشافها بعد ذلك

أنماط التنفيذ

الذكاء الاصطناعي في أنظمة التوصية الموسيقية في الممارسة العملية

تعمل ميزة Discover Weekly وDaily Mixes من Spotify على إنشاء قوائم تشغيل مخصصة من سجل الاستماع والتحليل الصوتي.

تعمل ميزة Discover Weekly وDaily Mixes من Spotify على إنشاء قوائم تشغيل مخصصة من سجل الاستماع والتحليل الصوتي، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في أنظمة التوصية الموسيقية في الممارسة العملية

يقوم YouTube Music وApple Music بتشغيل راديو مستمر يحتوي على مسارات مماثلة تلقائيًا بعد انتهاء قائمة الانتظار.

يقوم YouTube Music وApple Music بتشغيل راديو مستمر من المقاطع الصوتية المشابهة تلقائيًا بعد انتهاء قائمة الانتظار. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في أنظمة التوصية الموسيقية في الممارسة العملية

يقوم مشروع Pandora's Music Genome بوضع علامات على الأغاني حسب السمات الموسيقية التفصيلية لتوصيات محطة الوقود.

يقوم مشروع Pandora's Music Genome بوضع علامات على الأغاني من خلال سمات موسيقية مفصلة لتوصيات محطة الوقود، وعادةً ما تحصل الفرق على نتائج أفضل عندما تحدد عتبات الجودة مقدمًا، وتحافظ على مسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

الذكاء الاصطناعي في أنظمة التوصية الموسيقية في الممارسة العملية

يتميز نمط Shazam بتحديد الأغنية ثم اقتراح فنانين مشابهين لاستكشافها بعد ذلك.

ميزات نمط Shazam تحدد أغنية ثم تقترح فنانين مشابهين لاستكشافها بعد ذلك. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

يمكن أن تؤدي أتمتة عملية معطلة إلى تضخيم المشاكل الموجودة.

!

قد تقوم الفرق بالإفراط في أتمتة وإزالة الحكم البشري المطلوب.

!

يمكن أن تنحرف الجودة إذا لم يتم تقييم المخرجات بشكل مستمر.

خارطة طريق التنفيذ

1

قم بتخطيط سير العمل الحالي وحدد خطوة الاحتكاك الأعلى.

قم بتخطيط سير العمل الحالي وحدد خطوة الاحتكاك الأعلى. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

تحديد نقاط التفتيش البشرية قبل الأتمتة الكاملة.

تحديد نقاط التفتيش البشرية قبل الأتمتة الكاملة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

تدريب المستخدمين على المطالبات ومسارات التصعيد ومعايير الجودة.

تدريب المستخدمين على المطالبات ومسارات التصعيد ومعايير الجودة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

تتبع النتائج على مستوى المهمة لتأكيد القيمة المستدامة.

تتبع النتائج على مستوى المهمة لتأكيد القيمة المستدامة. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف