دليل الشركات

Google Gemini

Google Gemini هي Google عائلة DeepMind المكونة من نماذج الذكاء الاصطناعي متعددة الوسائط التي يمكنها التفكير عبر النصوص والصور والصوت والفيديو والتعليمات البرمجية.

نظرة عامة

Google Gemini هي Google عائلة DeepMind المكونة من نماذج الذكاء الاصطناعي متعددة الوسائط التي يمكنها التفكير عبر النصوص والصور والصوت والفيديو والتعليمات البرمجية. فهو يدعم برنامج الدردشة الآلي الخاص بـ Google ونظرات عامة على البحث ومساحة العمل، ويتنافس وجهاً لوجه مع نماذج GPT الخاصة بـ OpenAI.

من الأفضل فهم Google Gemini في سياق الإستراتيجية والوصول إلى النماذج وقرارات النظام الأساسي وشراكات النظام البيئي.

الغوص العميق

تم إطلاق Gemini في ديسمبر 2023 بثلاثة أحجام: Ultra وPro وNano (الإصدار الموجود على الجهاز الذي يعمل على هواتف Pixel). على عكس النماذج السابقة المثبتة على جهاز تشفير رؤية منفصل، تم تدريب Gemini منذ البداية على النصوص والصور والصوت والفيديو المتداخلة، بحيث يمكنه، على سبيل المثال، مشاهدة مقطع فيديو صامت وشرح ما يحدث. قدم الجيل Gemini 1.5 تصميمًا مختلطًا من الخبراء ونافذة سياقية ضخمة، أول مليون ثم ما يصل إلى 2 مليون رمز مميز، وهو ما يكفي لاستيعاب قواعد التعليمات البرمجية بأكملها، أو ملفات PDF الطويلة، أو ساعات من الفيديو في وقت واحد. حل Gemini محل Bard (برنامج الدردشة الآلية) وواجهات برمجة التطبيقات القديمة للمطورين المستندة إلى PaLM، مما أدى إلى توحيد الذكاء الاصطناعي للمستهلك والمؤسسات في Google تحت علامة تجارية واحدة وتعزيز الميزات عبر Android وChrome وWorkspace.

البصيرة الفنية

Gemini هو نموذج قائم على المحولات ومصمم على طراز وحدة فك التشفير تم تدريبه باستخدام بنية Mixture of Experts (MoE) في أجياله التي تزيد عن 1.5 عامًا: بدلاً من تنشيط جميع المعلمات لكل رمز مميز، يرسل جهاز التوجيه كل رمز مميز إلى مجموعة فرعية صغيرة من الشبكات الفرعية "الخبيرة" المتخصصة، مما يؤدي إلى قطع الحوسبة. وتعني تعدد الوسائط الأصلية أن الصور والصوت والفيديو يتم ترميزها في نفس التسلسل مثل النص، مما يسمح لآلية انتباه واحدة بالتفكير بشكل مشترك عبر جميع الأساليب بدلاً من دمج نماذج منفصلة معًا.

إتقان Google Gemini

Google Gemini هي Google عائلة DeepMind المكونة من نماذج الذكاء الاصطناعي متعددة الوسائط التي يمكنها التفكير عبر النصوص والصور والصوت والفيديو والتعليمات البرمجية. فهو يدعم برنامج الدردشة الآلي الخاص بـ Google ونظرات عامة على البحث ومساحة العمل، ويتنافس وجهاً لوجه مع نماذج GPT الخاصة بـ OpenAI. من الأفضل فهم Google Gemini في سياق الإستراتيجية والوصول إلى النماذج وقرارات النظام الأساسي وشراكات النظام البيئي. لبناء فهم عميق، تعامل مع Google Gemini كنموذج تشغيل، وليس كميزة واحدة: حدد النتائج المرغوبة، ووضح الافتراضات، وافصل ما يمكن للنظام القيام به بشكل موثوق عما لا يزال يتطلب حكم الخبراء.

من الناحية العملية، تقوم الفرق القوية التي تستخدم Google Gemini بتقييم استراتيجية البائع وموثوقية خريطة الطريق ومخاطر القفل قبل الالتزام. وهي تقوم بتوثيق معايير نجاح واضحة، واختبارها مقابل بيانات واقعية وسير العمل، والتكرار بناءً على أنماط الفشل الملحوظة بدلاً من الانتصارات المعيارية لمرة واحدة. وهذا هو المكان الذي يتحول فيه الفهم النظري إلى قدرة دائمة عبر المنتج والسياسة والعمليات.

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك. وفي الوقت نفسه، قد تتجاوز إعلانات الإطلاق الاستقرار في سير عمل الإنتاج الحقيقي. ويتمثل النهج الأكثر مرونة في الجمع بين سرعة التجريب وانضباط الحوكمة: تشغيل البرامج التجريبية، والتقاط الأدلة، ونشر سجلات القرارات، وتحديث الضمانات بشكل مستمر مع تطور سلوك النموذج، وتوقعات المستخدم، والمتطلبات التنظيمية.

التأثير الاستراتيجي

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك.

تؤثر خرائط طريق البائع على الميزات التي يمكن لفريقك إنشاءها بعد ذلك. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تؤثر الشروط التجارية وخيارات النشر على التكلفة والمخاطر على المدى الطويل.

تؤثر الشروط التجارية وخيارات النشر على التكلفة والمخاطر على المدى الطويل. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

تعمل حوافز الشركة على تشكيل الإعدادات الافتراضية للمنتج، ووضعية السلامة، والانفتاح.

تعمل حوافز الشركة على تشكيل الإعدادات الافتراضية للمنتج، ووضعية السلامة، والانفتاح. وفي عمليات النشر عالية الجودة، تتم ترجمة ذلك إلى قواعد تشغيل قابلة للقياس، وحدود ملكية، وطقوس مراجعة متكررة حتى تتمكن الفرق من توسيع نطاق الثقة بدلاً من توسيع نطاق الغموض.

مستقبل Google Gemini

Google تدفع Gemini نحو السلوك الوكيل، والنماذج التي تخطط وتستخدم الأدوات وتتخذ إجراءات متعددة الخطوات نيابة عن المستخدم، والتي تتجسد في الجهود البحثية مثل Project Astra (مساعد متعدد الوسائط في الوقت الفعلي) وProject Mariner (وكلاء الويب). توقع تكاملًا أعمق عبر Android وChrome وWorkspace، ونوافذ سياقية أطول وأرخص، ومتغيرات Nano على الجهاز تعمل بشكل أكبر محليًا من أجل الخصوصية. من المرجح أن يستمر الاقتران الأكثر إحكامًا مع Google للبحث وأجهزة TPU المُحسّنة للموتر في تقليل زمن الوصول والتكلفة.

التنفيذ في العالم الحقيقي

تلخيص ملف PDF مكون من 1500 صفحة أو فيديو محاضرة مدته ساعة تم تحميله مباشرة إلى تطبيق Gemini

إنشاء نظرة عامة على الذكاء الاصطناعي في الجزء العلوي من Google نتائج البحث للاستعلامات المعقدة

صياغة رسائل البريد الإلكتروني وتلخيص المواضيع وتحليل جداول البيانات داخل Gmail والمستندات وجداول البيانات عبر Gemini في Workspace

تشغيل الميزات الموجودة على الجهاز مثل ملخصات المكالمات والردود الذكية من خلال Gemini Nano على هواتف Pixel دون إرسال البيانات إلى السحابة

أنماط التنفيذ

Google Gemini عمليًا

تلخيص ملف PDF مكون من 1500 صفحة أو مقطع فيديو لمحاضرة مدته ساعة تم تحميله مباشرة إلى تطبيق Gemini.

تلخيص ملف PDF مكون من 1500 صفحة أو مقطع فيديو محاضرة مدته ساعة تم تحميله مباشرةً في تطبيق Gemini تحصل الفرق عادةً على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

Google Gemini عمليًا

إنشاء نظرة عامة على الذكاء الاصطناعي في أعلى Google نتائج البحث للاستعلامات المعقدة.

إنشاء نظرة عامة على الذكاء الاصطناعي في الجزء العلوي من Google نتائج البحث للاستعلامات المعقدة عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

Google Gemini عمليًا

صياغة رسائل البريد الإلكتروني وتلخيص المواضيع وتحليل جداول البيانات داخل Gmail والمستندات وجداول البيانات عبر Gemini في Workspace.

عادةً ما تحصل صياغة رسائل البريد الإلكتروني وتلخيص سلاسل المحادثات وتحليل جداول البيانات داخل Gmail والمستندات وجداول البيانات عبر Gemini في فرق Workspace على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

Google Gemini عمليًا

تشغيل الميزات الموجودة على الجهاز مثل ملخصات المكالمات والردود الذكية من خلال Gemini Nano على هواتف Pixel دون إرسال البيانات إلى السحابة.

تشغيل الميزات الموجودة على الجهاز مثل ملخصات المكالمات والردود الذكية من خلال Gemini Nano على هواتف Pixel دون إرسال البيانات إلى السحابة. عادةً ما تحصل الفرق على نتائج أفضل عندما تحدد حدود الجودة مقدمًا، وتحتفظ بمسار تصعيد بشري لحالات الحافة، وتتتبع مكاسب الإنتاجية وتكاليف الأخطاء بمرور الوقت.

المخاطر والدرابزين

!

قد تتجاوز إعلانات الإطلاق الاستقرار في سير عمل الإنتاج الحقيقي.

!

يمكن أن يؤدي تسعير واجهة برمجة التطبيقات (API) أو تغيرات السياسة إلى كسر الافتراضات بين عشية وضحاها.

!

يؤدي الاعتماد على بائع واحد إلى زيادة تكاليف الحجز والترحيل.

خارطة طريق التنفيذ

1

قم بتقييم مقدمي الخدمة باستخدام المهام ومجموعات البيانات الخاصة بك.

قم بتقييم مقدمي الخدمة باستخدام المهام ومجموعات البيانات الخاصة بك. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

2

راجع الخصوصية والأمان والمصطلحات القانونية قبل التكامل.

راجع الخصوصية والأمان والمصطلحات القانونية قبل التكامل. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

3

احتفظ بخطة احتياطية عبر النماذج أو البائعين.

احتفظ بخطة احتياطية عبر النماذج أو البائعين. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

4

راقب ملاحظات الإصدار حتى لا تفاجئ التغييرات في خارطة الطريق الفرق.

راقب ملاحظات الإصدار حتى لا تفاجئ التغييرات في خارطة الطريق الفرق. تعامل مع كل خطوة كبوابة دليل: إذا لم يتم استيفاء المعايير، قم بإيقاف التشغيل مؤقتًا، وسد الفجوة، وبعد ذلك فقط قم بتوسيع الاستخدام.

استمر في الاستكشاف