คู่มือบริษัท

Google Gemini

Google Gemini คือ Google กลุ่มโมเดล AI หลากหลายรูปแบบโดยธรรมชาติของ DeepMind ซึ่งสามารถให้เหตุผลผ่านข้อความ รูปภาพ เสียง วิดีโอ และโค้ด

ภาพรวม

Google Gemini คือ Google กลุ่มโมเดล AI หลากหลายรูปแบบโดยธรรมชาติของ DeepMind ซึ่งสามารถให้เหตุผลผ่านข้อความ รูปภาพ เสียง วิดีโอ และโค้ด โดยขับเคลื่อนแชทบอต ภาพรวมการค้นหา และพื้นที่ทำงานของ Google และแข่งขันแบบตัวต่อตัวกับโมเดล GPT ของ OpenAI

Google Gemini เป็นที่เข้าใจดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจเกี่ยวกับแพลตฟอร์ม และความร่วมมือในระบบนิเวศ

เจาะลึก

Gemini เปิดตัวในเดือนธันวาคม 2023 ใน 3 ขนาด ได้แก่ Ultra, Pro และ Nano (เวอร์ชันในอุปกรณ์ที่ทำงานบนโทรศัพท์ Pixel) Gemini ต่างจากรุ่นก่อนๆ ที่ติดเข้ากับตัวเข้ารหัสการมองเห็นแยกต่างหาก Gemini ได้รับการฝึกตั้งแต่เริ่มต้นเกี่ยวกับข้อความ รูปภาพ เสียง และวิดีโอที่แทรกสลับกัน ดังนั้นจึงสามารถดูวิดีโอแบบเงียบและอธิบายสิ่งที่เกิดขึ้นได้ เป็นต้น Gemini รุ่น 1.5 นำเสนอการออกแบบแบบผสมผสานของผู้เชี่ยวชาญและหน้าต่างบริบทขนาดใหญ่ 1 ล้านแรกจากนั้นสูงถึง 2 ล้านโทเค็น เพียงพอที่จะนำเข้าโค้ดเบสทั้งหมด, PDF ที่ยาว หรือชั่วโมงของวิดีโอในคราวเดียว Gemini แทนที่ทั้ง Bard (แชทบอต) และ API ของนักพัฒนาที่ใช้ PaLM แบบเก่า โดยเป็นการรวม AI สำหรับผู้บริโภคและองค์กรของ Google ไว้ภายใต้แบรนด์เดียว และขับเคลื่อนฟีเจอร์ต่างๆ ทั่วทั้ง Android, Chrome และ Workspace

ข้อมูลเชิงลึกทางเทคนิค

Gemini เป็นโมเดลสไตล์ตัวถอดรหัสที่ใช้ Transformer ซึ่งได้รับการฝึกฝนด้วยสถาปัตยกรรม Mixture-of-Experts (MoE) ในรุ่น 1.5 ขึ้นไป: แทนที่จะเปิดใช้งานพารามิเตอร์ทั้งหมดสำหรับโทเค็นทุกอัน เราเตอร์จะส่งแต่ละโทเค็นไปยังชุดย่อยเล็กๆ ของเครือข่ายย่อย 'ผู้เชี่ยวชาญ' เฉพาะทาง ซึ่งช่วยลดการประมวลผล ความหลากหลายแบบเนทิฟของมันหมายความว่ารูปภาพ เสียง และวิดีโอจะถูกโทเค็นให้เป็นลำดับเดียวกับข้อความ โดยปล่อยให้กลไกความสนใจเพียงข้อเดียวมีเหตุผลร่วมกันในทุกรูปแบบ แทนที่จะต่อโมเดลที่แยกจากกันเข้าด้วยกัน

การเรียนรู้ Google Gemini

Google Gemini คือ Google กลุ่มโมเดล AI หลากหลายรูปแบบโดยธรรมชาติของ DeepMind ซึ่งสามารถให้เหตุผลผ่านข้อความ รูปภาพ เสียง วิดีโอ และโค้ด โดยขับเคลื่อนแชทบอต ภาพรวมการค้นหา และพื้นที่ทำงานของ Google และแข่งขันแบบตัวต่อตัวกับโมเดล GPT ของ OpenAI Google Gemini เป็นที่เข้าใจดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจเกี่ยวกับแพลตฟอร์ม และความร่วมมือในระบบนิเวศ หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Google Gemini เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Google Gemini ประเมินกลยุทธ์ของผู้จำหน่าย ความน่าเชื่อถือของแผนงาน และความเสี่ยงในการล็อคอินก่อนตัดสินใจ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในขณะเดียวกัน การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ Google Gemini

Google กำลังผลักดัน Gemini ไปสู่พฤติกรรมแบบเอเจนต์ ซึ่งเป็นโมเดลที่วางแผน ใช้เครื่องมือ และดำเนินการหลายขั้นตอนในนามของผู้ใช้ เป็นตัวอย่างจากความพยายามในการวิจัย เช่น Project Astra (ผู้ช่วยหลายรูปแบบแบบเรียลไทม์) และ Project Mariner (ตัวแทนทางเว็บ) คาดหวังการผสานรวมที่ลึกซึ้งยิ่งขึ้นระหว่าง Android, Chrome และ Workspace หน้าต่างบริบทที่ยาวและราคาถูกกว่า และเวอร์ชันนาโนในอุปกรณ์ที่ทำงานเพื่อความเป็นส่วนตัวในพื้นที่มากขึ้น การมีเพศสัมพันธ์ที่แน่นแฟ้นมากขึ้นกับ Google การค้นหาและฮาร์ดแวร์ TPU ที่ปรับให้เหมาะสมกับเทนเซอร์มีแนวโน้มที่จะช่วยลดเวลาแฝงและต้นทุนลง

การใช้งานจริงในโลกแห่งความเป็นจริง

สรุป PDF 1,500 หน้าหรือวิดีโอบรรยายความยาวหนึ่งชั่วโมงที่อัปโหลดโดยตรงไปยังแอป Gemini

การสร้างภาพรวม AI ที่ด้านบนของ Google ผลการค้นหาสำหรับข้อความค้นหาที่ซับซ้อน

ร่างอีเมล สรุปชุดข้อความ และวิเคราะห์สเปรดชีตภายใน Gmail, เอกสาร และชีตผ่าน Gemini ใน Workspace

ใช้งานฟีเจอร์ในอุปกรณ์ เช่น สรุปการโทรและการตอบกลับอัจฉริยะผ่าน Gemini Nano บนโทรศัพท์ Pixel โดยไม่ต้องส่งข้อมูลไปยังระบบคลาวด์

รูปแบบการดำเนินงาน

Google Gemini ในทางปฏิบัติ

สรุป PDF 1,500 หน้าหรือวิดีโอบรรยายความยาวหนึ่งชั่วโมงที่อัปโหลดโดยตรงไปยังแอป Gemini

การสรุป PDF 1,500 หน้าหรือวิดีโอบรรยายความยาวหนึ่งชั่วโมงที่อัปโหลดโดยตรงไปยังแอป Gemini ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Google Gemini ในทางปฏิบัติ

การสร้างภาพรวม AI ที่ด้านบนของ Google ผลการค้นหาสำหรับข้อความค้นหาที่ซับซ้อน

การสร้างภาพรวม AI ที่ด้านบนสุดของ Google ผลการค้นหาสำหรับการสืบค้นที่ซับซ้อน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Google Gemini ในทางปฏิบัติ

ร่างอีเมล สรุปชุดข้อความ และวิเคราะห์สเปรดชีตภายใน Gmail, เอกสาร และชีตผ่าน Gemini ใน Workspace

การร่างอีเมล การสรุปชุดข้อความ และการวิเคราะห์สเปรดชีตภายใน Gmail, เอกสาร และชีตผ่าน Gemini ในทีม Workspace มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Google Gemini ในทางปฏิบัติ

ใช้งานฟีเจอร์ในอุปกรณ์ เช่น สรุปการโทรและการตอบกลับอัจฉริยะผ่าน Gemini Nano บนโทรศัพท์ Pixel โดยไม่ต้องส่งข้อมูลไปยังระบบคลาวด์

การเรียกใช้ฟีเจอร์บนอุปกรณ์ เช่น สรุปการโทรและการตอบกลับอัจฉริยะผ่าน Gemini Nano บนโทรศัพท์ Pixel โดยไม่ต้องส่งข้อมูลไปยังคลาวด์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง

!

การกำหนดราคา API หรือการเปลี่ยนแปลงนโยบายสามารถทำลายสมมติฐานได้ในชั่วข้ามคืน

!

การพึ่งพาผู้ขายรายเดียวจะเพิ่มค่าใช้จ่ายในการล็อคอินและการย้ายข้อมูล

แผนงานการดำเนินงาน

1

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป