公司指南

Google 傑瑪

Gemma 是 Google 的輕量級、開放權重 AI 模型系列,採用與 Gemini 相同的研究和技術建構。

概述

Gemma 是 Google 的輕量級、開放權重 AI 模型系列,採用與 Gemini 相同的研究和技術建構。它允許開發人員在自己的硬體(甚至是單一筆記型電腦或 GPU)上下載、微調和運行可用的模型。

Google Gemma 在策略、模型存取、平台決策和生態系統合作夥伴關係的背景下得到最好的理解。

深入探討

2024 年 2 月宣布,Gemma 將為 Google 提供與 Meta 的 Llama 和 Mistral 一起參加公開重量模型比賽的資格。這些模型尺寸較小,第一個版本有 2B 和 7B 參數版本,您可以在本地下載和運行權重,這與封閉的、僅 API 的 Gemini 不同。 Google 在允許商業使用的寬鬆許可證下分發基礎(預訓練)和指令調整變體。該系列迅速擴展:用於程式設計的 CodeGemma、用於視覺語言任務的 PaliGemma、用於高效長序列的 RecurrentGemma 以及在 9B 和 27B 等尺寸下具有更強性能的 Gemma 2(及更高版本)。 Gemma 旨在與流行的工具、Hugging Face、Keras、PyTorch、JAX 和 Ollama 很好地配合使用,使其成為本地、隱私敏感或成本意識型部署的實用選擇。

技術洞察

Gemma 使用僅解碼器的 Transformer 架構,並重複使用 Gemini 研究中的技術,包括大型詞彙標記器(約 256k 個標記)以及從 Gemma 2 代中較大的教師模型中提取的訓練。知識蒸餾可以讓小型學生模型模仿更大的模型,以適度的規模實現強大的品質。 「開放權重」意味著經過訓練的參數是可下載的,因此您可以進行微調和自行託管,儘管訓練資料和完整管道並未完全開源。

掌握 Google 杰玛

Gemma 是 Google 的輕量級、開放權重 AI 模型系列,採用與 Gemini 相同的研究和技術建構。它允許開發人員在自己的硬體(甚至是單一筆記型電腦或 GPU)上下載、微調和運行可用的模型。 Google Gemma 在策略、模型存取、平台決策和生態系統合作夥伴關係的背景下得到最好的理解。為了建立深入的理解,請將 Google Gemma 視為一種操作模型,而不是單一功能:定義所需的結果,澄清假設,並將系統可以可靠地執行的操作與仍需要專家判斷的操作分開。

在實務中,使用 Google Gemma 的強大團隊在提交之前會評估供應商策略、路線圖可靠性和鎖定風險。他們記錄明確的成功標準,根據實際數據和工作流程進行測試,並根據觀察到的失敗模式而不是一次性基準測試勝利進行迭代。這就是理論理解轉變為跨產品、政策和營運的持久能力的地方。

供應商路線圖會影響您的團隊接下來可以建立的功能。同時,發佈公告可能會超過實際生產工作流程的穩定性。最具彈性的方法是將實驗速度與治理規則結合:運行試點、捕獲證據、發布決策日誌,並隨著模型行為、使用者期望和監管要求的發展不斷更新保障措施。

戰略影響

供應商路線圖會影響您的團隊接下來可以建立的功能。

供應商路線圖會影響您的團隊接下來可以建立的功能。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

商業條款和部署選項會影響長期成本和風險。

商業條款和部署選項會影響長期成本和風險。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

公司激勵措施塑造了產品預設、安全態勢和開放性。

公司激勵措施塑造了產品預設、安全態勢和開放性。在高品質部署中,這會轉化為可衡量的操作規則、所有權邊界和定期審查儀式,以便團隊可以增強信心,而不是擴大模糊性。

Google 杰玛的未来

期望 Google 繼續發布針對特定模式和任務、視覺、程式碼、數學和裝置上使用進行調整的 Gemma 變體,同時縮小運行它們所需的佔用空間。隨著開放重量模型縮小了與前沿系統的差距,Gemma 定位 Google 來贏得開發人員的關注度以及資料無法離開建築物的優勢和私有部署。與 Android、Chrome 以及 Ollama 和 Vertex AI 等工具的更緊密整合將使微調和本地推理變得越來越交鑰匙。

現實世界的實施

在筆記型電腦或單一 GPU 上完全離線運行聊天機器人以獲取隱私敏感數據

在公司內部文件上微調小型 Gemma 模型,以提供自訂支援助理

使用 CodeGemma 作為 IDE 內的本機程式碼完成和產生助手

使用視覺語言 PaliGemma 變體建立圖像字幕或視覺問答應用程式

實施模式

Google 实践中的杰玛

在筆記型電腦或單一 GPU 上完全離線運行聊天機器人以獲取隱私敏感資料。

在筆記型電腦或單一 GPU 上完全離線運行聊天機器人來獲取隱私敏感資料當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。

Google 实践中的杰玛

在公司內部文件上微調小型 Gemma 模型,以提供自訂支援助理。

在公司內部文件上微調小型 Gemma 模型以供自訂支援助理 團隊在預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。

Google 实践中的杰玛

使用 CodeGemma 作為 IDE 內的本機程式碼完成和產生助手。

使用 CodeGemma 作為 IDE 內的本地程式碼完成和產生助手 當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並追蹤一段時間內的生產力提升和錯誤成本時,通常會獲得更好的結果。

Google 实践中的杰玛

使用視覺語言 PaliGemma 變體建立圖像字幕或視覺問答應用程式。

使用視覺語言 PaliGemma 變體建立影像字幕或視覺問答應用程式 當團隊預先定義品質閾值、為邊緣情況保留人工升級路徑並隨著時間的推移追蹤生產力增益和錯誤成本時,通常會獲得更好的結果。

風險與防護欄

!

發佈公告可能會超過實際生產工作流程的穩定性。

!

API 定價或政策轉變可能會在一夜之間打破假設。

!

單一供應商依賴性增加了鎖定和遷移成本。

實施路線圖

1

使用您自己的任務和資料集評估提供者。

使用您自己的任務和資料集評估提供者。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

2

在整合之前查看隱私、安全和法律條款。

在整合之前查看隱私、安全和法律條款。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

3

維護跨模型或供應商的後備計劃。

維護跨模型或供應商的後備計劃。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

4

監控發行說明,以便路線圖的變更不會讓團隊感到意外。

監控發行說明,以便路線圖的變更不會讓團隊感到意外。將每個步驟視為證據門:如果不符合標準,則暫停推出,縮小差距,然後再擴大使用。

不斷探索