कंपनी गाइड

वेव और एंड-टू-एंड ड्राइविंग मॉडल

सिंहावलोकन

वेव और एंड-टू-एंड ड्राइविंग मॉडल को रणनीति, मॉडल एक्सेस, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र साझेदारी के संदर्भ में सबसे अच्छी तरह समझा जाता है।

गहरा गोता

2017 में कैम्ब्रिज में स्थापित, वेव हाथ से लिखे कोड द्वारा एक साथ चिपकाए गए धारणा, भविष्यवाणी और योजना के लिए अलग-अलग मॉड्यूल की पारंपरिक स्व-ड्राइविंग रेसिपी को अस्वीकार करता है। इसके बजाय, यह एक बड़े तंत्रिका नेटवर्क को शुरू से अंत तक प्रशिक्षित करता है: सस्ते कैमरों से वीडियो अंदर जाता है, स्टीयरिंग और त्वरण सामने आता है, जो मानव ड्राइविंग प्रदर्शनों से सीखा जाता है। वेव प्रसिद्ध रूप से महंगे LiDAR और पूर्व-निर्मित HD मानचित्रों से बचते हैं, यह शर्त लगाते हुए कि सीखना मानव चालकों के तरीके को सामान्य बनाता है। इसके GAIA-1 और बाद में GAIA-2 जनरेटिव विश्व मॉडल हैं जो नीति को प्रशिक्षित और परीक्षण करने के लिए यथार्थवादी ड्राइविंग वीडियो का अनुकरण करते हैं। 2024 में वेव ने सॉफ्टबैंक, एनवीडिया और Microsoft के नेतृत्व में $1 बिलियन से अधिक जुटाए, और ब्रिटेन के दर्जनों शहरों में कारों का परीक्षण किया और अमेरिका और जापान में विस्तार शुरू किया।

तकनीकी अंतर्दृष्टि

एंड-टू-एंड लर्निंग मानव ड्राइविंग पर अनुकरण सीखने द्वारा प्रशिक्षित एक अलग-अलग नेटवर्क के साथ मॉड्यूलर पाइपलाइनों को प्रतिस्थापित करता है, जिसे अक्सर सुदृढीकरण सीखने के साथ परिष्कृत किया जाता है। GAIA-2 जैसे वेव के विश्व मॉडल जेनरेटिव वीडियो मॉडल हैं जो क्रियाओं के आधार पर भविष्य के फ्रेम की भविष्यवाणी करते हैं, जिससे टीम सिमुलेशन में सस्ते में दुर्लभ परिदृश्य (जयवॉकर, फॉग) उत्पन्न कर सकती है। दूसरा पहलू व्याख्यात्मकता है: एक एकल ब्लैक-बॉक्स नीति को पाइपलाइन की तुलना में डीबग करना और प्रमाणित करना कठिन है, जहां प्रत्येक मॉड्यूल के आउटपुट का निरीक्षण किया जा सकता है।

वेव और एंड-टू-एंड ड्राइविंग मॉडल में महारत हासिल करना

वेव एक यूके कंपनी है जो एकल सीखे हुए न्यूरल नेटवर्क के साथ सेल्फ-ड्राइविंग सिस्टम बना रही है जो कैमरा पिक्सल को सीधे ड्राइविंग नियंत्रण में मैप करता है - कोई हाथ से कोडित नियम या एचडी मैप नहीं। यह मायने रखता है क्योंकि यह एंड-टू-एंड दृष्टिकोण उन कारों का वादा करता है जो महंगी रीमैपिंग के बिना नए शहरों में सामान्यीकृत होती हैं। वेव और एंड-टू-एंड ड्राइविंग मॉडल को रणनीति, मॉडल एक्सेस, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र साझेदारी के संदर्भ में सबसे अच्छी तरह समझा जाता है। गहरी समझ बनाने के लिए, वेव और एंड-टू-एंड ड्राइविंग मॉडल को एक ऑपरेटिंग मॉडल के रूप में मानें, न कि एक विशेषता के रूप में: वांछित परिणामों को परिभाषित करें, मान्यताओं को स्पष्ट करें, और जो सिस्टम विश्वसनीय रूप से कर सकता है उसे अलग करें जिसके लिए अभी भी विशेषज्ञ निर्णय की आवश्यकता है।

व्यवहार में, वेव और एंड-टू-एंड ड्राइविंग मॉडल का उपयोग करने वाली मजबूत टीमें प्रतिबद्धता से पहले विक्रेता रणनीति, रोडमैप विश्वसनीयता और लॉक-इन जोखिम का मूल्यांकन करती हैं। वे स्पष्ट सफलता मानदंडों का दस्तावेजीकरण करते हैं, यथार्थवादी डेटा और वर्कफ़्लो के विरुद्ध परीक्षण करते हैं, और एक बार की बेंचमार्क जीत के बजाय देखे गए विफलता पैटर्न के आधार पर पुनरावृत्ति करते हैं। यहीं पर सैद्धांतिक समझ उत्पाद, नीति और संचालन में टिकाऊ क्षमता में बदल जाती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। साथ ही, लॉन्च घोषणाएं वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं। सबसे लचीला दृष्टिकोण प्रयोग की गति को शासन अनुशासन के साथ जोड़ना है: पायलट चलाना, साक्ष्य प्राप्त करना, निर्णय लॉग प्रकाशित करना, और मॉडल व्यवहार, उपयोगकर्ता अपेक्षाओं और नियामक आवश्यकताओं के विकसित होने पर सुरक्षा उपायों को लगातार अपडेट करना।

सामरिक प्रभाव

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

वेव और एंड-टू-एंड ड्राइविंग मॉडल का भविष्य

वेव अपने स्वयं के रोबोटैक्सिस के निर्माण के बजाय वाहन निर्माताओं को सॉफ्टवेयर के रूप में अपने 'अवशोषित एआई' को लाइसेंस दे रहा है, जिसका लक्ष्य ड्राइवर-सहायता और अंततः कई वाहन ब्रांडों में स्वायत्तता प्रदान करना है। फाउंडेशन-मॉडल तकनीकों, बड़े मल्टीमॉडल विश्व मॉडल के साथ सख्त एकीकरण की अपेक्षा करें, और यह साबित करने के लिए प्रयास करें कि कैमरा-फर्स्ट, मैप-मुक्त सिस्टम सुरक्षा के मामले में मैप-भारी प्रतिद्वंद्वियों से मेल खा सकते हैं। सीखी गई, कम-व्याख्या योग्य प्रणालियों की नियामक स्वीकृति प्रमुख बाधा बनी हुई है।

वास्तविक विश्व कार्यान्वयन

केवल कैमरा इनपुट और सीखी हुई नीति का उपयोग करके ब्रिटेन के अपरिचित शहरों में मानचित्र-मुक्त शहरी ड्राइविंग

GAIA-2 विश्व मॉडल ड्राइविंग नेटवर्क के तनाव-परीक्षण के लिए सिंथेटिक एज-केस वीडियो (साइकिल चालक, मौसम) उत्पन्न करता है

कार निर्माताओं को AV2.0 सॉफ़्टवेयर का लाइसेंस देना ताकि मौजूदा वाहन कैमरा सुइट्स को उन्नत सहायक ड्राइविंग का लाभ मिल सके

फ्लीट लर्निंग जहां कई मानव-चालित कारों का डेटा एकल साझा तंत्रिका ड्राइविंग मॉडल को बेहतर बनाता है

कार्यान्वयन पैटर्न

व्यवहार में वेव और एंड-टू-एंड ड्राइविंग मॉडल

केवल कैमरा इनपुट और सीखी हुई नीति का उपयोग करके ब्रिटेन के अपरिचित शहरों में मानचित्र-मुक्त शहरी ड्राइविंग।

केवल कैमरा इनपुट और एक सीखी हुई नीति का उपयोग करके अपरिचित यूके शहरों में मानचित्र-मुक्त शहरी ड्राइविंग टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में वेव और एंड-टू-एंड ड्राइविंग मॉडल

GAIA-2 विश्व मॉडल ड्राइविंग नेटवर्क के तनाव-परीक्षण के लिए सिंथेटिक एज-केस वीडियो (साइकिल चालक, मौसम) उत्पन्न करता है।

GAIA-2 विश्व मॉडल ड्राइविंग नेटवर्क के तनाव-परीक्षण के लिए सिंथेटिक एज-केस वीडियो (साइकिल चालक, मौसम) तैयार करता है। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में वेव और एंड-टू-एंड ड्राइविंग मॉडल

कार निर्माताओं को AV2.0 सॉफ़्टवेयर का लाइसेंस देना ताकि मौजूदा वाहन कैमरा सुइट्स को उन्नत सहायक ड्राइविंग का लाभ मिल सके।

कार निर्माताओं को AV2.0 सॉफ़्टवेयर का लाइसेंस देना ताकि मौजूदा वाहन कैमरा सुइट्स उन्नत सहायक ड्राइविंग प्राप्त कर सकें। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में वेव और एंड-टू-एंड ड्राइविंग मॉडल

फ्लीट लर्निंग जहां कई मानव-चालित कारों का डेटा एकल साझा तंत्रिका ड्राइविंग मॉडल को बेहतर बनाता है।

फ्लीट लर्निंग जहां कई मानव-चालित कारों का डेटा एकल साझा तंत्रिका ड्राइविंग मॉडल में सुधार करता है। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

जोखिम और रेलिंग

लॉन्च घोषणाएँ वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं।

एपीआई मूल्य निर्धारण या नीतिगत बदलाव रातों-रात धारणाओं को तोड़ सकते हैं।

एकल-विक्रेता निर्भरता से लॉक-इन और माइग्रेशन लागत बढ़ जाती है।

कार्यान्वयन रोडमैप

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें।

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें।

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें।

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें।

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

अन्वेषण करते रहें

OpenAI

देखें कि अग्रणी फाउंडेशन-मॉडल विक्रेता कैसे काम करते हैं।

गाइड पढ़ें

ओपन सोर्स एआई

खुले और बंद मॉडल पारिस्थितिकी तंत्र की तुलना करें।

गाइड पढ़ें