कंपनी गाइड

सर्विसनाउ और स्टारकोडर

स्टारकोडर कोड के लिए एक खुला बड़ा भाषा मॉडल है, जिसे बिगकोड प्रोजेक्ट के माध्यम से सर्विसनाउ रिसर्च और हगिंग फेस द्वारा बनाया गया है।

सिंहावलोकन

स्टारकोडर कोड के लिए एक खुला बड़ा भाषा मॉडल है, जिसे बिगकोड प्रोजेक्ट के माध्यम से सर्विसनाउ रिसर्च और हगिंग फेस द्वारा बनाया गया है। यह मायने रखता है क्योंकि यह बंद मॉडलों के प्रभुत्व वाले क्षेत्र में एक अनुज्ञेय रूप से लाइसेंस प्राप्त, पारदर्शी रूप से प्रशिक्षित कोडिंग सहायक लाया।

ServiceNow और StarCoder को रणनीति, मॉडल पहुंच, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र भागीदारी के संदर्भ में सबसे अच्छी तरह से समझा जाता है।

गहरा गोता

स्टारकोडर मई 2023 में सर्विसनाउ रिसर्च और हगिंग फेस के सह-नेतृत्व वाले सहयोग बिगकोड द्वारा जारी कोड-जेनरेशन मॉडल का एक परिवार है। फ्लैगशिप StarCoderBase एक 15.5-बिलियन-पैरामीटर मॉडल है जो द स्टैक से निकाले गए लगभग एक ट्रिलियन टोकन पर प्रशिक्षित है, जो 80 से अधिक प्रोग्रामिंग भाषाओं में फैले अनुमेय लाइसेंस प्राप्त स्रोत कोड का एक बड़ा डेटासेट है। एक प्रमुख विशिष्ट विशेषता इसकी 8,000-टोकन संदर्भ विंडो और फ़िल-इन-द-मिडिल प्रशिक्षण है, जो इसे केवल आगे की भविष्यवाणी करने के बजाय पूर्ववर्ती और निम्नलिखित दोनों पंक्तियों में दिए गए कोड को पूरा करने देती है। बिगकोड ने डेटा गवर्नेंस पर जोर दिया: इसने प्रशिक्षण डेटा प्रकाशित किया, डेवलपर्स के लिए एक ऑप्ट-आउट टूल की पेशकश की, और जिम्मेदार ओपनरेल-एम लाइसेंस के तहत मॉडल जारी किया। 2024 में रिलीज़ हुए StarCoder2 ने 600 से अधिक भाषाओं में कवरेज का विस्तार किया।

तकनीकी अंतर्दृष्टि

स्टारकोडर बहु-क्वेरी ध्यान के साथ एक डिकोडर-केवल ट्रांसफार्मर का उपयोग करता है, जो स्मृति उपयोग को कम करने और लंबी संदर्भ लंबाई पर अनुमान को तेज करने के लिए ध्यान प्रमुखों में कुंजी और मूल्य अनुमानों को साझा करता है। इसे फिल-इन-द-मिडिल के साथ प्रशिक्षित किया गया था, जहां दस्तावेज़ों को बेतरतीब ढंग से विभाजित और पुन: व्यवस्थित किया जाता है ताकि मॉडल आसपास के कोड पर वातानुकूलित एक लापता स्पैन उत्पन्न करना सीख सके। यह इसे आईडीई स्वत: पूर्णता के लिए उपयुक्त बनाता है, जहां कर्सर के दोनों तरफ संदर्भ मौजूद होता है।

ServiceNow और StarCoder में महारत हासिल करना

स्टारकोडर कोड के लिए एक खुला बड़ा भाषा मॉडल है, जिसे बिगकोड प्रोजेक्ट के माध्यम से सर्विसनाउ रिसर्च और हगिंग फेस द्वारा बनाया गया है। यह मायने रखता है क्योंकि यह बंद मॉडलों के प्रभुत्व वाले क्षेत्र में एक अनुज्ञेय रूप से लाइसेंस प्राप्त, पारदर्शी रूप से प्रशिक्षित कोडिंग सहायक लाया। ServiceNow और StarCoder को रणनीति, मॉडल पहुंच, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र भागीदारी के संदर्भ में सबसे अच्छी तरह से समझा जाता है। गहरी समझ बनाने के लिए, ServiceNow और StarCoder को एक ऑपरेटिंग मॉडल के रूप में मानें, न कि एक विशेषता के रूप में: वांछित परिणामों को परिभाषित करें, मान्यताओं को स्पष्ट करें, और जो सिस्टम विश्वसनीय रूप से कर सकता है उसे अलग करें जिसके लिए अभी भी विशेषज्ञ निर्णय की आवश्यकता है।

व्यवहार में, ServiceNow और StarCoder का उपयोग करने वाली मजबूत टीमें प्रतिबद्धता से पहले विक्रेता रणनीति, रोडमैप विश्वसनीयता और लॉक-इन जोखिम का मूल्यांकन करती हैं। वे स्पष्ट सफलता मानदंडों का दस्तावेजीकरण करते हैं, यथार्थवादी डेटा और वर्कफ़्लो के विरुद्ध परीक्षण करते हैं, और एक बार की बेंचमार्क जीत के बजाय देखे गए विफलता पैटर्न के आधार पर पुनरावृत्ति करते हैं। यहीं पर सैद्धांतिक समझ उत्पाद, नीति और संचालन में टिकाऊ क्षमता में बदल जाती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। साथ ही, लॉन्च घोषणाएं वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं। सबसे लचीला दृष्टिकोण प्रयोग की गति को शासन अनुशासन के साथ जोड़ना है: पायलट चलाना, साक्ष्य प्राप्त करना, निर्णय लॉग प्रकाशित करना, और मॉडल व्यवहार, उपयोगकर्ता अपेक्षाओं और नियामक आवश्यकताओं के विकसित होने पर सुरक्षा उपायों को लगातार अपडेट करना।

सामरिक प्रभाव

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

ServiceNow और StarCoder का भविष्य

कोड मॉडल एजेंटिक वर्कफ़्लोज़ की ओर बढ़ रहे हैं जहां वे न केवल स्वत: पूर्ण होते हैं बल्कि योजना बनाते हैं, परीक्षण चलाते हैं और अपने स्वयं के आउटपुट को ठीक करते हैं। सॉफ़्टवेयर हेरिटेज के साथ निर्मित बड़े स्टैक v2 डेटासेट पर प्रशिक्षित StarCoder2, व्यापक भाषा कवरेज और बेहतर डेटा उद्गम की ओर इशारा करता है। उम्मीद है कि कोड-प्रशिक्षित मॉडलों की कानूनी जांच बढ़ने के साथ-साथ एंटरप्राइज़ डेवलपर प्लेटफ़ॉर्म में सख्त एकीकरण के साथ-साथ पारदर्शी प्रशिक्षण डेटा, ऑप्ट-आउट तंत्र और लाइसेंसिंग स्पष्टता पर जोर जारी रहेगा।

वास्तविक विश्व कार्यान्वयन

आईडीई प्लगइन्स और संपादक एक्सटेंशन के अंदर स्वत: पूर्ण और कोड-पूर्णता सुझावों को सशक्त बनाना

प्राकृतिक भाषा की टिप्पणी से बॉयलरप्लेट फ़ंक्शंस, यूनिट परीक्षण और डॉकस्ट्रिंग्स उत्पन्न करना

एंटरप्राइज़ कोडबेस के भीतर प्रोग्रामिंग भाषाओं के बीच कोड का अनुवाद या रीफ़ैक्टरिंग

उन संगठनों के लिए स्व-होस्टेबल कोडिंग सहायक के रूप में कार्य करना जो बंद क्लाउड एपीआई पर मालिकाना कोड नहीं भेज सकते हैं

कार्यान्वयन पैटर्न

ServiceNow और StarCoder व्यवहार में हैं

आईडीई प्लगइन्स और संपादक एक्सटेंशन के अंदर स्वत: पूर्ण और कोड-पूर्णता सुझावों को सशक्त बनाना।

आईडीई प्लगइन्स और संपादक एक्सटेंशन के अंदर स्वत: पूर्ण और कोड-पूर्ण सुझावों को सशक्त बनाना टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

ServiceNow और StarCoder व्यवहार में हैं

प्राकृतिक भाषा की टिप्पणी से बॉयलरप्लेट फ़ंक्शंस, यूनिट परीक्षण और डॉकस्ट्रिंग्स उत्पन्न करना।

प्राकृतिक-भाषा टिप्पणी से बॉयलरप्लेट फ़ंक्शंस, यूनिट परीक्षण और डॉकस्ट्रिंग्स उत्पन्न करना टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

ServiceNow और StarCoder व्यवहार में हैं

एंटरप्राइज़ कोडबेस के भीतर प्रोग्रामिंग भाषाओं के बीच कोड का अनुवाद या रीफ़ैक्टरिंग।

एंटरप्राइज़ कोडबेस के भीतर प्रोग्रामिंग भाषाओं के बीच कोड का अनुवाद या रीफैक्टरिंग टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

ServiceNow और StarCoder व्यवहार में हैं

उन संगठनों के लिए स्व-होस्टेबल कोडिंग सहायक के रूप में कार्य करना जो बंद क्लाउड एपीआई पर मालिकाना कोड नहीं भेज सकते हैं।

उन संगठनों के लिए स्व-होस्टेबल कोडिंग सहायक के रूप में कार्य करना जो बंद क्लाउड एपीआई को मालिकाना कोड नहीं भेज सकते हैं, टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

जोखिम और रेलिंग

!

लॉन्च घोषणाएँ वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं।

!

एपीआई मूल्य निर्धारण या नीतिगत बदलाव रातों-रात धारणाओं को तोड़ सकते हैं।

!

एकल-विक्रेता निर्भरता से लॉक-इन और माइग्रेशन लागत बढ़ जाती है।

कार्यान्वयन रोडमैप

1

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें।

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

2

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें।

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

3

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें।

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

4

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें।

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

अन्वेषण करते रहें