कंपनी गाइड

रीज़निंग एजेंटों को शामिल करें

Imbue एक AI लैब बिल्डिंग एजेंट है जो वास्तविक कार्यों में भरोसा करने के लिए तर्क, कोड और कार्य कर सकता है।

सिंहावलोकन

Imbue Reasoning Agents को रणनीति, मॉडल पहुंच, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र भागीदारी के संदर्भ में सबसे अच्छी तरह समझा जाता है।

गहरा गोता

इम्बुए, जिसे पहले आम तौर पर इंटेलिजेंट के नाम से जाना जाता था, का नेतृत्व सीईओ कंजुन किउ ने किया है और एनवीडिया सहित निवेशकों द्वारा समर्थित, लगभग एक अरब डॉलर के मूल्यांकन पर 2023 में 200 मिलियन डॉलर से अधिक जुटाए हैं। सबसे बड़े संभावित मॉडल का पीछा करने के बजाय, इम्ब्यू उन एजेंटों पर ध्यान केंद्रित करता है जो विश्वसनीय रूप से तर्क करते हैं और अपने स्वयं के काम को सत्यापित कर सकते हैं। कंपनी ने अपने स्वयं के कंप्यूट क्लस्टर पर 70 बिलियन-पैरामीटर मॉडल को प्रसिद्ध रूप से प्रशिक्षित किया और अनुभव के बारे में असामान्य रूप से विस्तृत इंजीनियरिंग नोट्स प्रकाशित किए। इसका शोध तर्क, मजबूती और उपकरणों पर जोर देता है जो एजेंटों को यह जांचने देते हैं कि उनके कार्य वास्तव में सफल हुए या नहीं। दीर्घकालिक लक्ष्य व्यक्तिगत एआई एजेंट हैं जिन पर लोग परिणामी कार्यों को संभालने के लिए भरोसा कर सकते हैं, जिसमें अपारदर्शी स्वचालन के बजाय उपयोगकर्ता एजेंसी और सत्यापन पर स्पष्ट जोर दिया गया है।

तकनीकी अंतर्दृष्टि

इम्ब्यू की शर्त यह है कि तर्क करने वाले एजेंटों को सत्यापन योग्य होना चाहिए, न कि केवल धाराप्रवाह। इसका मतलब है कि मध्यवर्ती चरण उत्पन्न करना, कोड या टूल कॉल निष्पादित करना, वास्तविक परिणामों का अवलोकन करना, और जब कोई कार्रवाई विफल हो जाती है तो स्वयं-सुधार करना - एक ही बार में विश्वसनीय-लगने वाला उत्तर देने के बजाय लूप को बंद करना। उनका स्क्रैच 70B प्रशिक्षण रन आंशिक रूप से पूर्ण स्टैक को नियंत्रित करने के बारे में था ताकि वे सामान्य फाउंडेशन मॉडल पर भरोसा करने के बजाय सावधानीपूर्वक, जांचने योग्य तर्क के लिए विशेष रूप से अनुकूलित कर सकें।

इमब्यू रीज़निंग एजेंटों में महारत हासिल करना

Imbue एक AI लैब बिल्डिंग एजेंट है जो वास्तविक कार्यों में भरोसा करने के लिए तर्क, कोड और कार्य कर सकता है। यह मायने रखता है क्योंकि विश्वसनीयता - न कि केवल कच्ची बुद्धिमत्ता - एआई एजेंटों को निरंतर पर्यवेक्षण के बिना उपयोगी बहु-चरणीय कार्य करने से रोकने वाली बाधा है। Imbue Reasoning Agents को रणनीति, मॉडल पहुंच, प्लेटफ़ॉर्म निर्णय और पारिस्थितिकी तंत्र भागीदारी के संदर्भ में सबसे अच्छी तरह समझा जाता है। गहरी समझ बनाने के लिए, Imbue रीज़निंग एजेंटों को एक ऑपरेटिंग मॉडल के रूप में मानें, न कि एक विशेषता के रूप में: वांछित परिणामों को परिभाषित करें, मान्यताओं को स्पष्ट करें, और जो सिस्टम विश्वसनीय रूप से कर सकता है उसे अलग करें जिसके लिए अभी भी विशेषज्ञ निर्णय की आवश्यकता है।

व्यवहार में, इमब्यू रीज़निंग एजेंटों का उपयोग करने वाली मजबूत टीमें प्रतिबद्ध होने से पहले विक्रेता रणनीति, रोडमैप विश्वसनीयता और लॉक-इन जोखिम का मूल्यांकन करती हैं। वे स्पष्ट सफलता मानदंडों का दस्तावेजीकरण करते हैं, यथार्थवादी डेटा और वर्कफ़्लो के विरुद्ध परीक्षण करते हैं, और एक बार की बेंचमार्क जीत के बजाय देखे गए विफलता पैटर्न के आधार पर पुनरावृत्ति करते हैं। यहीं पर सैद्धांतिक समझ उत्पाद, नीति और संचालन में टिकाऊ क्षमता में बदल जाती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। साथ ही, लॉन्च घोषणाएं वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं। सबसे लचीला दृष्टिकोण प्रयोग की गति को शासन अनुशासन के साथ जोड़ना है: पायलट चलाना, साक्ष्य प्राप्त करना, निर्णय लॉग प्रकाशित करना, और मॉडल व्यवहार, उपयोगकर्ता अपेक्षाओं और नियामक आवश्यकताओं के विकसित होने पर सुरक्षा उपायों को लगातार अपडेट करना।

सामरिक प्रभाव

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है।

विक्रेता रोडमैप इस बात को प्रभावित करते हैं कि आपकी टीम आगे क्या सुविधाएँ बना सकती है। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं।

वाणिज्यिक शर्तें और तैनाती विकल्प दीर्घकालिक लागत और जोखिम को प्रभावित करते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं।

कंपनी के प्रोत्साहन उत्पाद चूक, सुरक्षा स्थिति और खुलेपन को आकार देते हैं। उच्च-गुणवत्ता वाली तैनाती में, इसे मापने योग्य संचालन नियमों, स्वामित्व सीमाओं और आवर्ती समीक्षा अनुष्ठानों में अनुवादित किया जाता है ताकि टीमें अस्पष्टता को मापने के बजाय आत्मविश्वास को बढ़ा सकें।

इम्बु रीज़निंग एजेंटों का भविष्य

एजेंटों के लिए सीमा एक-शॉट उत्तर से लंबी-क्षितिज विश्वसनीयता की ओर बढ़ रही है: एजेंट जो योजना बनाते हैं, कई चरणों में कार्य करते हैं, त्रुटियों से उबरते हैं, और जानते हैं कि किसी इंसान से कब पूछना है। सत्यापन, सैंडबॉक्स्ड टूल के उपयोग और पारदर्शिता पर अधिक जोर देने की अपेक्षा करें ताकि उपयोगकर्ता ऑडिट कर सकें कि एजेंट ने क्या किया। यदि इमब्यू जैसी प्रयोगशालाएं सफल होती हैं, तो भरोसेमंद निजी एजेंट अनुसंधान, कोडिंग और प्रशासनिक काम संभाल सकते हैं, लेकिन परिणामी कार्यों में आत्मविश्वासपूर्ण गलतियों से बचना कठिन हिस्सा है।

वास्तविक विश्व कार्यान्वयन

एक एजेंट कोड लिखता है, परीक्षण सूट चलाता है, विफलताओं को पढ़ता है, और काम वापस सौंपने से पहले अपनी बग ठीक करता है।

एक शोध सहायक एक अस्पष्ट अनुरोध को उप-प्रश्नों में तोड़ता है, सबूत इकट्ठा करता है, और अनुमान लगाने के बजाय प्रत्येक निष्कर्ष की पुष्टि करता है।

एक निजी एजेंट एक जटिल बहु-चरणीय योजना का मसौदा तैयार करता है और उसका समाधान करता है, उन बिंदुओं को चिह्नित करता है जहां यह अनिश्चित है और मानव हस्ताक्षर की आवश्यकता है।

आंतरिक टूलींग एक एजेंट को यह पुष्टि करने देती है कि सफलता मानने के बजाय प्रत्येक क्रिया ने वास्तव में सिस्टम स्थिति को बदल दिया है या नहीं।

कार्यान्वयन पैटर्न

व्यवहार में रीज़निंग एजेंटों को शामिल करें

एक एजेंट कोड लिखता है, परीक्षण सूट चलाता है, विफलताओं को पढ़ता है, और काम वापस सौंपने से पहले अपने स्वयं के बग को ठीक करता है। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में रीज़निंग एजेंटों को शामिल करें

एक शोध सहायक एक अस्पष्ट अनुरोध को उप-प्रश्नों में तोड़ता है, सबूत इकट्ठा करता है, और अनुमान लगाने के बजाय प्रत्येक निष्कर्ष को सत्यापित करता है। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानवीय वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में रीज़निंग एजेंटों को शामिल करें

एक व्यक्तिगत एजेंट एक जटिल बहु-चरणीय योजना का मसौदा तैयार करता है और उसका समाधान करता है, उन बिंदुओं को चिह्नित करता है जहां यह अनिश्चित है और मानव साइन-ऑफ की आवश्यकता होती है। टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

व्यवहार में रीज़निंग एजेंटों को शामिल करें

आंतरिक टूलींग एक एजेंट को यह पुष्टि करने देती है कि क्या प्रत्येक क्रिया ने वास्तव में सिस्टम स्थिति को बदल दिया है, सफलता मानने के बजाय टीमों को आमतौर पर बेहतर परिणाम मिलते हैं जब वे गुणवत्ता सीमा को सामने से परिभाषित करते हैं, किनारे के मामलों के लिए एक मानव वृद्धि पथ रखते हैं, और समय के साथ उत्पादकता लाभ और त्रुटि लागत दोनों को ट्रैक करते हैं।

जोखिम और रेलिंग

लॉन्च घोषणाएँ वास्तविक उत्पादन वर्कफ़्लो में स्थिरता को पीछे छोड़ सकती हैं।

एपीआई मूल्य निर्धारण या नीतिगत बदलाव रातों-रात धारणाओं को तोड़ सकते हैं।

एकल-विक्रेता निर्भरता से लॉक-इन और माइग्रेशन लागत बढ़ जाती है।

कार्यान्वयन रोडमैप

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें।

अपने स्वयं के कार्यों और डेटासेट का उपयोग करके प्रदाताओं का मूल्यांकन करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें।

एकीकरण से पहले गोपनीयता, सुरक्षा और कानूनी शर्तों की समीक्षा करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें।

सभी मॉडलों या विक्रेताओं के बीच फ़ॉलबैक योजना बनाए रखें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें।

रिलीज़ नोट्स की निगरानी करें ताकि रोडमैप परिवर्तन टीमों को आश्चर्यचकित न करें। प्रत्येक चरण को एक साक्ष्य द्वार के रूप में मानें: यदि मानदंड पूरे नहीं होते हैं, तो रोलआउट रोकें, अंतर को बंद करें, और उसके बाद ही उपयोग का विस्तार करें।

अन्वेषण करते रहें

OpenAI

देखें कि अग्रणी फाउंडेशन-मॉडल विक्रेता कैसे काम करते हैं।

गाइड पढ़ें

ओपन सोर्स एआई

खुले और बंद मॉडल पारिस्थितिकी तंत्र की तुलना करें।

गाइड पढ़ें