MWONGOZO wa Maombi

Mawakala wa Kutafakari na Kujisahihisha

Reflexion ni mbinu ambapo wakala wa AI huakisi kwa maandishi mapungufu yake mwenyewe na kulisha masomo hayo katika jaribio lake linalofuata.

Muhtasari

Reflexion ni mbinu ambapo wakala wa AI huakisi kwa maandishi mapungufu yake mwenyewe na kulisha masomo hayo katika jaribio lake linalofuata. Ni muhimu kwa sababu inawaruhusu mawakala kuboresha kazi bila kufundisha tena muundo wa msingi.

Mawakala wa Kutafakari na Kujisahihisha huzingatia uwekaji wa vitendo: kubadilisha uwezo wa kielelezo kuwa mtiririko wa kazi unaotegemewa wa kila siku ambao hutoa thamani inayoweza kupimika.

Dive ya kina

Reflexion, iliyoletwa katika karatasi ya 2023 na Shinn na wenzake, humpa wakala kitanzi: inajaribu kazi, inapokea ishara kuhusu jinsi ilifanya (matokeo ya mtihani, zawadi, au uhakiki), kisha huandika 'tafakari' fupi ya lugha ya asili inayoelezea nini kilienda vibaya na nini cha kujaribu ijayo. Uakisi huo huhifadhiwa kwenye kumbukumbu na hutanguliwa na dodoso la jaribio linalofuata. Muhimu, uzani wa mfano haubadilika kamwe; kujifunza hufanyika kabisa kwenye dirisha la muktadha kama maandishi. 'Ujifunzaji huu wa uimarishaji wa maneno' huruhusu mawakala kurudia matatizo ya usimbaji, urambazaji wa wavuti, na kazi za kufikiria. Kwenye kipimo cha usimbaji cha HumanEval, kujisahihisha kwa mtindo wa Reflexion kulisukuma viwango vya ufaulu vya juu zaidi kuliko majaribio ya risasi moja, kwa kumruhusu wakala kutatua makosa yake mwenyewe katika majaribio machache.

Ufahamu wa Kiufundi

Reflexion hutenganisha majukumu matatu: Mwigizaji anayezalisha vitendo, Mtathmini anayepata matokeo (majaribio ya vipimo, hundi ya mechi kamili, au jaji wa LLM), na mtindo wa Kujitafakari ambao hubadilisha alama hiyo kuwa somo la maandishi. Somo linatua katika akiba ya kumbukumbu ya matukio iliyotumiwa tena kwenye jaribio linalofuata. Kwa sababu maoni ni lugha badala ya gradient, hakuna mafunzo ya GPU yanayohitajika, lakini inategemea sana mawimbi ya kuaminika ya tathmini ili kuepuka kuimarisha uakisi unaojiamini lakini usio sahihi.

Umahiri wa Kutafakari na Mawakala wa Kujisahihisha

Reflexion ni mbinu ambapo wakala wa AI huakisi kwa maandishi mapungufu yake mwenyewe na kulisha masomo hayo katika jaribio lake linalofuata. Ni muhimu kwa sababu inawaruhusu mawakala kuboresha kazi bila kufundisha tena muundo wa msingi. Mawakala wa Kutafakari na Kujisahihisha huzingatia uwekaji wa vitendo: kubadilisha uwezo wa kielelezo kuwa mtiririko wa kazi unaotegemewa wa kila siku ambao hutoa thamani inayoweza kupimika. Ili kujenga uelewa wa kina, chukulia Mawakala wa Kutafakari na Kujisahihisha kama kielelezo cha uendeshaji, si kipengele kimoja: kufafanua matokeo yanayotarajiwa, kufafanua mawazo, na kutenganisha kile ambacho mfumo unaweza kufanya kwa uhakika na kile ambacho bado kinahitaji uamuzi wa kitaalamu.

Katika mazoezi, timu dhabiti zinazotumia Mawakala wa Kutafakari na Kujisahihisha huzingatia matokeo ya mtiririko wa kazi, sio demo za mfano, na kufafanua vituo vya ukaguzi vya wanadamu mapema. Huandika vigezo dhahiri vya kufaulu, kujaribu dhidi ya data halisi na mtiririko wa kazi, na kurudia kulingana na mifumo ya kushindwa iliyoonekana badala ya ushindi wa mara moja wa benchmark. Hapa ndipo uelewa wa kinadharia unapogeuka kuwa uwezo wa kudumu katika bidhaa, sera na uendeshaji.

Muundo wa kiwango cha programu huamua kama AI inaboresha matokeo halisi. Wakati huo huo, Kuendesha mchakato uliovunjika kunaweza kukuza matatizo yaliyopo. Mbinu thabiti zaidi ni kuchanganya kasi ya majaribio na nidhamu ya utawala: kuendesha majaribio, kunasa ushahidi, kuchapisha kumbukumbu za maamuzi, na kuendelea kusasisha ulinzi huku tabia ya kielelezo, matarajio ya watumiaji na mahitaji ya udhibiti yanapobadilika.

Athari za kimkakati

Muundo wa kiwango cha programu huamua kama AI inaboresha matokeo halisi.

Muundo wa kiwango cha programu huamua kama AI inaboresha matokeo halisi. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Ujumuishaji mzuri wa mtiririko wa kazi hutengeneza faida za tija ambazo watumiaji wanaweza kuamini.

Ujumuishaji mzuri wa mtiririko wa kazi hutengeneza faida za tija ambazo watumiaji wanaweza kuamini. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Kesi za utumiaji zilizopangwa vizuri hupunguza uchovu wa mabadiliko na hatari ya utekelezaji.

Kesi za utumiaji zilizopangwa vizuri hupunguza uchovu wa mabadiliko na hatari ya utekelezaji. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Mustakabali wa Mawakala wa Kutafakari na Kujisahihisha

Kujisahihisha kunakuwa safu chaguo-msingi katika mifumo ya wakala badala ya hila ya utafiti. Tarajia muunganisho mkali zaidi na vithibitishaji kiotomatiki, kama vile visanduku vya misimbo, vikagua rasmi, na urejeshaji ambao unathibitisha ukweli, kwa hivyo uakisi huwekwa katika mawimbi yenye lengo badala ya modeli kujikisia yenyewe. Changamoto zilizo wazi ni kuzuia misururu ambapo wakala 'hurekebisha' matokeo ya kazi bila kikomo, kuamua ni lini ataacha kujirudia, na kuzuia uakisi kuelekezewa katika upatanisho unaokubalika lakini ambao haujathibitishwa.

Utekelezaji wa Ulimwengu Halisi

Wakala wa usimbaji ambaye huendesha majaribio ya kitengo, husoma dai lisilofaulu, huandika dokezo kwenye hitilafu, na kuhariri msimbo wake kabla ya kutekeleza tena safu.

Msaidizi wa utafiti ambaye anapata dondoo la uwongo wakati ukaguzi wa kurejesha umeshindwa, kisha hurekebisha jibu ili kutumia vyanzo vilivyoidhinishwa pekee.

Wakala wa urambazaji wa wavuti (k.m., kwenye alama za AlfWorld au WebShop) anayerekodi 'Nilibofya kichujio kisicho sahihi' na kuepuka hatua hiyo mbaya ya kujaribu tena.

Kisuluhishi cha hesabu ambacho hukagua jibu lake la mwisho dhidi ya kikwazo, huona hitilafu ya ishara, na kurekebisha hatua husika.

Miundo ya Utekelezaji

Mawakala wa Kutafakari na Kujisahihisha kwa vitendo

Wakala wa usimbaji ambaye huendesha majaribio ya kitengo, husoma dai lisilofaulu, huandika dokezo kwenye hitilafu, na kuhariri msimbo wake kabla ya kutekeleza tena safu.

Wakala wa usimbaji ambaye huendesha majaribio ya kitengo, husoma madai ambayo hayajafaulu, huandika dokezo kuhusu hitilafu, na kuhariri msimbo wake kabla ya kuendesha tena kikundi kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Mawakala wa Kutafakari na Kujisahihisha kwa vitendo

Msaidizi wa utafiti ambaye anapata dondoo la uwongo wakati ukaguzi wa kurejesha umeshindwa, kisha hurekebisha jibu ili kutumia vyanzo vilivyoidhinishwa pekee.

Msaidizi wa utafiti ambaye anapata madondoo ya udanganyifu wakati hundi ya kurejesha inaposhindwa, kisha kurekebisha jibu ili kutumia vyanzo vilivyoidhinishwa pekee Timu hupata matokeo bora zaidi zinapofafanua viwango vya juu vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Mawakala wa Kutafakari na Kujisahihisha kwa vitendo

Wakala wa urambazaji wa wavuti (k.m., kwenye alama za AlfWorld au WebShop) anayerekodi 'Nilibofya kichujio kisicho sahihi' na kuepuka hatua hiyo mbaya ya kujaribu tena.

Wakala wa urambazaji kwenye wavuti (k.m., kwenye viwango vya AlfWorld au WebShop) anayerekodi 'Nilibofya kichujio kisicho sahihi' na kuepuka hatua hiyo mbaya ya kujaribu tena Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida zote za tija na gharama za hitilafu kwa wakati.

Mawakala wa Kutafakari na Kujisahihisha kwa vitendo

Kisuluhishi cha hesabu ambacho hukagua jibu lake la mwisho dhidi ya kikwazo, huona hitilafu ya ishara, na kurekebisha hatua husika.

Kisuluhishi cha hesabu ambacho hukagua jibu lake la mwisho dhidi ya kikwazo, hugundua hitilafu ya ishara, na kurekebisha hatua husika kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Hatari & Walinzi

!

Kuweka kiotomatiki mchakato uliovunjika kunaweza kukuza shida zilizopo.

!

Timu zinaweza kufanya otomatiki kupita kiasi na kuondoa uamuzi unaohitajika wa kibinadamu.

!

Ubora unaweza kuyumba ikiwa matokeo hayatatathminiwa mara kwa mara.

Ramani ya Utekelezaji

1

Ramani ya mtiririko wa kazi wa sasa na utambue hatua ya msuguano wa juu zaidi.

Ramani ya mtiririko wa kazi wa sasa na utambue hatua ya msuguano wa juu zaidi. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

2

Bainisha vituo vya ukaguzi vya binadamu kabla ya otomatiki kamili.

Bainisha vituo vya ukaguzi vya binadamu kabla ya otomatiki kamili. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

3

Fundisha watumiaji kuhusu maekelezo, njia za kupanda na viwango vya ubora.

Fundisha watumiaji kuhusu maekelezo, njia za kupanda na viwango vya ubora. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

4

Fuatilia matokeo ya kiwango cha kazi ili kuthibitisha thamani endelevu.

Fuatilia matokeo ya kiwango cha kazi ili kuthibitisha thamani endelevu. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Endelea Kuchunguza