MUONGOZO wa Misingi

Chinchilla Compute-Mafunzo Bora

Muhtasari

Mafunzo ya Kuhesabu Bora ya Chinchilla yapo kwenye zana ya msingi ya AI. Unapoielewa, mada zingine za AI huwa rahisi kutathmini na kulinganisha.

Dive ya kina

Karatasi ya DeepMind ya Chinchilla ilipitia upya vipimo na kutoa mafunzo zaidi ya miundo 400 ili kupata salio la kukokotoa. Kanuni ya kichwa cha kidole gumba: saizi ya mfano na ishara za mafunzo zinapaswa kukua katika hatua ya kufuli, takriban tokeni 20 za mafunzo kwa kila kigezo. Ili kuthibitisha hilo, walimfundisha Chinchilla, mfano wa parameta bilioni 70 kwenye tokeni trilioni 1.4, kwa kutumia hesabu sawa na Gopher ya bilioni 280 iliyofunzwa kwa tokeni chache sana. Chinchilla, licha ya kuwa ndogo mara nne, ilifanya vizuri zaidi Gopher, GPT-3, na majitu mengine karibu kila kigezo. Somo lilibatilisha hitimisho la awali la OpenAI kwamba ukubwa ulipendelea zaidi ya data, ikionyesha miundo mingi bora ilikuwa ikiacha utendaji kwenye jedwali kwa kuwa kubwa sana na kukosa data.

Ufahamu wa Kiufundi

Chinchilla inafaa hasara kama L(N,D) = E + A·N^(-α) + B·D^(-β), na α na β zote zikiwa karibu na 0.34, kumaanisha vigezo na data huchangia karibu kwa ulinganifu. Kuboresha hii chini ya kizuizi cha kokotoo kisichobadilika (hesabu ≈ 6·N·D kwa vibadilishaji umeme) hutoa matokeo ya kiwango sawa. Muundo mdogo, ulio na utajiri wa data pia ni wa bei rahisi kuendesha kwa makisio, kwa hivyo faida yake huchanganyika katika upelekaji, sio mafunzo tu.

Kusimamia Mafunzo Bora ya Kuhesabu kwa Chinchilla

Chinchilla ni utafiti wa 2022 wa DeepMind kwamba miundo mikubwa ya lugha haikufunzwa vibaya: kwa bajeti isiyobadilika ya kukokotoa unapaswa kuongeza vigezo na data takriban kwa usawa, sio tu kuunda muundo mkubwa zaidi. Ilirekebisha jinsi tasnia inavyosawazisha ukubwa wa kielelezo dhidi ya data ya mafunzo. Mafunzo ya Kuhesabu Bora ya Chinchilla yapo kwenye zana ya msingi ya AI. Unapoielewa, mada zingine za AI huwa rahisi kutathmini na kulinganisha. Ili kujenga uelewa wa kina, chukulia Chinchilla Compute-Optimal Training kama kielelezo cha uendeshaji, si kipengele kimoja: fafanua matokeo yanayotarajiwa, fafanua mawazo, na tenga kile ambacho mfumo unaweza kufanya kwa uhakika na kile ambacho bado kinahitaji uamuzi wa kitaalamu.

Katika mazoezi, timu dhabiti zinazotumia Mafunzo Bora ya Kuhesabu ya Chinchilla huunda miundo dhabiti kwanza, kisha kuchora miundo hiyo kwa vikwazo halisi vya uzalishaji. Huandika vigezo dhahiri vya kufaulu, kujaribu dhidi ya data halisi na mtiririko wa kazi, na kurudia kulingana na mifumo ya kushindwa iliyoonekana badala ya ushindi wa mara moja wa benchmark. Hapa ndipo uelewa wa kinadharia unapogeuka kuwa uwezo wa kudumu katika bidhaa, sera na uendeshaji.

Inakusaidia kutenganisha madai ya wazi ya kiufundi kutoka kwa lugha ya uuzaji. Wakati huo huo, timu tofauti zinaweza kutumia neno moja tofauti, kwa hivyo fafanua upeo mapema. Mbinu thabiti zaidi ni kuchanganya kasi ya majaribio na nidhamu ya utawala: kuendesha majaribio, kunasa ushahidi, kuchapisha kumbukumbu za maamuzi, na kuendelea kusasisha ulinzi huku tabia ya kielelezo, matarajio ya watumiaji na mahitaji ya udhibiti yanapobadilika.

Athari za kimkakati

Inakusaidia kutenganisha madai ya wazi ya kiufundi kutoka kwa lugha ya uuzaji.

Inakusaidia kutenganisha madai ya wazi ya kiufundi kutoka kwa lugha ya uuzaji. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Unaweza kuuliza maswali ya utekelezaji bora kabla ya kutumia pesa au wakati.

Unaweza kuuliza maswali ya utekelezaji bora kabla ya kutumia pesa au wakati. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Timu zenye uelewa wa pamoja hufanya maamuzi bora ya bidhaa, sera na mafunzo.

Timu zenye uelewa wa pamoja hufanya maamuzi bora ya bidhaa, sera na mafunzo. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Mustakabali wa Mafunzo Bora ya Kuhesabu kwa Chinchilla

Miundo ya kisasa kama Llama 3 inasukuma kimakusudi uwiano wa tokeni 20 kwa kila kigezo cha Chinchilla, inafunza miundo midogo juu ya matrilioni ya tokeni ili kufanya makisio kuwa nafuu, na kukubali kokotoo ndogo ya mafunzo. Kadiri data nzuri inavyozidi kuwa haba, maslahi yanaongezeka katika nyakati zinazorudiwa, data ya sanisi na uchujaji wa ubora. Chinchilla inasalia kuwa sehemu ya marejeleo, lakini bora zaidi inategemea gharama ya uelekezaji wa maisha, sio tu bajeti ya mafunzo ya wakati mmoja.

Utekelezaji wa Ulimwengu Halisi

Kuchagua kutoa mafunzo kwa muundo wa vigezo bilioni 7 kwa tokeni trilioni 2 badala ya muundo wa bilioni 30 kwenye data ndogo sana kwa bajeti sawa.

Kukadiria kuwa kielelezo cha kigezo cha bilioni 10 kinataka takriban tokeni bilioni 200 kufikia sehemu tamu ya kukokotoa.

Kuhalalisha muundo mdogo uliotumiwa ili kupunguza gharama za marejeleo ya kila hoja huku ikilinganisha ubora wa mpinzani mkubwa.

Kukagua muundo uliopo na kuhitimisha haukufunzwa, kisha kupanga mafunzo ya muda mrefu badala ya ongezeko la parameta.

Miundo ya Utekelezaji

Chinchilla Compute-Mafunzo Bora kwa vitendo

Kuchagua kutoa mafunzo kwa muundo wa vigezo bilioni 7 kwa tokeni trilioni 2 badala ya muundo wa bilioni 30 kwenye data ndogo sana kwa bajeti sawa.

Kuchagua kutoa mafunzo kwa muundo wa vigezo bilioni 7 kwenye tokeni trilioni 2 badala ya modeli ya bilioni 30 kwenye data ndogo sana kwa ajili ya bajeti sawa kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya juu vya ubora, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Chinchilla Compute-Mafunzo Bora kwa vitendo

Kukadiria kuwa kielelezo cha kigezo cha bilioni 10 kinataka takriban tokeni bilioni 200 kufikia sehemu tamu ya kukokotoa.

Kukadiria kuwa kielelezo cha kigezo cha bilioni 10 kinataka takriban tokeni bilioni 200 kufikia kiwango bora cha kukokotoa Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa visa vikali, na kufuatilia faida zote za tija na gharama za makosa kwa wakati.

Chinchilla Compute-Mafunzo Bora kwa vitendo

Kuhalalisha muundo mdogo uliotumiwa ili kupunguza gharama za marejeleo ya kila hoja huku ikilinganisha ubora wa mpinzani mkubwa.

Kuhalalisha muundo mdogo uliotumika ili kupunguza gharama za uelekezaji wa kila hoja huku ikilinganisha na ubora wa Timu zinazoshindana kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya juu vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Chinchilla Compute-Mafunzo Bora kwa vitendo

Kukagua muundo uliopo na kuhitimisha haukufunzwa, kisha kupanga mafunzo ya muda mrefu badala ya ongezeko la parameta.

Kukagua muundo uliopo na kuhitimisha kuwa haujafunzwa, kisha kupanga mwendo mrefu wa mafunzo badala ya kuongeza kigezo Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida zote za tija na gharama za makosa kwa wakati.

Hatari & Walinzi

Timu tofauti zinaweza kutumia neno moja tofauti, kwa hivyo fafanua upeo mapema.

Vigezo vinaweza kuonekana kuwa na nguvu ilhali utendakazi wa ulimwengu halisi haufanani.

Kupuuza ubora wa data na mipango ya tathmini mara nyingi huleta matokeo tete.

Ramani ya Utekelezaji

Anza na ufafanuzi wa lugha rahisi wa matokeo unayohitaji.

Anza na ufafanuzi wa lugha rahisi wa matokeo unayohitaji. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Chagua kipimo kimoja cha mafanikio na hali moja ya kutofaulu kabla ya kujaribu.

Chagua kipimo kimoja cha mafanikio na hali moja ya kutofaulu kabla ya kujaribu. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Tekeleza majaribio madogo yenye data wakilishi, si seti ya onyesho iliyoboreshwa.

Tekeleza majaribio madogo yenye data wakilishi, si seti ya onyesho iliyoboreshwa. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Hati ambapo Chinchilla Compute-Optimal Training husaidia na ambapo mbinu rahisi ni bora zaidi.

Hati ambapo Chinchilla Compute-Optimal Training husaidia na ambapo mbinu rahisi ni bora zaidi. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Endelea Kuchunguza

AI ni nini?

Pata dhana muhimu kabla ya kupiga mbizi zaidi.

Soma Mwongozo

Jinsi AI Inajifunza

Kuelewa mchakato wa mafunzo nyuma ya mifumo ya kisasa.

Soma Mwongozo