Lugha AI MWONGOZO

Sheria za Kuongeza Chinchilla

Sheria za kuongeza kiwango cha Chinchilla, kutoka kwa DeepMind mwaka wa 2022, zilionyesha kuwa miundo mingi mikubwa ya lugha haikufunzwa vibaya: kwa bajeti isiyobadilika ya kukokotoa, unapaswa kuongeza ukubwa wa modeli na data ya mafunzo kwa takribani uwiano sawa.

Muhtasari

Sheria za kuongeza kiwango cha Chinchilla, kutoka kwa DeepMind mwaka wa 2022, zilionyesha kuwa miundo mingi mikubwa ya lugha haikufunzwa vibaya: kwa bajeti isiyobadilika ya kukokotoa, unapaswa kuongeza ukubwa wa modeli na data ya mafunzo kwa takribani uwiano sawa. Ni muhimu kwa sababu ilifafanua upya ukubwa wa "mojawapo" wa mfano unamaanisha nini na kuunda upya jinsi maabara hutumia kuhesabu.

Sheria za Kuongeza Kiwango cha Chinchilla ni sehemu ya mrundikano wa lugha-AI unaotumiwa kusoma, kutengeneza, kuainisha na kubadilisha maandishi na usemi kwa kiwango.

Dive ya kina

Kabla ya Chinchilla, mwelekeo ulikuwa wa kuunda miundo mikubwa zaidi (kama vile kigezo cha 175B-GPT-3) wakati wa mafunzo kuhusu kiasi kidogo cha data. DeepMind ilifunza zaidi ya miundo 400 katika saizi na bajeti nyingi za data, kisha kutosheleza mikondo inayotabiri upotevu kama utendaji wa vigezo na tokeni chini ya bajeti isiyobadilika ya kukokotoa (FLOP). Utafutaji wao: vigezo na ishara za mafunzo zinapaswa kupima pamoja, takriban uwiano wa 1 hadi 1, ikimaanisha kuhusu tokeni 20 za data ya mafunzo kwa kila parameta. Ili kuthibitisha hilo, walimfundisha Chinchilla, kielelezo cha 70B-parameta kwenye tokeni trilioni 1.4, ambayo ilifanya kazi zaidi kuliko Gopher kubwa zaidi ya 280B licha ya kutumia komputa sawa, kwa sababu ilifunzwa kwenye data zaidi.

Ufahamu wa Kiufundi

Sheria zinatokana na kuangazia kipengele cha upotezaji wa vigezo L(N, D) ambapo N ni vigezo na D ni tokeni, ikijumuisha hasara isiyoweza kupunguzwa, ukubwa wa modeli na masharti ya ukubwa wa data. Kupunguza hasara kulingana na kikwazo cha kukokotoa (kokotoo ni takriban sawia na N mara D) hutoa matokeo kwamba N na D mojawapo hukua kama nguvu ya kukokotoa na viambajengo sawa, kwa hivyo uwiano bora zaidi wa kukokotoa hukaa karibu tokeni 20 kwa kila kigezo.

Kujua Sheria za Kuongeza Kiwango cha Chinchilla

Sheria za kuongeza kiwango cha Chinchilla, kutoka kwa DeepMind mwaka wa 2022, zilionyesha kuwa miundo mingi mikubwa ya lugha haikufunzwa vibaya: kwa bajeti isiyobadilika ya kukokotoa, unapaswa kuongeza ukubwa wa modeli na data ya mafunzo kwa takribani uwiano sawa. Ni muhimu kwa sababu ilifafanua upya ukubwa wa "mojawapo" wa mfano unamaanisha nini na kuunda upya jinsi maabara hutumia kuhesabu. Sheria za Kuongeza Kiwango cha Chinchilla ni sehemu ya mrundikano wa lugha-AI unaotumiwa kusoma, kutengeneza, kuainisha na kubadilisha maandishi na usemi kwa kiwango. Ili kujenga uelewa wa kina, chukulia Sheria za Kuongeza Kiwango cha Chinchilla kama kielelezo cha uendeshaji, si kipengele kimoja: kufafanua matokeo yanayotarajiwa, kufafanua mawazo, na kutenganisha kile ambacho mfumo unaweza kufanya kwa uhakika na kile ambacho bado kinahitaji uamuzi wa kitaalamu.

Katika mazoezi, timu dhabiti zinazotumia Sheria za Kuongeza Kiwango cha Chinchilla hubuni vidokezo, kurejesha na kukagua mizunguko kama mfumo mmoja wa mawasiliano uliounganishwa. Huandika vigezo dhahiri vya kufaulu, kujaribu dhidi ya data halisi na mtiririko wa kazi, na kurudia kulingana na mifumo ya kushindwa iliyoonekana badala ya ushindi wa mara moja wa benchmark. Hapa ndipo uelewa wa kinadharia unapogeuka kuwa uwezo wa kudumu katika bidhaa, sera na uendeshaji.

Mitiririko ya kazi ya lugha inaweza kusonga kwa kasi zaidi bila kuacha uthabiti. Wakati huo huo, mambo ya ukweli yanaweza kuingiza ripoti kwa utulivu, mtiririko wa usaidizi, au matokeo ya utafiti. Mbinu thabiti zaidi ni kuchanganya kasi ya majaribio na nidhamu ya utawala: kuendesha majaribio, kunasa ushahidi, kuchapisha kumbukumbu za maamuzi, na kuendelea kusasisha ulinzi huku tabia ya kielelezo, matarajio ya watumiaji na mahitaji ya udhibiti yanapobadilika.

Athari za kimkakati

Mitiririko ya kazi ya lugha inaweza kusonga kwa kasi zaidi bila kuacha uthabiti.

Mitiririko ya kazi ya lugha inaweza kusonga kwa kasi zaidi bila kuacha uthabiti. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Inapanua ufikiaji katika lugha na mitindo ya mawasiliano.

Inapanua ufikiaji katika lugha na mitindo ya mawasiliano. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Timu zinaweza kutumia muda mwingi kufanya uamuzi huku otomatiki ikishughulikia marudio.

Timu zinaweza kutumia muda mwingi kufanya uamuzi huku otomatiki ikishughulikia marudio. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Mustakabali wa Sheria za Kuongeza Kiwango cha Chinchilla

Chinchilla alihamisha uga kutoka kwa kufuata hesabu za vigezo hadi modeli za kulisha data za ubora zaidi, na miundo ya kisasa mara nyingi hufunza kupita kiwango cha 'compute-optimal' ili kufanya makisio kuwa nafuu. Maandishi ya ubora wa juu ya wavuti yanapopungua, umakini unaelekezwa kwenye uratibu wa data, data ya sanisi, nyakati nyingi, na data ya aina nyingi ili kuendelea kuongeza. Somo la msingi hudumu: data na vigezo lazima zisawazishwe, na saizi mbichi pekee sio lengo tena.

Utekelezaji wa Ulimwengu Halisi

DeepMind's 70B-parameta Chinchilla ikishinda Gopher 280B kwenye viwango kwa kutumia compute sawa, kwa mafunzo juu ya data nyingi zaidi.

Timu zinazoongoza kupanga bajeti takriban tokeni 20 za mafunzo kwa kila kigezo wakati wa kupanga muundo wa kuanzia mwanzo

Kuhalalisha mifano ndogo, yenye utajiri wa data kama LLaMA ambayo ni nafuu kuendesha kwa wakati wa makisio

Kukadiria kama muundo uliopangwa 'huna mafunzo duni' na utafaidika zaidi kutokana na data ya ziada kuliko vigezo vya ziada

Miundo ya Utekelezaji

Sheria za Kupunguza Chinchilla kwa vitendo

DeepMind's 70B-parameta Chinchilla ikishinda Gopher 280B kwenye viwango kwa kutumia hesabu sawa, kwa mafunzo juu ya data nyingi zaidi.

DeepMind's 70B-parameta Chinchilla ikishinda Gopher 280B kwa viwango kwa kutumia hesabu sawa, kwa mafunzo juu ya data nyingi zaidi Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida zote za tija na gharama za makosa kwa wakati.

Sheria za Kupunguza Chinchilla kwa vitendo

Timu zinazoongoza kupanga bajeti takriban tokeni 20 za mafunzo kwa kila kigezo wakati wa kupanga muundo wa kuanzia mwanzo.

Timu zinazoongoza kupanga bajeti takriban tokeni 20 za mafunzo kwa kila kigezo wakati wa kupanga muundo wa kuanzia mwanzo Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Sheria za Kupunguza Chinchilla kwa vitendo

Kuhalalisha mifano ndogo, yenye utajiri wa data kama LLaMA ambayo ni nafuu kuendesha kwa wakati wa makisio.

Kuhalalisha miundo midogo, iliyojaa data nyingi kama LLaMA ambayo ni nafuu kuendesha kwa wakati wa makisio Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Sheria za Kupunguza Chinchilla kwa vitendo

Kukadiria kama muundo uliopangwa 'huna mafunzo duni' na utafaidika zaidi kutokana na data ya ziada kuliko vigezo vya ziada.

Kukadiria kama muundo uliopangwa 'huna mafunzo duni' na utafaidika zaidi kutokana na data ya ziada kuliko vigezo vya ziada Kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Hatari & Walinzi

!

Mambo ya ukweli yanaweza kuingiza ripoti kwa utulivu, mitiririko ya usaidizi, au matokeo ya utafiti.

!

Usikivu wa haraka unaweza kuunda matokeo yasiyolingana katika maombi sawa.

!

Data nyeti ya maandishi inaweza kufichuliwa ikiwa vidhibiti vya ufikiaji ni dhaifu.

Ramani ya Utekelezaji

1

Bainisha umbizo la towe, toni na viwango vya ubora kabla ya kusambaza.

Bainisha umbizo la towe, toni na viwango vya ubora kabla ya kusambaza. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

2

Majibu ya msingi na vyanzo vinavyoaminika wakati wowote usahihi ni muhimu.

Majibu ya msingi na vyanzo vinavyoaminika wakati wowote usahihi ni muhimu. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

3

Weka ukaguzi wa ukaguzi wa kibinadamu kwa matokeo ya juu.

Weka ukaguzi wa ukaguzi wa kibinadamu kwa matokeo ya juu. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

4

Fuatilia mifumo ya kushindwa na fundisha tena vidokezo au mtiririko wa kazi mara kwa mara.

Fuatilia mifumo ya kushindwa na fundisha tena vidokezo au mtiririko wa kazi mara kwa mara. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Endelea Kuchunguza