Akopọ
Chinchilla jẹ wiwa DeepMind 2022 pe ọpọlọpọ awọn awoṣe ede ti o tobi julọ ni a ko ni ikẹkọ ko dara: fun isuna iṣiro ti o wa titi o yẹ ki o ṣe iwọn awọn aye ati data ni aijọju deede, kii ṣe kọ awoṣe nla kan nikan. O ṣe atunṣe bii ile-iṣẹ ṣe iwọntunwọnsi iwọn awoṣe lodi si data ikẹkọ.
Chinchilla Compute-Ti aipe Ikẹkọ joko ni mojuto AI irinṣẹ. Nigbati o ba loye rẹ, awọn akọle AI miiran di rọrun lati ṣe iṣiro ati afiwe.
Jin Dive
Iwe DeepMind's Chinchilla ṣe atunyẹwo igbelowọn ati ikẹkọ ju awọn awoṣe 400 lọ lati wa iwọntunwọnsi-iṣiro ti o dara julọ. Ofin akọle ti atanpako: iwọn awoṣe ati awọn ami ikẹkọ yẹ ki o dagba ni titiipa, ni aijọju awọn ami ikẹkọ 20 fun paramita. Lati fi idi rẹ mulẹ, wọn ṣe ikẹkọ Chinchilla, awoṣe paramita 70-biliọnu kan lori awọn ami-ami 1.4 aimọye, ni lilo iṣiro kanna bi 280-bilionu-paramita Gopher ti o gba ikẹkọ lori awọn ami ti o kere pupọ. Chinchilla, botilẹjẹpe o kere si ni igba mẹrin, o tayọ Gopher, GPT-3, ati awọn omiran miiran lori fere gbogbo ala. Ẹkọ naa dopin ipari OpenAI iṣaaju pe iwọn ti o fẹran ju data lọ, ti n ṣafihan ọpọlọpọ awọn awoṣe flagship n lọ kuro ni iṣẹ lori tabili nipa jijẹ nla ati data-ebi.
Imọ-imọ-ẹrọ
Chinchilla fit pipadanu bi L (N, D) = E + A·N ^ (-α) + B·D ^ (-β), pẹlu α ati β mejeeji nitosi 0.34, itumo paramita ati data tiwon fere symmetrically. Ti o dara ju eyi labẹ idiwọ iṣiro ti o wa titi (iṣiro ≈ 6 · N · D fun awọn oluyipada) n mu abajade iwọn-dogba. Awoṣe ti o kere ju, data-ọlọrọ tun jẹ din owo lati ṣiṣẹ ni itọkasi, nitorinaa awọn agbo ogun anfani rẹ ni imuṣiṣẹ, kii ṣe ikẹkọ nikan.
Mastering Chinchilla Compute-Ti aipe Ikẹkọ
Chinchilla jẹ wiwa DeepMind 2022 pe ọpọlọpọ awọn awoṣe ede ti o tobi julọ ni a ko ni ikẹkọ ko dara: fun isuna iṣiro ti o wa titi o yẹ ki o ṣe iwọn awọn aye ati data ni aijọju deede, kii ṣe kọ awoṣe nla kan nikan. O ṣe atunṣe bii ile-iṣẹ ṣe iwọntunwọnsi iwọn awoṣe lodi si data ikẹkọ. Chinchilla Compute-Ti aipe Ikẹkọ joko ni mojuto AI irinṣẹ. Nigbati o ba loye rẹ, awọn akọle AI miiran di rọrun lati ṣe iṣiro ati afiwe. Lati kọ oye ti o jinlẹ, ṣe itọju Chinchilla Compute-Optimal Training bi awoṣe iṣẹ, kii ṣe ẹya ẹyọkan: ṣalaye awọn abajade ti o fẹ, ṣalaye awọn arosinu, ati lọtọ ohun ti eto le ṣe ni igbẹkẹle lati ohun ti o tun nilo idajọ amoye.
Ni iṣe, awọn ẹgbẹ ti o lagbara ni lilo Chinchilla Compute-Ti o dara julọ Ikẹkọ kọ awọn awoṣe imọran ti o lagbara ni akọkọ, lẹhinna ya awọn awoṣe wọnyẹn si awọn idiwọ iṣelọpọ gidi. Wọn ṣe akọsilẹ awọn ibeere aṣeyọri ti o fojuhan, idanwo lodi si data ojulowo ati ṣiṣan iṣẹ, ati atunbere ti o da lori awọn ilana ikuna ti a ṣakiyesi dipo awọn bori ala-akoko kan. Eyi ni ibiti oye imọ-jinlẹ yipada si agbara ti o tọ kọja ọja, eto imulo, ati awọn iṣẹ ṣiṣe.
O ṣe iranlọwọ fun ọ lati ya sọtọ awọn iṣeduro imọ-ẹrọ lati ede tita. Ni akoko kanna, Awọn ẹgbẹ oriṣiriṣi le lo ọrọ kanna ni oriṣiriṣi, nitorinaa ṣalaye iwọn ni kutukutu. Ọna resilient julọ julọ ni lati darapọ iyara idanwo pẹlu ibawi ijọba: ṣiṣe awọn awakọ awakọ, mu ẹri mu, ṣe atẹjade awọn iwe ipinnu, ati imudojuiwọn awọn aabo nigbagbogbo bi ihuwasi awoṣe, awọn ireti olumulo, ati awọn ibeere ilana ti dagbasoke.
Ipa Ilana
O ṣe iranlọwọ fun ọ lati ya sọtọ awọn iṣeduro imọ-ẹrọ lati ede tita.
O ṣe iranlọwọ fun ọ lati ya sọtọ awọn iṣeduro imọ-ẹrọ lati ede tita. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.
O le beere awọn ibeere imuse to dara julọ ṣaaju lilo owo tabi akoko.
O le beere awọn ibeere imuse to dara julọ ṣaaju lilo owo tabi akoko. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.
Awọn ẹgbẹ pẹlu oye pinpin ṣe ọja to dara julọ, eto imulo, ati awọn ipinnu ikẹkọ.
Awọn ẹgbẹ pẹlu oye pinpin ṣe ọja to dara julọ, eto imulo, ati awọn ipinnu ikẹkọ. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.
Real-World imuse
Yiyan lati ṣe ikẹkọ awoṣe 7-bilionu-paramita kan lori awọn ami ami 2 aimọye dipo awoṣe 30-bilionu kan lori data kekere ju fun isuna kanna.
Iṣiro pe awoṣe paramita 10-biliọnu kan fẹ awọn ami ami aijọju 200 bilionu lati kọlu aaye didùn ti o dara julọ.
Idalare awoṣe ti a fi ranṣẹ lati dinku awọn idiyele itọkasi ibeere-kọọkan lakoko ti o baamu didara orogun nla kan.
Ṣiṣayẹwo awoṣe ti o wa tẹlẹ ati ipari rẹ ko ni ikẹkọ, lẹhinna gbero ṣiṣe ikẹkọ to gun dipo ilosoke paramita kan.
Awọn Ilana imuse
Chinchilla Compute-Ti aipe Ikẹkọ ni iṣe
Yiyan lati ṣe ikẹkọ awoṣe 7-bilionu-paramita kan lori awọn ami ami 2 aimọye dipo awoṣe 30-bilionu kan lori data kekere ju fun isuna kanna.
Yiyan lati ṣe ikẹkọ awoṣe 7-bilionu-paramita kan lori awọn ami-ami 2 aimọye kuku ju awoṣe 30-bilionu kan lori data kekere pupọ fun awọn ẹgbẹ isuna kanna nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe ni akoko pupọ.
Chinchilla Compute-Ti aipe Ikẹkọ ni iṣe
Iṣiro pe awoṣe paramita 10-biliọnu kan fẹ awọn ami ami aijọju 200 bilionu lati kọlu aaye didùn ti o dara julọ.
Iṣiro pe awoṣe paramita 10-bilionu kan fẹ aijọju awọn ami-ami bilionu 200 lati kọlu iṣiro-ti aipe awọn iranran didùn Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.
Chinchilla Compute-Ti aipe Ikẹkọ ni iṣe
Idalare awoṣe ti a fi ranṣẹ lati dinku awọn idiyele itọkasi ibeere-kọọkan lakoko ti o baamu didara orogun nla kan.
Idalare awoṣe ti o kere ju lati dinku awọn idiyele itọkasi ibeere-kọọkan lakoko ti o baamu awọn ẹgbẹ didara ti orogun nla nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna igbega eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.
Chinchilla Compute-Ti aipe Ikẹkọ ni iṣe
Ṣiṣayẹwo awoṣe ti o wa tẹlẹ ati ipari rẹ ko ni ikẹkọ, lẹhinna gbero ṣiṣe ikẹkọ to gun dipo ilosoke paramita kan.
Ṣiṣayẹwo awoṣe ti o wa tẹlẹ ati ipari rẹ ko ni ikẹkọ, lẹhinna gbero ṣiṣe ikẹkọ to gun ju dipo alekun paramita Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe lori akoko.
Awọn ewu & Awọn ọna iṣọ
Awọn ẹgbẹ oriṣiriṣi le lo ọrọ kanna ni oriṣiriṣi, nitorinaa ṣalaye iwọn ni kutukutu.
Awọn aṣepari le wo lagbara lakoko ti iṣẹ-aye gidi ko ṣe deede.
Aibikita didara data ati awọn ero igbelewọn nigbagbogbo ṣẹda awọn abajade ẹlẹgẹ.
Ilana Ilana imuse
Bẹrẹ pẹlu itumọ-ede itele ti abajade ti o nilo.
Bẹrẹ pẹlu itumọ-ede itele ti abajade ti o nilo. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.
Mu metiriki aṣeyọri kan ati ipo ikuna kan ṣaaju idanwo.
Mu metiriki aṣeyọri kan ati ipo ikuna kan ṣaaju idanwo. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.
Ṣiṣe awakọ kekere kan pẹlu data aṣoju, kii ṣe eto demo didan.
Ṣiṣe awakọ kekere kan pẹlu data aṣoju, kii ṣe eto demo didan. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.
Iwe-ipamọ nibiti Chinchilla Compute-Ti aipe Ikẹkọ ṣe iranlọwọ ati nibiti awọn ọna ti o rọrun dara julọ.
Iwe-ipamọ nibiti Chinchilla Compute-Ti aipe Ikẹkọ ṣe iranlọwọ ati nibiti awọn ọna ti o rọrun dara julọ. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.