Imọ Itọsọna

Adam ati Adaptive Optimizers

Adam jẹ oluṣapejuwe iṣẹ-iṣẹ lẹhin ọpọlọpọ awọn nẹtiwọọki nkankikan ode oni, yiyi oṣuwọn ikẹkọ lọtọ laifọwọyi fun gbogbo paramita.

Akopọ

Adam jẹ oluṣapejuwe iṣẹ-iṣẹ lẹhin ọpọlọpọ awọn nẹtiwọọki nkankikan ode oni, yiyi oṣuwọn ikẹkọ lọtọ laifọwọyi fun gbogbo paramita. O ṣe pataki nitori pe o jẹ ki ikẹkọ awọn awoṣe ti o jinlẹ ni iyara ati pe o kere si finicky ju isunmọ gradient itele.

Adam ati Adaptive Optimizers jẹ bulọọki ile imọ-ẹrọ ti o ni ipa lori didara awoṣe, idiyele amayederun, lairi, ati igbẹkẹle ni iwọn.

Jin Dive

Adam (Aṣaro akoko Adaptive), ti a ṣe nipasẹ Kingma ati Ba ni 2014, dapọ awọn ero meji. Ni akọkọ, ipa: o tọju aropin ibajẹ lasan ti awọn gradients ti o kọja (akoko akọkọ) nitorinaa awọn imudojuiwọn kọ iyara ni awọn itọsọna deede. Ẹlẹẹkeji, fun-paramita igbelosoke: o tọpasẹ aropin ti squared gradients (awọn keji akoko) ati ki o pin kọọkan igbese nipa awọn square root ti iye yẹn, ki paramita pẹlu nla, alariwo gradients ya kere awọn igbesẹ ti ati ki o ṣọwọn-imudojuiwọn ti o tobi igbese. Iyipada yii tumọ si pe o le nigbagbogbo lo oṣuwọn ẹkọ kan kọja gbogbo nẹtiwọọki kan. Iyatọ kan, AdamW, decouples idibajẹ iwuwo lati imudojuiwọn gradient ati pe o ti di aiyipada fun ikẹkọ awọn oluyipada nla ati awọn awoṣe ede.

Imọ-imọ-ẹrọ

Adam n ṣetọju awọn iwọn ṣiṣe meji fun paramita: m (awọn gradients) ati v (awọn gradients onigun mẹrin), imudojuiwọn pẹlu awọn oṣuwọn ibajẹ beta1 (ni deede 0.9) ati beta2 (ni deede 0.999). Nitoripe awọn mejeeji bẹrẹ ni odo, wọn jẹ atunṣe-aiṣedeede nipasẹ pipin nipasẹ (1 - beta ^ t). Imudojuiwọn naa jẹ theta = theta - lr * m_hat / (sqrt (v_hat) + epsilon), nibiti epsilon (ni ayika 1e-8) ṣe idiwọ pipin nipasẹ odo. Eyi ni idi ti Adam nilo atunṣe oṣuwọn-ẹkọ kekere ni akawe si SGD itele.

Mastering Adam ati Adaptive Optimizers

Adam jẹ oluṣapejuwe iṣẹ-iṣẹ lẹhin ọpọlọpọ awọn nẹtiwọọki nkankikan ode oni, yiyi oṣuwọn ikẹkọ lọtọ laifọwọyi fun gbogbo paramita. O ṣe pataki nitori pe o jẹ ki ikẹkọ awọn awoṣe ti o jinlẹ ni iyara ati pe o kere si finicky ju isunmọ gradient itele. Adam ati Adaptive Optimizers jẹ bulọọki ile imọ-ẹrọ ti o ni ipa lori didara awoṣe, idiyele amayederun, lairi, ati igbẹkẹle ni iwọn. Lati kọ oye ti o jinlẹ, tọju Adam ati Awọn olupilẹṣẹ Adaptive bi awoṣe iṣẹ, kii ṣe ẹya ẹyọkan: ṣalaye awọn abajade ti o fẹ, ṣe alaye awọn arosọ, ati sọtọ ohun ti eto le ṣe ni igbẹkẹle lati ohun ti o tun nilo idajọ amoye.

Ni iṣe, awọn ẹgbẹ ti o lagbara ni lilo Adam ati Awọn olupilẹṣẹ Adaptive ṣe iṣapeye faaji, data, ati awọn yiyan amayederun lodi si igbẹkẹle ati idiyele. Wọn ṣe akọsilẹ awọn ibeere aṣeyọri ti o fojuhan, idanwo lodi si data ojulowo ati ṣiṣan iṣẹ, ati atunbere ti o da lori awọn ilana ikuna ti a ṣakiyesi dipo awọn bori ala-akoko kan. Eyi ni ibiti oye imọ-jinlẹ yipada si agbara ti o tọ kọja ọja, eto imulo, ati awọn iṣẹ ṣiṣe.

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun. Ni akoko kanna, Imudara iwọn ala kan le tọju awọn ailagbara eto to gbooro. Ọna resilient julọ julọ ni lati darapọ iyara idanwo pẹlu ibawi ijọba: ṣiṣe awọn awakọ awakọ, mu ẹri mu, ṣe atẹjade awọn iwe ipinnu, ati imudojuiwọn awọn aabo nigbagbogbo bi ihuwasi awoṣe, awọn ireti olumulo, ati awọn ibeere ilana ti dagbasoke.

Ipa Ilana

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun.

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Ẹkọ imọ-ẹrọ ṣe iranlọwọ fun awọn ẹgbẹ lati yan akopọ to tọ, kii ṣe ọkan tuntun nikan.

Ẹkọ imọ-ẹrọ ṣe iranlọwọ fun awọn ẹgbẹ lati yan akopọ to tọ, kii ṣe ọkan tuntun nikan. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Awọn yiyan imọ-ẹrọ to dara julọ dinku awọn iṣẹlẹ igbẹkẹle ni iṣelọpọ.

Awọn yiyan imọ-ẹrọ to dara julọ dinku awọn iṣẹlẹ igbẹkẹle ni iṣelọpọ. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Ojo iwaju ti Adam ati Adaptive Optimizers

Adam ati AdamW wa gaba lori, ṣugbọn iwadi ti wa ni titari si ṣiṣe fun aimọye-paramita awọn awoṣe, ibi ti o ti fipamọ meji afikun iye fun àdánù jẹ gbowolori. Awọn iyatọ ina iranti bi Adafactor, Adam 8-bit, ati awọn iṣapeye tuntun bii kiniun (eyiti o nlo ipa ti o da lori ami nikan) ati Sophia ṣe ifọkansi lati baramu didara Adam pẹlu iranti ti o dinku tabi isọpọ yiyara. Reti awọn iṣapeye aṣamubadọgba aifwy pataki fun pinpin, ikẹkọ konge kekere lati tẹsiwaju idagbasoke.

Real-World imuse

Ikẹkọ awọn awoṣe ede nla bi GPT ati Llama, eyiti o lo AdamW gẹgẹbi olupilẹṣẹ boṣewa.

Ṣiṣatunṣe didara didara aworan ti a ti kọkọ tẹlẹ (fun apẹẹrẹ, ResNet) lori iwe data aṣa kan pẹlu oṣuwọn ikẹkọ Adamu aifọwọṣe kan.

Ikẹkọ awọn awoṣe itankale lẹhin awọn olupilẹṣẹ aworan gẹgẹbi Itupalẹ Stable.

Ṣiṣẹ Adam 8-bit ni awọn ile-ikawe bii bitsandbytes lati baamu awọn ipinlẹ iṣapeye sinu iranti GPU ti o lopin.

Awọn Ilana imuse

Adam ati Adaptive Optimizers ni iwa

Ikẹkọ awọn awoṣe ede nla bi GPT ati Llama, eyiti o lo AdamW gẹgẹbi olupilẹṣẹ boṣewa.

Ikẹkọ awọn awoṣe ede nla bii GPT ati Llama, eyiti o lo AdamW gẹgẹbi awọn ẹgbẹ iṣapeye boṣewa nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.

Adam ati Adaptive Optimizers ni iwa

Ṣiṣatunṣe didara didara aworan ti a ti kọkọ tẹlẹ (fun apẹẹrẹ, ResNet) lori iwe data aṣa kan pẹlu oṣuwọn ikẹkọ Adamu aifọwọṣe kan.

Ṣiṣe atunṣe didara aworan ti a ti kọ tẹlẹ (fun apẹẹrẹ, ResNet) lori data aṣa kan pẹlu aiyipada oṣuwọn ikẹkọ Adam Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna igbega eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe lori akoko.

Adam ati Adaptive Optimizers ni iwa

Ikẹkọ awọn awoṣe itankale lẹhin awọn olupilẹṣẹ aworan gẹgẹbi Itupalẹ Stable.

Ikẹkọ awọn awoṣe itankale lẹhin awọn olupilẹṣẹ aworan gẹgẹbi Awọn ẹgbẹ Itumọ Stable nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.

Adam ati Adaptive Optimizers ni iwa

Ṣiṣẹ Adam 8-bit ni awọn ile-ikawe bii bitsandbytes lati baamu awọn ipinlẹ iṣapeye sinu iranti GPU ti o lopin.

Ṣiṣe 8-bit Adam ni awọn ile-ikawe bii bitsandbytes lati baamu awọn ipinlẹ iṣapeye sinu awọn ẹgbẹ iranti GPU ti o lopin nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe ni akoko pupọ.

Awọn ewu & Awọn ọna iṣọ

!

Ṣiṣepe ala-ilẹ kan le tọju awọn ailagbara eto ti o gbooro.

!

Awọn ohun elo amayederun ati awọn idiyele itọju nigbagbogbo ni aibikita.

!

Aabo ati awọn ela akiyesi le dagba bi awọn eto ṣe di eka sii.

Ilana Ilana imuse

1

Ṣetumo lairi, didara, ati awọn ibi-afẹde idiyele ṣaaju imuse.

Ṣetumo lairi, didara, ati awọn ibi-afẹde idiyele ṣaaju imuse. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

2

Aṣepari labẹ ẹru ojulowo ati awọn ipo data.

Aṣepari labẹ ẹru ojulowo ati awọn ipo data. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

3

Abojuto ohun elo fun awọn aṣiṣe, fiseete, ati ipa olumulo.

Abojuto ohun elo fun awọn aṣiṣe, fiseete, ati ipa olumulo. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

4

Mura ipadasẹhin pada ati awọn ipa ọna esi iṣẹlẹ ṣaaju iwọn.

Mura ipadasẹhin pada ati awọn ipa ọna esi iṣẹlẹ ṣaaju iwọn. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

Tesiwaju Ṣiṣawari