Ntụziaka nka

Ngwakọta nkenke Ọzụzụ

Ọzụzụ ziri ezi agwakọta na-eme ka ọzụzụ netwọkụ akwara dị ngwa ma belata ojiji ebe nchekwa site na ịme ọtụtụ mgbakọ na mwepụ na 16-bit floating point kama 32-bit.

Nchịkọta

Ọzụzụ ziri ezi agwakọta na-eme ka ọzụzụ netwọkụ akwara dị ngwa ma belata ojiji ebe nchekwa site na ịme ọtụtụ mgbakọ na mwepụ na 16-bit floating point kama 32-bit. Ọ na-ahapụ otu GPU ịzụ nnukwu ụdị ngwa ngwa na ọ fọrọ nke nta ka ọ bụrụ enweghị mfu na izi ezi.

Ọzụzụ Ngwakọta Ngwakọta bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, nkwụsịtụ, na ntụkwasị obi n'ọ̀tụ̀tụ̀.

Ime miri emi

Ọzụzụ ọdịnala na-echekwa nha ma na-agba mgbakọ na mwepụ na 32-bit floating point (FP32). Ngwakọta agwakọta na-eji usoro 16-bit nkenke dị ala (FP16 ma ọ bụ bfloat16) maka ịba ụba matriks dị arọ, ebe ị na-edobe 'mbibi ukwu' nke 32-bit maka mmelite kwụsiri ike. N'ihi na ọnụọgụ 16-bit bụ ọkara nha, dabara adaba na ebe nchekwa GPU yana Tensor Cores na-ahazi ha ngwa ngwa 2-8x. Njide ahụ bụ warara dị warara nke FP16: obere gradients nwere ike ịbanye na efu. Ọkọlọtọ ndozi bụ ọnwụ scaling, nke na-amụba ọnwụ site nnukwu ihe tupu backpropagation ka obere gradients na-anọchi anya, wee kewaa ya azụ tupu ibu mmelite. NVIDIA's Apex na AMP arụnyere n'ime ya (Automatic Mixed Precision) na PyTorch na TensorFlow na-emezi nke a.

Nghọta nka nka

FP16 nwere naanị 5 exponent ibe n'ibe, na-enye obere ike nso na-akpata gradient eruba. Bfloat16 na-edobe 8 exponent ibe n'ibe (dakọtara na FP32 si nso) ma ole na ole mantissa ibe n'ibe, ya mere ọ na-adịkarịghị mkpa ọnwụ scaling - isi ihe kpatara Google TPUs na ọgbara ọhụrụ GPUs kwadoro ya. Tensor Cores na-eme ka ọrụ ahụ dịkwuo elu site n'ịba ụba operands 16-bit mana na-agbakọta nchikota akụkụ na FP32, na-echekwa nkenke ebe njehie nchịkọta ga-agbakọta ma ọ bụghị ya.

Ịmụta Ọzụzụ Ngwakọta Ngwakọta

Ọzụzụ ziri ezi agwakọta na-eme ka ọzụzụ netwọkụ akwara dị ngwa ma belata ojiji ebe nchekwa site na ịme ọtụtụ mgbakọ na mwepụ na 16-bit floating point kama 32-bit. Ọ na-ahapụ otu GPU ịzụ nnukwu ụdị ngwa ngwa na ọ fọrọ nke nta ka ọ bụrụ enweghị mfu na izi ezi. Ọzụzụ Mixed Precision Training bụ ngọngọ ụlọ ọrụ teknụzụ na-emetụta ogo ihe nlere anya, ọnụ ahịa akụrụngwa, nkwụsịtụ, na ntụkwasị obi n'ọ̀tụ̀tụ̀. Iji wulite nghọta miri emi, na-emeso Ọzụzụ Ngwakọta Ngwakọta dị ka ihe nlere anya na-arụ ọrụ, ọ bụghị otu njirimara: kọwapụta nsonaazụ achọrọ, dokwuo anya echiche, kewaa ihe sistemu ahụ nwere ike ime nke ọma na ihe ka chọrọ mkpebi ndị ọkachamara.

Na omume, otu ndị siri ike na-eji Ọzụzụ Ngwakọta Ngwakọta na-ebuli ụkpụrụ ụlọ, data, na nhọrọ akụrụngwa megide ntụkwasị obi na ọnụ ahịa. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'otu oge ahụ, ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.

Mmetụta atụmatụ

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Ọdịnihu nke Ọzụzụ Ngwakọta Ngwakọta

Nkenkenke na-aga n'ihu na-agbada. Ọzụzụ FP8, nke akwadoro na NVIDIA Hopper na Blackwell GPUs, na-aghọ ọkọlọtọ maka ụdị oke, na nyocha n'ime ụdị FP4 na microscaling (MXFP) na-aga n'ihu. Na-atụ anya ka usoro iji họrọ nkenke nkenke nke ọ bụla, ngwaike iji na-ejizi usoro ndị na-adịwanye warara nke ọma, yana ọzụzụ mara nke ọma iji mebie ahịrị n'etiti ọzụzụ dị obere na ntinye, na-ebelata ọnụ ahịa ọzụzụ ụdị trillion-parameter.

Mmejuputa n'ezie n'ụwa

PyTorch's torch.cuda.amp.autocast na-ekechi loop ọzụzụ iji belata ebe nchekwa dị obere na ntinye okpukpu abụọ na otu GPU

Ọzụzụ ụdị asụsụ buru ibu dị ka ihe ntụgharị ụdị GPT na bfloat16 na TPU ka ịzena ntuzigharị ihe na-efu.

Itinye nnukwu batch buru ibu na onye ahịa RTX GPU site na ịgbanwere ọzụzụ onyonyo ResNet site na FP32 gaa na FP16

Ngwakọta FP8 ziri ezi na NVIDIA H100 GPUs iji belata ọnụ ahịa ụzọ ọzụzụ ụdịdị oke ala.

Usoro mmejuputa

Ngwakọta nkenke nkuzi na omume

PyTorch's torch.cuda.amp.autocast na-ekechi loop ọzụzụ iji wedata ebe nchekwa nke ọma na ntinye ugboro abụọ na otu GPU.

PyTorch's torch.cuda.amp.autocast na-ekpuchi oghere ọzụzụ iji belata ebe nchekwa na ntinye okpukpu abụọ na otu GPU otu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ okwu, ma soro ma uru nrụpụta na ụgwọ njehie na oge.

Ngwakọta nkenke nkuzi na omume

Ọzụzụ ụdị asụsụ buru ibu dị ka ihe ngbanwe ụdị GPT na bfloat16 na TPU ka ịzenarị ntuzigharị mfu.

Ọzụzụ nnukwu ụdị asụsụ dị ka ihe ntụgharị ụdị GPT na bfloat16 na TPUs ka ịzenarị ntuzigharị na-efunahụ ndị otu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ọnụ, wee soro ma uru nrụpụta yana ụgwọ njehie ka oge na-aga.

Ngwakọta nkenke nkuzi na omume

Itinye nha batch buru ibu na onye ahịa RTX GPU site na ịgbanwere ọzụzụ onyonyo ResNet site na FP32 gaa na FP16.

Ịdaba nha batch buru ibu na onye ahịa RTX GPU site na ịgbanwere ọzụzụ onyonyo ResNet site na FP32 gaa na otu FP16 na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, debe ụzọ ịrị elu mmadụ maka ikpe ọnụ, wee soro ma uru nrụpụta yana ụgwọ njehie na oge.

Ngwakọta nkenke nkuzi na omume

Ngwakọta FP8 ziri ezi na NVIDIA H100 GPUs iji belata ọnụ ahịa ụzọ ọzụzụ ụdịdị nha nha.

Ngwakọta FP8 ziri ezi na NVIDIA H100 GPUs iji belata ọnụ ahịa nke pretraining front-scale model Otu dị iche iche na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ọnụ, wee soro ma uru nrụpụta na ụgwọ njehie n'ime oge.

Ihe ize ndụ & okporo ụzọ nche

!

Ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara.

!

A na-eledakarị ihe akụrụngwa na ụgwọ ọrụ anya.

!

Ọdịiche nchekwa na nleba anya nwere ike itolite ka sistemu na-adịwanye mgbagwoju anya.

Map mmejuputa

1

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya.

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

2

Benchmark n'okpuru ibu dị adị na ọnọdụ data.

Benchmark n'okpuru ibu dị adị na ọnọdụ data. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

3

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ.

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

4

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa.

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

Nọgide na-eme nchọpụta