Nchịkọta
ZeRO (Zero Redundancy Optimizer) na-ewepụ myigharị ebe nchekwa na-emebi emebi nke myirịta data site na ịkesa steeti optimizer, gradients, na arọ gafee GPUs. Ọ na-enye gị ohere ịzụ nnukwu ụdị n'ịdị mfe nke data myirịta mana akụkụ dị nta nke ebe nchekwa GPU ọ bụla.
ZeRO na Sharded Optimizers bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, latency, na ntụkwasị obi n'ogo.
Ime miri emi
Na ndakọrịta data nkịtị, GPU ọ bụla na-echekwa nnomi zuru oke nke steeti optimizer, gradients na paramita, nke na-emebi emebi, ọkachasị maka Adam, ebe steeti optimizer nwere ike ịdị ọtụtụ ugboro karịa ụdị n'onwe ya. ZeRO, nke Microsoft webatara na DeepSpeed , na-ewepụ ọrụ ọrụ a site na ikewa tenors ndị a n'ofe GPU ka ngwaọrụ ọ bụla nwee naanị iberi. ZeRO na-abịa na usoro atọ na-aga n'ihu: Stege 1 shards optimizer state, Stage 2 na-agbakwụnye gradient sharding, na Stage 3 shards parampat n'onwe ha. Dị ka ọ dị mkpa, GPU na-achịkọta mpekere efu site na nzikọrịta ozi, gbakọọ, wee hapụ ha. Nsonaazụ bụ ebe nchekwa dị ala nke ukwuu n'otu GPU, na-enyere ọzụzụ ijeri na ijeri trillion, na-edobe usoro mmemme dị mfe nke myirịta data.
Nghọta nka nka
ZeRO na-azụta nzikọrịta ozi maka nchekwa nchekwa. N'ọkwa nke 3, tupu ngafe n'ihu oyi akwa, ndị otu niile na-anakọta oke oyi akwa ahụ na GPU nke ọ bụla; emesia a na-atụfu mpekere ndị na-enweghị ka ha nwetaghachi ebe nchekwa. A na-agbasasịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsịsị akwụkwọ) nke ha mere GPU ọ bụla na-edobe nanị iberi gradient dabara na paramita ọ nwere. PyTorch's FSDP (Fully Sharded Data Parallel) na-eme otu echiche ahụ n'ụdị ala, na-ekechi modul ka shard na reshard na ofufe.
Mastering ZeRO na Sharded Optimizers
ZeRO (Zero Redundancy Optimizer) na-ewepụ myigharị ebe nchekwa na-emebi emebi nke myirịta data site na ịkesa steeti optimizer, gradients, na arọ gafee GPUs. Ọ na-enye gị ohere ịzụ nnukwu ụdị n'ịdị mfe nke data myirịta mana akụkụ dị nta nke ebe nchekwa GPU ọ bụla. ZeRO na Sharded Optimizers bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, latency, na ntụkwasị obi n'ogo. Iji wulite nghọta miri emi, na-emeso ZeRO na Sharded Optimizers dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewaa ihe sistemụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.
Na omume, otu ndị siri ike na-eji ZeRO na Sharded Optimizers na-ebuli ụkpụrụ ụlọ, data, na nhọrọ akụrụngwa megide ntụkwasị obi na ọnụ ahịa. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.
Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'otu oge ahụ, ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.
Mmetụta atụmatụ
Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ.
Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ.
Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta.
Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Mmejuputa n'ezie n'ụwa
Iji DeepSpeed ZeRO Stage 2 dị mma iji dozie ụdị asụsụ ọtụtụ ijeri ijeri nke ga-ejupụta ebe nchekwa GPU.
Ọzụzụ ya na PyTorch FSDP, nke na-akụda paramita, gradients, na steeti njikarịcha n'ofe GPUs wee na-achịkọta ha kwa oyi akwa mgbe achọrọ.
Itinye ZeRO-Offload ka ịkwanye steeti optimizer na ebe nchekwa CPU, na-ahapụ otu GPU ka ọ zụọ ihe nlereanya ọtụtụ ugboro karịa VRAM ya.
Iji ZeRO-Infinity na-eme ka ihe atụ trillion-parameter na-eme ihe site na ịkwanye shards parameter sitere na nchekwa NVMe mgbe ebe nchekwa GPU na CPU kwụsịrị.
Usoro mmejuputa
ZeRO na Sharded Optimizers na omume
Iji DeepSpeed ZeRO Stage 2 dị mma iji dozie ụdị asụsụ ọtụtụ ijeri ijeri nke ga-ejupụta ebe nchekwa GPU.
Iji DeepSpeed ZRO Stage 2 dị mma iji dozie ụdị asụsụ ọtụtụ ijeri ijeri nke ga-ejupụta ndị otu ebe nchekwa GPU na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, debe ụzọ ịrị elu mmadụ maka ikpe ihu, wee soro ma uru nrụpụta yana ụgwọ njehie na oge.
ZeRO na Sharded Optimizers na omume
Ọzụzụ ya na PyTorch FSDP, nke na-akụda paramita, gradients, na steeti njikarịcha n'ofe GPUs wee na-achịkọta ha kwa oyi akwa mgbe achọrọ.
Ọzụzụ na PyTorch FSDP, nke na-akụda paramita, gradients, na steeti optimizer gafee GPUs ma na-achịkọta ha kwa oyi akwa na ọchịchọ Ndị otu na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, na-edobe ụzọ ịrị elu mmadụ maka ikpe ihu, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.
ZeRO na Sharded Optimizers na omume
Itinye ZeRO-Offload ka ịkwanye steeti optimizer na ebe nchekwa CPU, na-ahapụ otu GPU ka ọ zụọ ihe nlereanya ọtụtụ ugboro karịa VRAM ya.
Itinye ZeRO-Offload iji kwalite steeti optimizer na ebe nchekwa CPU, ikwe ka otu GPU zụọ ihe atụ ọtụtụ ugboro karịa otu VRAM ya na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ihu, ma soro ma uru nrụpụta na ụgwọ njehie n'oge.
ZeRO na Sharded Optimizers na omume
Iji ZeRO-Infinity na-eme ka ihe atụ trillion-parameter na-eme ihe site na ịkwanye shards parameter sitere na nchekwa NVMe mgbe ebe nchekwa GPU na CPU kwụsịrị.
Ịmepụta ihe atụ trillion-parameter na ZeRO-Infinity site na ịkwanye parameter shards site na nchekwa NVMe mgbe GPU na ebe nchekwa CPU na-agwụ Otu egwuregwu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ ọnụ, ma soro ma uru nrụpụta na ụgwọ njehie na-aga n'ihu oge.
Ihe ize ndụ & okporo ụzọ nche
Ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara.
A na-eledakarị ihe akụrụngwa na ụgwọ ọrụ anya.
Ọdịiche nchekwa na nleba anya nwere ike itolite ka sistemu na-adịwanye mgbagwoju anya.
Map mmejuputa
Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya.
Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Benchmark n'okpuru ibu dị adị na ọnọdụ data.
Benchmark n'okpuru ibu dị adị na ọnọdụ data. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ.
Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa.
Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.