Ntụziaka nka

Nlereanya na Pipeline Parallelism

Mgbe ihe nlere buru oke ibu ka ọ dabara na otu GPU, ihe nlereanya na myirịta pipeline kewara ihe nlereanya n'onwe ya n'ofe ngwaọrụ.

Nchịkọta

Mgbe ihe nlere buru oke ibu ka ọ dabara na otu GPU, ihe nlereanya na myirịta pipeline kewara ihe nlereanya n'onwe ya n'ofe ngwaọrụ. Nke a bụ ihe na-eme ka ọzụzụ nnukwu ụdị asụsụ nwere ọtụtụ narị ijeri paramita n'anụ ahụ kwe omume.

Nlereanya na Pipeline Parallelism bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, nkwụsịtụ, na ntụkwasị obi n'ogo.

Ime miri emi

Ihe nlere anya na-ekewa otu ụdị n'ofe GPU dị iche iche, yabụ na ọ nweghị ngwaọrụ kwesịrị ijide ihe niile. Enwere isi ụtọ abụọ. Tensor (intra-layer) myirịta na-ekewa mgbakọ na mwepụ n'ime oyi akwa, dị ka igbutu nnukwu matrix multiplication gafee GPUs nke onye ọ bụla na-agbakọ akụkụ nke mmepụta. Pipeline (inter-layer) parallelism na-ekenye ọkwa dị iche iche na-esochi na GPU dị iche iche, yabụ mgbochi oyibo 1 na-ebi na GPU 0, gbochie 2 na GPU 1, na ihe ndị ọzọ, yana mmemme gafere n'ihu dị ka ahịrị mgbakọ. Ihe ịma aka dị na pipelining naive bụ 'afụ': ebe GPU 0 na-arụ ọrụ na batch mbụ, GPU dị ala na-anọdụ ala. Pipelining na-ekewa ogbe ọ bụla ka ọ bụrụ obere batches ka usoro niile wee na-arụsi ọrụ ike, na-emewanyewanye ojiji n'ụzọ dị egwu.

Nghọta nka nka

Tensor parallelism (dị ka ọ dị na NVIDIA Megatron-LM) na-ekewa kọlụm matrices dị arọ - ma ọ bụ n'ahịrị-amamihe ma na-eji ihe niile belata iji chịkọta nsonaazụ akụkụ, na-edobe nkwukọrịta n'ime oghere NVLink ngwa ngwa. Myirịta pipeline (GPipe, PipeDream) na-ekewa ogbe ahụ ka ọ bụrụ obere batches nke na-agafe n'usoro n'usoro n'usoro, na-ebelata oge 'afụ' na-abaghị uru. A na-ejikọkarị ha abụọ ọnụ, yana myirịta tensor n'ime ọnụ ọnụ yana myirịta pipeline gafee ọnụ ọnụ.

Nlereanya Mastering na Pipeline Parallelism

Mgbe ihe nlere buru oke ibu ka ọ dabara na otu GPU, ihe nlereanya na myirịta pipeline kewara ihe nlereanya n'onwe ya n'ofe ngwaọrụ. Nke a bụ ihe na-eme ka ọzụzụ nnukwu ụdị asụsụ nwere ọtụtụ narị ijeri paramita n'anụ ahụ kwe omume. Nlereanya na Pipeline Parallelism bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, nkwụsịtụ, na ntụkwasị obi n'ogo. Iji wuo nghọta miri emi, na-emeso Model na Pipeline Parallelism dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewaa ihe usoro ahụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.

Na omume, otu ndị siri ike na-eji Model na Pipeline Parallelism na-ebuli ụkpụrụ ụlọ, data, na nhọrọ akụrụngwa megide ntụkwasị obi na ọnụ ahịa. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'otu oge ahụ, ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.

Mmetụta atụmatụ

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Ọdịnihu nke Model na Pipeline Parallelism

Frameworks na-akawanye nsogbu siri ike nke ikpebi ka esi ekewaa ihe nlere n'ofe ngwaọrụ, na-eji profaịlụ na ọchụchọ iji dozie mgbakọ na mwepụ na nzikọrịta ozi. Na-atụ anya njikọ siri ike nke tensor, pipeline, na data parallelism (3D parallelism), nhazi oge micro-batch ka ọ fọrọ nke nta ka ọ ghara ikpochapụ afụ ọkpọkọ, yana ngwaike nwere njikọ ngwa ngwa ka ikewa otu oyi akwa n'ofe ibe ga-adị ọnụ ala ma na-emekarị maka ụdị ndị na-ebuwanye ibu.

Mmejuputa n'ezie n'ụwa

Ụdị ụdị GPT na-enye NVIDIA Megatron-LM ọzụzụ, nke na-ekewa nlebara anya nke oyi akwa ọ bụla yana matrices na-ebugharị n'ofe GPU site na myirịta tensor.

Iji GPipe idowe ọkwa dị iche iche nke nnukwu ọhụụ ma ọ bụ ụdị asụsụ na ngwa ngwa dị iche iche ebe micro-batching na-eme ka ha na-arụsi ọrụ ike.

Igwe pipeline nke DeepSpeed ​​na-ekewa ihe atụ nke ọtụtụ narị ijeri ijeri n'ime usoro n'ofe ọtụtụ ọnụ.

Na-ejikọta tensor parallelism n'ime otu sava 8-GPU nwere myirịta pipeline na-agbasa ọtụtụ sava iji zụọ ihe nlereanya buru ibu maka otu igwe.

Usoro mmejuputa

Nlereanya na Pipeline Parallelism na omume

Ụdị ụdị GPT na-enye NVIDIA Megatron-LM ọzụzụ, nke na-ekewa nlebara anya nke oyi akwa ọ bụla yana matrices na-ebugharị n'ofe GPU site na myirịta tensor.

Ọzụzụ ụdị GPT na NVIDIA Megatron-LM, nke na-ekewa nlebara anya nke oyi akwa ọ bụla na matrices na-aga n'ihu gafee GPUs site na tensor parallelism Teams na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ọnụ ọnụ, ma soro ma uru nrụpụta na ụgwọ njehie n'ime oge.

Nlereanya na Pipeline Parallelism na omume

Iji GPipe idowe ọkwa dị iche iche nke nnukwu ọhụụ ma ọ bụ ụdị asụsụ na ngwa ngwa dị iche iche ebe micro-batching na-eme ka ha na-arụsi ọrụ ike.

Iji GPipe tinye ọkwa dị iche iche nke nnukwu ọhụụ ma ọ bụ ụdị asụsụ na ndị na-eme ngwa ngwa dị iche iche ebe micro-batching na-eme ka ha na-arụsi ọrụ ike Otu egwuregwu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-edebe ụzọ ịrị elu mmadụ maka ikpe ikpe, ma soro ma uru nrụpụta na ụgwọ njehie na oge.

Nlereanya na Pipeline Parallelism na omume

Igwe pipeline nke DeepSpeed ​​na-ekewa ihe atụ nke ọtụtụ narị ijeri ijeri n'ime usoro n'ofe ọtụtụ ọnụ.

DeepSpeed's pipeline engine nkewa nkewa ihe atụ nke ọtụtụ narị ijeri ijeri n'ime usoro n'ofe ọtụtụ ọnụ Otu dị iche iche na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ikpe ikpe, ma soro ma uru nrụpụta yana ọnụ ahịa njehie ka oge na-aga.

Nlereanya na Pipeline Parallelism na omume

Na-ejikọta tensor parallelism n'ime otu sava 8-GPU nwere myirịta pipeline na-agbasa ọtụtụ sava iji zụọ ihe nlereanya buru ibu maka otu igwe.

Ijikọta tensor parallelism n'ime otu ihe nkesa 8-GPU na pipeline parallelism nke na-agbasa ọtụtụ sava iji zụọ ihe nlereanya dị oke ukwuu maka otu igwe Otu ìgwè na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ọnụ okwu, ma soro ma uru nrụpụta na ụgwọ njehie n'ime oge.

Ihe ize ndụ & okporo ụzọ nche

!

Ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara.

!

A na-eledakarị ihe akụrụngwa na ụgwọ ọrụ anya.

!

Ọdịiche nchekwa na nleba anya nwere ike itolite ka sistemu na-adịwanye mgbagwoju anya.

Map mmejuputa

1

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya.

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

2

Benchmark n'okpuru ibu dị adị na ọnọdụ data.

Benchmark n'okpuru ibu dị adị na ọnọdụ data. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

3

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ.

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

4

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa.

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

Nọgide na-eme nchọpụta