Ntụziaka nka

Nkewa GPU nke ọtụtụ ihe atụ

Multi-Instance GPU (MIG) bụ teknụzụ NVIDIA nke na-egbutu otu GPU anụ ahụ n'ime ọtụtụ akụkụ ngwaike dịpụrụ adịpụ.

Nchịkọta

Multi-Instance GPU (MIG) bụ teknụzụ NVIDIA nke na-egbutu otu GPU anụ ahụ n'ime ọtụtụ akụkụ ngwaike dịpụrụ adịpụ. Ọ dị mkpa n'ihi na ọ na-ahapụ otu ngwa ngwa ngwa ngwa dị oke ọnụ na-eje ozi ọtụtụ obere ọrụ n'otu oge na-enweghị ha na-etinye aka na ibe ha.

Multi-Instance GPU Partitioning bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, latency, na ntụkwasị obi n'ọ̀tụ̀tụ̀.

Ime miri emi

Ewebata ya na NVIDIA A100 (Ampere) wee gaa n'ihu na H100 na GPU nke etiti data ọhụrụ, MIG na-ese GPU n'ime ihe ruru ugboro asaa nọọrọ onwe ha. N'adịghị ka slicing oge ngwanrọ, MIG na-enye ezigbo ikewapụ ngwaike: ihe atụ ọ bụla na-enweta multiprocessors gụgharia raara onwe ya nye (SMs), Mpekere cache L2, ndị na-ahụ maka ebe nchekwa na ebe nchekwa dị elu nke ebe nchekwa bandwidth dị elu. Enwere ike kewaa A100 nwere 40GB n'ọnọdụ asaa 5GB, ma ọ bụ nke pere mpe. Nkebi nke ọ bụla na-eme ka obere GPU kwụ ọtọ, yabụ ọrụ mkpọtụ ma ọ bụ na-akụda n'otu oge enweghị ike ịnwụ ma ọ bụ mebie ọzọ. Ọrụ a na-ekwe nkwa na-eme ka MIG dị mma maka ozi ntinye aka, ụyọkọ ndị nwe ụlọ, na gburugburu mmepe ebe ọtụtụ ndị ọrụ na-ekerịta otu kaadị.

Nghọta nka nka

MIG na-arụ ọrụ site n'iji anụ ahụ na-eme ka ihe dị n'ime GPU dị n'ime ya ka ihe atụ ọ bụla nwee ụzọ edoziri na ebe nchekwa nke ya na SMS. NVIDIA na-akọwapụta profaịlụ dị ka ụmụ irighiri ihe dị ka 1g.5gb (otu mpekere compute, 5GB) ruo 7g.40gb. Ihe ngosi GPU na-edobe ebe nchekwa na SMS; N'ime ya, Compute Interstance na-ekesa SMS n'ihu. N'ihi na akụkụ ndị ahụ bụ ngwaike-mmanye, mmejọ, njehie ECC na bandwit ebe nchekwa nọrọ naanị otu ihe atụ.

Ịmalite nkewa GPU nke ọtụtụ ihe atụ

Multi-Instance GPU (MIG) bụ teknụzụ NVIDIA nke na-egbutu otu GPU anụ ahụ n'ime ọtụtụ akụkụ ngwaike dịpụrụ adịpụ. Ọ dị mkpa n'ihi na ọ na-ahapụ otu ngwa ngwa ngwa ngwa dị oke ọnụ na-eje ozi ọtụtụ obere ọrụ n'otu oge na-enweghị ha na-etinye aka na ibe ha. Multi-Instance GPU Partitioning bụ ngọngọ ụlọ ọrụ nka nke na-emetụta ịdịmma nlereanya, ọnụ ahịa akụrụngwa, latency, na ntụkwasị obi n'ọ̀tụ̀tụ̀. Iji wulite nghọta miri emi, na-emeso Multi-Instance GPU Partitioning dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, kewaa ihe sistemụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.

Na omume, otu ndị siri ike na-eji Multi-Instance GPU Partitioning na-ebuli ụkpụrụ ụlọ, data na akụrụngwa megide ntụkwasị obi na ọnụ ahịa. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'otu oge ahụ, ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.

Mmetụta atụmatụ

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ.

Mkpebi ihe owuwu ụlọ na-akwalite arụmọrụ yana ọnụ ahịa ọrụ ruo ọtụtụ afọ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ.

Nkà mmụta nka na-enyere ndị otu egwuregwu aka ịhọrọ nchịkọta ziri ezi, ọ bụghị naanị nke kachasị ọhụrụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta.

Nhọrọ injinia ka mma na-ebelata ihe omume ntụkwasị obi na mmepụta. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Ọdịnihu nke nkewa GPU ọtụtụ ihe atụ

Ka GPU na-eto ruo 80GB, 141GB, na karịa, nkewa na-adọrọ mmasị karị n'ihi na ụdị onye ọ bụla anaghị achọ kaadị zuru ezu maka ntinye aka. Na-atụ anya Kubernetes siri ike na njikọta ígwé ojii, nbibi dị ike na-enweghị igbapu ọnụ ọnụ, yana profaịlụ mara mma. Ndị na-ere ahịa na-asọmpi na-agbaso ụdị SR-IOV-ụdị GPU virtualization, na ikpo okwu na-enweghị ihe nkesa na-adabere na nkewa iji kwakọba ọtụtụ ụdị ma bepụ ihe mkpofu na-abaghị uru.

Mmejuputa n'ezie n'ụwa

Onye na-eweta ígwé ojii na-ekewa otu A100 n'ime oge asaa ka ndị ahịa asaa ọ bụla na-enweta nkwa nke GPU dịpụrụ adịpụ maka ntinye.

Otu ụyọkọ nyocha nke mahadum na-enye nwa akwụkwọ PhD ọ bụla ihe atụ 10GB MIG maka imepụta ihe kama ịchịkọta kaadị niile.

Ọrụ inference na-achịkọta ọtụtụ obere asụsụ na ụdị ọhụụ n'otu H100, nke ọ bụla na nkebi nke ya nwere ike ịnwụ anwụ.

Otu ụyọkọ Kubernetes na-akpọsa oge MIG dị ka akụrụngwa nwere ike ịhazi ya mere pods rịọ 'nvidia.com/mig-1g.5gb' dị ka akụrụngwa ọ bụla ọzọ.

Usoro mmejuputa

Multi-Atụmatụ GPU nkewa na omume

Onye na-eweta ígwé ojii na-ekewa otu A100 n'ime oge asaa ka ndị ahịa asaa ọ bụla na-enweta nkwa nke GPU dịpụrụ adịpụ maka ntinye.

Onye na-eweta ígwé ojii na-ekewa otu A100 n'ime oge asaa ka ndị ahịa asaa ọ bụla na-enweta nkwa nke GPU dịpụrụ adịpụ maka ndị otu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ ọnụ, ma soro ma uru mmepụta na ụgwọ njehie na oge.

Multi-Atụmatụ GPU nkewa na omume

Otu ụyọkọ nyocha nke mahadum na-enye nwa akwụkwọ PhD ọ bụla ihe atụ 10GB MIG maka imepụta ihe kama ịchịkọta kaadị niile.

Otu ụyọkọ nyocha nke mahadum na-enye nwa akwụkwọ ọ bụla PhD ihe atụ 10GB MIG maka prototyping kama ịchịkọta kaadị niile Otu egwuregwu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ọnụ, ma soro ma uru nrụpụta yana ụgwọ njehie na oge.

Multi-Atụmatụ GPU nkewa na omume

Ọrụ inference na-achịkọta ọtụtụ obere asụsụ na ụdị ọhụụ n'otu H100, nke ọ bụla na nkebi nke ya nwere ike ịnwụ anwụ.

Ọrụ inference na-achịkọta ọtụtụ obere asụsụ na ụdị ọhụụ n'otu H100, nke ọ bụla n'ime nkebi nke ya na ndị otu latency a na-atụghị anya ya na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.

Multi-Atụmatụ GPU nkewa na omume

Otu ụyọkọ Kubernetes na-akpọsa oge MIG dị ka akụrụngwa nwere ike ịhazi ya mere pods rịọ 'nvidia.com/mig-1g.5gb' dị ka akụrụngwa ọ bụla ọzọ.

Otu ụyọkọ Kubernetes na-akpọsa oge MIG dị ka akụrụngwa nwere ike ịhazi ya mere pods na-arịọ 'nvidia.com/mig-1g.5gb' dị ka ndị otu akụ ndị ọzọ na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka oke ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie ka oge na-aga.

Ihe ize ndụ & okporo ụzọ nche

!

Ịkwalite otu akara ngosi nwere ike zoo adịghị ike sistemụ sara mbara.

!

A na-eledakarị ihe akụrụngwa na ụgwọ ọrụ anya.

!

Ọdịiche nchekwa na nleba anya nwere ike itolite ka sistemu na-adịwanye mgbagwoju anya.

Map mmejuputa

1

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya.

Kọwaa latency, ịdịmma na ebumnuche ọnụ ahịa tupu mmejuputa ya. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

2

Benchmark n'okpuru ibu dị adị na ọnọdụ data.

Benchmark n'okpuru ibu dị adị na ọnọdụ data. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

3

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ.

Nleba anya akụrụngwa maka mperi, ịkpafu na mmetụta onye ọrụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

4

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa.

Kwadebe ụzọ nzaghachi azụghachi azụ na ihe omume tupu ịchachaa. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

Nọgide na-eme nchọpụta