Imọ Itọsọna

Awoṣe ati Pipeline Parallelism

Nigbati awoṣe ba tobi ju lati baamu lori GPU kan, awoṣe ati afiwera opo gigun ti epo pin awoṣe funrararẹ kọja awọn ẹrọ.

Akopọ

Nigbati awoṣe ba tobi ju lati baamu lori GPU kan, awoṣe ati afiwera opo gigun ti epo pin awoṣe funrararẹ kọja awọn ẹrọ. Eyi ni ohun ti o jẹ ki awọn awoṣe ede nla ikẹkọ pẹlu awọn ọgọọgọrun ọkẹ àìmọye ti awọn ayeraye ṣee ṣe ni ti ara.

Awoṣe ati Pipeline Parallelism jẹ bulọọki ile imọ-ẹrọ ti o ni ipa lori didara awoṣe, idiyele amayederun, lairi, ati igbẹkẹle ni iwọn.

Jin Dive

Awọn ipin parallelism awoṣe awoṣe ẹyọkan kọja ọpọlọpọ awọn GPUs nitorinaa ko si ẹrọ kan ti o nilo lati di gbogbo awọn iwuwo mu. Awọn adun akọkọ meji wa. Tensor (intra-Layer) parallelism pin mathematiki inu Layer kan, gẹgẹbi gige isodipupo matrix nla kan kọja awọn GPU ti ọkọọkan ṣe iṣiro apakan ti iṣelọpọ. Pipeline (inter-Layer) parallelism sọtọ oriṣiriṣi awọn ipele itẹlera si oriṣiriṣi GPUs, nitorinaa dina Layer 1 ngbe lori GPU 0, dina 2 lori GPU 1, ati bẹbẹ lọ, pẹlu awọn iṣẹ ṣiṣe ti kọja siwaju bi laini apejọ kan. Ipenija pẹlu pipelining ailabawọn ni 'nkuta': lakoko ti GPU 0 n ṣiṣẹ lori ipele akọkọ, awọn GPU ti o wa ni isalẹ joko laišišẹ. Pipelining pin ipele kọọkan si awọn ipele micro-kiki gbogbo awọn ipele duro lọwọ, ni ilọsiwaju iṣamulo gaan.

Imọ-imọ-ẹrọ

Tensor parallelism (gẹgẹ bi ninu NVIDIA Megatron-LM) pin awọn matrices iwuwo iwe- tabi ọgbọn-ila ati lo gbogbo-din lati tun awọn abajade apa kan ṣe, titọju ibaraẹnisọrọ inu ipade NVLink ti o yara. Pipeline parallelism (GPipe, PipeDream) pin ipele naa si awọn ipele kekere ti o nṣan nipasẹ awọn ipele ni iṣeto isọkusọ, idinku akoko ‘bubble’ laišišẹ. Awọn mejeeji maa n ṣe siwa papọ, pẹlu isọra tensor laarin ipade kan ati pipeline parallelism kọja awọn apa.

Awoṣe Mastering ati Pipeline Parallelism

Nigbati awoṣe ba tobi ju lati baamu lori GPU kan, awoṣe ati afiwera opo gigun ti epo pin awoṣe funrararẹ kọja awọn ẹrọ. Eyi ni ohun ti o jẹ ki awọn awoṣe ede nla ikẹkọ pẹlu awọn ọgọọgọrun ọkẹ àìmọye ti awọn ayeraye ṣee ṣe ni ti ara. Awoṣe ati Pipeline Parallelism jẹ bulọọki ile imọ-ẹrọ ti o ni ipa lori didara awoṣe, idiyele amayederun, lairi, ati igbẹkẹle ni iwọn. Lati kọ oye ti o jinlẹ, tọju Awoṣe ati Pipeline Parallelism bi awoṣe iṣẹ, kii ṣe ẹya ẹyọkan: ṣalaye awọn abajade ti o fẹ, ṣe alaye awọn arosọ, ati ya sọtọ ohun ti eto le ṣe ni igbẹkẹle lati ohun ti o tun nilo idajọ amoye.

Ni iṣe, awọn ẹgbẹ ti o lagbara ti o nlo Awoṣe ati Pipeline Parallelism ṣe iṣapeye faaji, data, ati awọn yiyan amayederun lodi si igbẹkẹle ati idiyele. Wọn ṣe akọsilẹ awọn ibeere aṣeyọri ti o fojuhan, idanwo lodi si data ojulowo ati ṣiṣan iṣẹ, ati atunbere ti o da lori awọn ilana ikuna ti a ṣakiyesi dipo awọn bori ala-akoko kan. Eyi ni ibiti oye imọ-jinlẹ yipada si agbara ti o tọ kọja ọja, eto imulo, ati awọn iṣẹ ṣiṣe.

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun. Ni akoko kanna, Imudara iwọn ala kan le tọju awọn ailagbara eto to gbooro. Ọna resilient julọ julọ ni lati darapọ iyara idanwo pẹlu ibawi ijọba: ṣiṣe awọn awakọ awakọ, mu ẹri mu, ṣe atẹjade awọn iwe ipinnu, ati imudojuiwọn awọn aabo nigbagbogbo bi ihuwasi awoṣe, awọn ireti olumulo, ati awọn ibeere ilana ti dagbasoke.

Ipa Ilana

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun.

Awọn ipinnu faaji ṣe awakọ iṣẹ ati idiyele iṣẹ fun awọn ọdun. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Ẹkọ imọ-ẹrọ ṣe iranlọwọ fun awọn ẹgbẹ lati yan akopọ to tọ, kii ṣe ọkan tuntun nikan.

Ẹkọ imọ-ẹrọ ṣe iranlọwọ fun awọn ẹgbẹ lati yan akopọ to tọ, kii ṣe ọkan tuntun nikan. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Awọn yiyan imọ-ẹrọ to dara julọ dinku awọn iṣẹlẹ igbẹkẹle ni iṣelọpọ.

Awọn yiyan imọ-ẹrọ to dara julọ dinku awọn iṣẹlẹ igbẹkẹle ni iṣelọpọ. Ni awọn imuṣiṣẹ ti o ni agbara giga, eyi ni a tumọ si awọn ofin iṣiṣẹ wiwọn, awọn aala nini, ati awọn ilana atunyẹwo loorekoore ki awọn ẹgbẹ le ṣe iwọn igbẹkẹle dipo iwọn aibikita.

Ojo iwaju ti Awoṣe ati Pipeline Parallelism

Awọn ilana ṣiṣe adaṣe adaṣe iṣoro lile ti pinnu bi o ṣe le pin awoṣe kan kọja awọn ẹrọ, ni lilo profaili ati wiwa lati dọgbadọgba iṣiro ati ibaraẹnisọrọ. Reti isọpọ wiwọ ti tensor, opo gigun ti epo, ati afiwe data (parallelism 3D), ṣiṣe eto micro-ipele ijafafa lati fẹrẹ pa awọn nyoju opo gigun ti epo kuro, ati ohun elo pẹlu awọn asopọ iyara yiyara nitorina pipin ipele kan kọja awọn eerun di din owo ati ilana diẹ sii fun awọn awoṣe ti o tobi ju lailai.

Real-World imuse

Awọn awoṣe ara-ara GPT ikẹkọ pẹlu NVIDIA Megatron-LM, eyiti o pin akiyesi Layer transformer kọọkan ati awọn matiri ifunni siwaju kọja awọn GPU nipasẹ isọdọkan tensor.

Lilo GPipe lati gbe awọn ipele oriṣiriṣi ti iran nla kan tabi awoṣe ede sori awọn iyara iyara nigba ti micro-batching jẹ ki wọn ṣiṣẹ lọwọ.

Ẹnjini opo gigun ti DeepSpeed ​​ti n pin awoṣe paramita pupọ-ọgọrun-biliọnu sinu awọn ipele kọja ọpọlọpọ awọn apa.

Apapọ parallelism tensor inu olupin 8-GPU ẹyọkan pẹlu afiwe opo gigun ti epo ti o tan awọn olupin lọpọlọpọ lati kọ awoṣe kan ti o tobi ju fun ẹrọ kan.

Awọn Ilana imuse

Awoṣe ati Pipeline Parallelism ni iwa

Awọn awoṣe ara-ara GPT ikẹkọ pẹlu NVIDIA Megatron-LM, eyiti o pin akiyesi Layer transformer kọọkan ati awọn matiri ifunni siwaju kọja awọn GPU nipasẹ isọdọkan tensor.

Awọn awoṣe ara-ara GPT ikẹkọ pẹlu NVIDIA Megatron-LM, eyiti o pin akiyesi ifarabalẹ oluyipada kọọkan ati awọn matiri ifunni siwaju kọja awọn GPU nipasẹ awọn ẹgbẹ parallelism tensor nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe ni akoko pupọ.

Awoṣe ati Pipeline Parallelism ni iwa

Lilo GPipe lati gbe awọn ipele oriṣiriṣi ti iran nla kan tabi awoṣe ede sori awọn iyara iyara nigba ti micro-batching jẹ ki wọn ṣiṣẹ lọwọ.

Lilo GPipe lati gbe awọn ipele oriṣiriṣi ti iran nla kan tabi awoṣe ede lori awọn iyara ti o yatọ lakoko ti micro-batching jẹ ki wọn ṣiṣẹ lọwọ Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe ni akoko pupọ.

Awoṣe ati Pipeline Parallelism ni iwa

Ẹnjini opo gigun ti DeepSpeed ​​ti n pin awoṣe paramita pupọ-ọgọrun-biliọnu sinu awọn ipele kọja ọpọlọpọ awọn apa.

Ẹnjini opo gigun ti DeepSpeed ​​ti n pin awoṣe-ọgọrun-biliọnu-ọpọlọpọ-ọpọlọpọ si awọn ipele kọja ọpọlọpọ awọn apa Awọn ẹgbẹ nigbagbogbo gba awọn abajade ti o dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna igbega eniyan fun awọn ọran eti, ati tọpa awọn anfani iṣelọpọ mejeeji ati awọn idiyele aṣiṣe lori akoko.

Awoṣe ati Pipeline Parallelism ni iwa

Apapọ parallelism tensor inu olupin 8-GPU ẹyọkan pẹlu afiwe opo gigun ti epo ti o tan awọn olupin lọpọlọpọ lati kọ awoṣe kan ti o tobi ju fun ẹrọ kan.

Apapọ parallelism tensor inu olupin 8-GPU kan pẹlu isọdọkan opo gigun ti awọn olupin pupọ lati ṣe ikẹkọ awoṣe ti o tobi ju fun ẹrọ kan Awọn ẹgbẹ nigbagbogbo gba awọn abajade to dara julọ nigbati wọn ṣalaye awọn ilodi didara ni iwaju, tọju ọna imudara eniyan fun awọn ọran eti, ati tọpa mejeeji awọn anfani iṣelọpọ ati awọn idiyele aṣiṣe lori akoko.

Awọn ewu & Awọn ọna iṣọ

!

Ṣiṣepe ala-ilẹ kan le tọju awọn ailagbara eto ti o gbooro.

!

Awọn ohun elo amayederun ati awọn idiyele itọju nigbagbogbo ni aibikita.

!

Aabo ati awọn ela akiyesi le dagba bi awọn eto ṣe di eka sii.

Ilana Ilana imuse

1

Ṣetumo lairi, didara, ati awọn ibi-afẹde idiyele ṣaaju imuse.

Ṣetumo lairi, didara, ati awọn ibi-afẹde idiyele ṣaaju imuse. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

2

Aṣepari labẹ ẹru ojulowo ati awọn ipo data.

Aṣepari labẹ ẹru ojulowo ati awọn ipo data. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

3

Abojuto ohun elo fun awọn aṣiṣe, fiseete, ati ipa olumulo.

Abojuto ohun elo fun awọn aṣiṣe, fiseete, ati ipa olumulo. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

4

Mura ipadasẹhin pada ati awọn ipa ọna esi iṣẹlẹ ṣaaju iwọn.

Mura ipadasẹhin pada ati awọn ipa ọna esi iṣẹlẹ ṣaaju iwọn. Ṣe itọju igbesẹ kọọkan bi ẹnu-ọna ẹri: ti awọn ibeere ko ba ni ibamu, daduro yiyọ kuro, pa aafo naa, ati lẹhinna faagun lilo.

Tesiwaju Ṣiṣawari