Résumé
Njaxasu Ekspeer yi (MoE) xeetu jëmmal la buy xaaj reso bi ci ay sous-reseau yu yam, ba noppi yenn ci dugal yi kese lañuy aktive. Dafay may model yi ñu mëna tëye xam-xam bu bari te ba noppi di tëye bépp wax luy waaja am lu gaaw te yomb.
Njaxasu Ekspeer yi ab bloku tabax la bu am njeexital ci kalite model bi, njëgu infrastructure bi, yeexal bi, ak wóor ci eskaal bi.
Plongeur bu xóot
Transformatër buñ miin dafay doxal bepp dugg ci benn couche dense, kon def model bi gëna xarañ dafay tekki ni bepp calcul dafay gëna seer. Njaxasu Ekspeer yi dafay dog lëkkaloo bi. Dafay wecci feed-forward layer bu mag bi ak reso 'expert' yu ndaw yu bari boole ci 'routeur' bu ndaw buy xool ban expert mooy jëfandikoo token bu nekk. Daanaka 1 wala 2 kàngam yi gëna mag ñooy génne, kon benn model mën na am téemeeri milyaari parametre ci lëmm waaye du aktive benn wàll bu ndaw ci token bu nekk. Lii moo tax model yu melni Mixtral 8x7B ak architecture bi ñuy wax ci ginaaw GPT-4 yegg ci kalite bu kawe te du am njëgu inference bu yéeg. Kompromis bi mooy jafe-jafe bi: bépp expert dafa wara nekk ci memory bi, te routeur bi mën na juum ci yoon wi wala mu yab yenn expert yi, kon tàggat yaram dafay laaj equilibre bu baax.
Gis-gis xarala
Xolu MoE mooy reso gating bi, ab layer bu ndaw buñu jàng buy jox poñ expert bu nekk ci benn token buy duggu ba noppi yóbbu token bi ci top-k bi gëna am poñ (dafay faral di nekk k = 1 wala 2). Ngir tere routeur bi yónnee lépp yenn expert yuñ taamu, tàggat yaram dafay yokk 'load-balancing loss' buy daanel jëfandikoo bu jaarul yoon. Ndax k expert kese ñooy daw ci token bu nekk, calcul (FLOPs) dafay des ci anam wu soppeeku doonte dangay yokk yeneen expert, kon parametre yu mat yi ak njëgu token bu nekk dañuy wuute.
Mastering njaxasu kàngam yi
Njaxasu Ekspeer yi (MoE) xeetu jëmmal la buy xaaj reso bi ci ay sous-reseau yu yam, ba noppi yenn ci dugal yi kese lañuy aktive. Dafay may model yi ñu mëna tëye xam-xam bu bari te ba noppi di tëye bépp wax luy waaja am lu gaaw te yomb. Njaxasu Ekspeer yi ab bloku tabax la bu am njeexital ci kalite model bi, njëgu infrastructure bi, yeexal bi, ak wóor ci eskaal bi. Ngir tabax xam-xam bu xóot, jàppee Mixture of Experts ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ak tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb eksper.
Ci jëf, ekip yu am doole yiy jëfandikoo Njaxasu Ekspeer yi dañuy gëna baaxal architecture, done, ak tànneefi infrastructure ci wàllu wóor ak njëg. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jamano jooju, Optimisation benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.
njeextalu pexe
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw.
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal.
Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi.
Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Doxal ci àdduna dëgg
Mixtral 8x7B dafay jëfandikoo 8 kàngam ba noppi di aktive 2 ci token bu nekk, di joxe lu tollu ci 47B ci parametre yi waaye ~ 13B kese lañuy aktive ci token bu nekk ngir gëna gaaw, gëna xéewale.
DeepSeek ak Qwen dañuy yónnee xeetu làkk MoE yu mag yu méngoo ak xeetu làkk yu dëgër yi ci benchmark yi, fekk ñuy daw ak xayma bu gëna ndaw ci token bu nekk.
Cloud LLM fournisër yi jëfandikoo MoE suko defee benn model bu rëy mëna liggéey jëfandikukat yu bari ci njëg yu yomb, ndax laaj bu nekk dafay leeral yenn kàngam.
Google Transformatëru kommutatër bi njëkka am dafa yokk ba ëpp benn bilioŋ ciy parametre di jëfandikoo yoon wi gëna kawe ngir mëna wéy di tàggat ordinatër bi.
Modèlu jëfandikoo
njaxasu kàngam ci jëf
Mixtral 8x7B dafay jëfandikoo 8 kàngam ba noppi di aktive 2 ci token bu nekk, di joxe lu tollu ci 47B ci parametre yi waaye ~ 13B kese lañuy aktive ci token bu nekk ngir gëna gaaw, gëna xéewale.
Mixtral 8x7B dafay jëfandikoo 8 kàngam te dafay aktive 2 ci token bu nekk, di joxe lu tollu ci 47B parametre yu mat waaye ~ 13B rekk lañuy aktive ci token bu nekk ngir gëna gaaw, gëna yomb.
njaxasu kàngam ci jëf
DeepSeek ak Qwen dañuy yónnee xeetu làkk MoE yu mag yu méngoo ak xeetu làkk yu dëgër yi ci benchmark yi, fekk ñuy daw ak xayma bu gëna ndaw ci token bu nekk.
DeepSeek ak Qwen dañuy yónnee xeetu làkk MoE yu mag yu méngoo ak xeetu làkk yu dëgër yi ci benchmarks yi ñuy daw ak ekip yu gëna néew ci token yi. Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njuréefi produit ak njëgu njuumte ci diir bi.
njaxasu kàngam ci jëf
Cloud LLM fournisër yi jëfandikoo MoE suko defee benn model bu rëy mëna liggéey jëfandikukat yu bari ci njëg yu yomb, ndax laaj bu nekk dafay leeral yenn kàngam.
Cloud LLM fournisër yi jëfandikoo MoE suko defee benn model bu rëy mëna liggéey jëfandikukat yu bari ci anam wu yomb, ndax laaj bu nekk dafay leeral yenn eksper yu néew. Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit yi ak njuumte yi.
njaxasu kàngam ci jëf
Google Transformatëru kommutatër bi njëkka am dafa yokk ba ëpp benn bilioŋ ciy parametre di jëfandikoo yoon wi gëna kawe ngir mëna wéy di tàggat ordinatër bi.
Google's Transformer Switch bi njëkka am dafa yokk lu ëpp benn trillion ci parametre yi jëfandikoo top-1 routing ngir wéy di tàggat ordinatër bi mëna jëfandikoo. Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoon wi nit ñi di yokk ngir mëna dem ci ñaari mbir yi.
Risk yi ak balustrade yi
Optimize benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi.
Njëg li ñuy fay ci infrastructure yi ak ci toppatoo dañuy faral di suufeel.
Bu sistem yi di gëna xawa jafee xam, jafe-jafe yi am ci wàllu kaaraange ak seetlu mën nañu gëna bari.
Roadmap ngir samp gi
Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo.
Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Benchmark ci biir sargal ak done yu dëggu.
Benchmark ci biir sargal ak done yu dëggu. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi.
Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale.
Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.