GUIDE teknik

Modèle mixtral ak sparse

Mixtral mooy xeetu njaxasu eksper yu Mistral AI biy joxe kalite model bu mag ci gaawaay model bu ndaw.

Résumé

Mixtral mooy xeetu njaxasu eksper yu Mistral AI biy joxe kalite model bu mag ci gaawaay model bu ndaw. Modèle yu néew yu mel ni ñoom duñu aktive benn wàll ci seeni parametre ci token bu nekk, dagg ordinatër te duñu yàq kàttan gi.

Modèle Mixtral ak Sparse ab bloku tabax xarala la buy indi jafe-jafe ci kalite model bi, njëgu infrastructure bi, latency bi, ak wóor ci escale bi.

Plongeur bu xóot

Mixtral 8x7B, bi Mistral AI genne ci 2023, siiwal njaxasu eksper yi (MoE) ci xeetu ubbeeku yi. Dafa am juróom ñatti 'expert' reso feed-forward yu wuute ci layer bu nekk, ak luy tollu ci 47 milyaar ciy parametre, waaye routeur bu woyof bi dafay tànnee ñaari expert ci token bu nekk. Ci noonu la tollu ci 13 milyaari parametre kese lañuy dox ci token bu nekk, kon inference dafay daw lu gaaw ni model dense 13B ci di yegg ci kalite bu méngoo ak yeneen yu gëna mag. Mixtral méngoo wala raw GPT-3.5 ak Llama 2 70B ci benchmark yu bari, fekk moo gëna gaaw te gëna yomb ci liggéey. Ginaaw loolu Mistral génne Mixtral 8x22B. Modèle bi dafa am lisaas bu ubbeeku ci Apache 2.0, di gaawa jëfandikoo ak defar bu baax ci askanu open-source bi.

Gis-gis xarala

Ci biir MoE bu bariwul, dañuy wecci blok feed-forward bu dëgër bi ak N reso expert boole ci reso gating bu ndaw (routeur bi). Ci token bu nekk, routeur bi dafay xayma poñ yi ba noppi tànn top-k expert yi (top-2 ci Mixtral), di router token bi ci ñoom kese. Seen génnekaay dañu leen di pondére ba noppi boole leen. Ndax li gëna bari ci kàngam yi duñu def dara ci token bu nekk, model bi dafay tëye ay parametre yu bari ci mémoire bi waaye di def calcul yu néew. Kompromis bi: bépp kàngam dafa wara nekk ci VRAM doonte yenn ci ñoom kese lañuy daw.

Xam xeetu Mixtral ak Sparse

Mixtral mooy xeetu njaxasu eksper yu Mistral AI biy joxe kalite model bu mag ci gaawaay model bu ndaw. Modèle yu néew yu mel ni ñoom duñu aktive benn wàll ci seeni parametre ci token bu nekk, dagg ordinatër te duñu yàq kàttan gi. Modèle Mixtral ak Sparse ab bloku tabax xarala la buy indi jafe-jafe ci kalite model bi, njëgu infrastructure bi, latency bi, ak wóor ci escale bi. Ngir tabax xam-xam bu xóot, jàppal Mixtral ak Sparse Models ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ak tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb kàngam.

Ci jëf, ekip yu am doole yiy jëfandikoo Mixtral ak Sparse Models dañuy gëna baaxal architecture, done, ak tànneefi infrastructure ci wàllu wóor ak njëg. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jamano jooju, Optimisation benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.

njeextalu pexe

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Ëlëgu xeetu Mixtral ak Sparse

Sparse MoE mingi leegi ci diggu IA. Xaarandi yeneen MoE yu ubbeeku, yoon yu gëna sew ak eksper yu ndaw yu bari, ak jëmmal eksper yu bokk wala hybrid yuy gëna yokk njariñ li. Ginaaw model yi dañuy dem ba ci ay trillion ci parametre yi, sparsity mooy levier bi gëna am solo ngir tëye inference bi ci anam wu woyof. Gëstu mingi wax ci barab yu néew doole yi ci MoE, balance charge ci diggante eksper yi, memory bi ci kaw, ak stabilite tàggat yaram, ci noonu la hardware ak stack yiy liggéey di gëna mëna optimiser gëna jëm ci eksper yi.

Doxal ci àdduna dëgg

Liggéeyukaay chatbot bu baax ci njëg ak gaawaay bu gëna ndaw

Hosting sa bopp ab xeetu Apache-2.0 bu am lisaas ngir ay produit njaay te doo fay jëfandikoo

Defar bu baax jeffin ju benn nit ci Mixtral ngir kodage, tënk, wala liggéey ci làkk yu bari

Dawal inference bu gaaw ci benn serwër bu bari GPU fu model bu dëgër 70B di yeex lool

Modèlu jëfandikoo

Modèle Mixtral ak Sparse ci jëf

Liggéeyukaay chatbot bu baax ci njëg ak gaawaayu model bu gëna ndaw.

Liggéeyukaay chatbot bu baax ci njëg ak gaawaayu xeetu dense bu gëna ndaw Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Modèle Mixtral ak Sparse ci jëf

Hosting sa bopp ab xeetu Apache-2.0 bu am lisaas ngir produit njaay te doo fay jëfandikoo.

Self-hosting benn xeetu Apache-2.0 bu am lisaas ngir produit komersiyaal yu amul fere jëfandikoo Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee ay threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit yi ak njëgu njuumte yi ci diir bi.

Modèle Mixtral ak Sparse ci jëf

Defar bu baax jeffin ju benn-benn nit ci Mixtral ngir kodage, tënk, wala liggéey ci làkk yu bari.

Fine-tuning jeffin benn-benn ci Mixtral ngir codage, summary, wala liggéey lakk yu bari Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ak topp njariñu produit ak njëgu njuumte ci diir bi.

Modèle Mixtral ak Sparse ci jëf

Dawal inference bu gaaw ci benn serwër bu bari GPU fu model dense 70B di yeex lool.

Dawal inference gaaw ci benn serwër multi-GPU fu benn model 70B dense di nekk lu yeex lool Ekip yi dañuy faral di am njariñ yu gëna baax suñu leeralee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Risk yi ak balustrade yi

!

Optimize benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi.

!

Njëg li ñuy fay ci infrastructure yi ak ci toppatoo dañuy faral di suufeel.

!

Bu sistem yi di gëna xawa jafee xam, jafe-jafe yi am ci wàllu kaaraange ak seetlu mën nañu gëna bari.

Roadmap ngir samp gi

1

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo.

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

2

Benchmark ci biir sargal ak done yu dëggu.

Benchmark ci biir sargal ak done yu dëggu. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

3

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi.

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

4

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale.

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

Weyal di banneexu