GUIDE teknik

Block-Sparse ak Natif Sparse

Block-sparse ak native sparse bàyyi xel ci transformateur yi ñu bàyyi xel ci wàll yi gëna am solo ci benn rang bu gudd ci barabu token bu nekk, dagg njëgu quadratic ci bàyyi xel ci standard.

Résumé

Block-sparse ak native sparse bàyyi xel ci transformateur yi ñu bàyyi xel ci wàll yi gëna am solo ci benn rang bu gudd ci barabu token bu nekk, dagg njëgu quadratic ci bàyyi xel ci standard. Loolu mooy tax model yu am contexte bu gudd di mëna jëfandikoo ci hardware dëgg.

Block-Sparse ak Native Sparse Foofu dafay am njeexital ci kalite model bi, njëgu infrastructure bi, yeexal bi, ak wóor ci eskaal bi.

Plongeur bu xóot

Standard self-attention dafay méngale bépp token ak bépp token, kon njëg bi dafay màgg quadratically ak guddaayi sekans, nekk luy tere këyitu dokimaa yu gudd lool. Li gëna néew luñu koy bàyyi xel mooy tënk token bu nekk ci ñeneen ñi. Xeetu bloc-sparse yi dañuy xaaj toppalante bi ci ay bloc, ba noppi di xayma bàyyi xel ci ñaari bloc yuñ tànn, te loolu dafay méngoo bu baax ak GPU tensor cores yi. Native Sparse Attention (NSA), bu bawoo ci DeepSeek, demna lu gëna sori: mën nañu ko tàggat ci njeexte ak jumtukaay, boole ñatti car, kompresioŋ token bu dëgër, tànneef bu dëgër ci blok yi gëna am solo, ak palanteer buy gliise ngir contexte lokal. Ndax motif sparsity bi ñu ngi ko jàngee ci diiru pretraining bi moo gën ñu ko boulé ci ganaw, NSA dafay baña yàq njubte bi muy joxe gaawaay yu mag ci toppalante yu gudd.

Gis-gis xarala

NSA dafay jëfandikoo caabi yi ak valeur yi ci ñatti yoon yu paralel, ba noppi boole leen ci buntu yiñ jàng. Kompresioŋ dafay boole ay bloku jeton ci ay misaal yu gàtt; tanneef yi dañuy bloke poñ yi, ba noppi bàyyi ñi gëna kawe rek ngir ñu mëna bàyyi seen xel ci ñoom; palanteer buy gliise dafay muur token yi ci wetam. Liggéeyukaay yi ci niveau bloc dañu méngoo ak jëfandikoo mémoire GPU ak produit tensor-core, kon sakkanal FLOP theorique yi dañuy tekki ci gaawaayu montor muur dëgg ci diiru tàggat ak inference, rawatina ci jéego decodage bu mémoire bi tënk.

Xam Block-Sparse ak Native Sparse

Block-sparse ak native sparse bàyyi xel ci transformateur yi ñu bàyyi xel ci wàll yi gëna am solo ci benn rang bu gudd ci barabu token bu nekk, dagg njëgu quadratic ci bàyyi xel ci standard. Loolu mooy tax model yu am contexte bu gudd di mëna jëfandikoo ci hardware dëgg. Block-Sparse ak Native Sparse Foofu dafay am njeexital ci kalite model bi, njëgu infrastructure bi, yeexal bi, ak wóor ci eskaal bi. Ngir tabax xam-xam bu xóot, jàppal Block-Sparse ak Native Sparse Attention ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ba noppi tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb kàngam.

Ci jëf, ekip yu am doole yiy jëfandikoo Block-Sparse ak Native Sparse Attention dañuy gëna baaxal arsitektir bi, done yi, ak tànneefi jumtukaay yi ci wàllu wóor ak njëg. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jamano jooju, Optimisation benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.

njeextalu pexe

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Ëlëgu Block-Sparse ak Native Sparse

Sparsity buñu mëna tàggat, hardware-aware mingi nekk yoon wi jëm ci contexte milioŋ-token te du yokk njëg. Xaarandil ñu bari ñuy bàyyi xel ci kernel yi ak accelerator yi, boole ci bàyyi xel ci ligneer ak xalaati espace-state, ñu jël ko ci xeetu frontiere yu gudd ak xalaat. Lu motif yi di gëna mëna jàng ak dinaamik, model yi dina ñu xaaj budget bi ci anam wu méngoo ak laaj bu nekk, ba noppi benchmark yi dina ñu gëna natt decodage bi ci toppalante yu gudd, du ci kalite bu ñor kese.

Doxal ci àdduna dëgg

Doxal benn model ci kaw codebase bi yépp wala kontraa legal bu gudd fu bàyyi xel bu mat sëkk di jeexal mémoire GPU bi.

DeepSeek's NSA dafay gaawlu tàggat yaram ak tegtal yu yàgg yi ci jamono jooju ñuy méngale wala di daan njubte gi mat sëkk.

Résumé dokimaa yu am guddaayu téere ci topp ay resumé yuñ komprime boole ci ay pàcc yu am solo ci gox bi.

Gaawaale assistant chat yu gudd yi seen jéego decodage tënku ci mémoire bi ci tënk token bu nekk ci bloc yu gëna kawe yi.

Modèlu jëfandikoo

Block-Sparse ak Native Sparse Fàttaliku ci jëf

Doxal benn model ci kaw codebase bi yépp wala kontraa legal bu gudd fu bàyyi xel bu mat sëkk di jeexal mémoire GPU bi.

Doxal benn model ci kaw benn codebase bu lëmm wala kontraa legal bu gudd fu bàyyi xel bu mat sëkk di jeexal mémoire GPU Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir mbir yu am solo, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Block-Sparse ak Native Sparse Fàttaliku ci jëf

DeepSeek's NSA dafay gaawlu tàggat yaram ak tegtal yu yàgg yi ci jamono jooju ñuy méngale wala di daan njubte gi mat sëkk.

DeepSeek's NSA gaawlu ñaari pretraining ak long-context inference bi ñuy méngale wala di dóor njubte bu mat sëkk. Ekip yi dañuy faral di am njariñ yu gëna baax suñu leeralee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Block-Sparse ak Native Sparse Fàttaliku ci jëf

Résumé dokimaa yu am guddaayu téere ci topp ay resumé yuñ komprime boole ci ay pàcc yu am solo ci gox bi.

Résumé dokimaa yu guddu téere ci topp ci resumé block comprimé ak passage yu am solo ci gox bi. Ekip yi dañuy faral di am njariñ yu gëna baax suñu leeralee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir mbir yu am solo, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Block-Sparse ak Native Sparse Fàttaliku ci jëf

Gaawaale assistant chat yu gudd yi seen jéego decodage tënku ci mémoire bi ci tënk token bu nekk ci bloc yu gëna kawe yi.

Gaawaay assistant chat yu gudd yi seen jéego decodage nekk ci memory-bound ci tënk token bu nekk ci bloc yu gëna kawe. Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Risk yi ak balustrade yi

!

Optimize benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi.

!

Njëg li ñuy fay ci infrastructure yi ak ci toppatoo dañuy faral di suufeel.

!

Bu sistem yi di gëna xawa jafee xam, jafe-jafe yi am ci wàllu kaaraange ak seetlu mën nañu gëna bari.

Roadmap ngir samp gi

1

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo.

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

2

Benchmark ci biir sargal ak done yu dëggu.

Benchmark ci biir sargal ak done yu dëggu. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

3

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi.

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

4

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale.

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

Weyal di banneexu