GUIDE teknik

ONNX ak xeetu jëflante

ONNX (Weccoo Reseau Neural bu ubbeeku) formaa standard la bu ubbeeku ngir wane xeetu jàngu masin suko defee ñu mëna toxu ci diggante kaadar yi ak waxtu doxal yi.

Résumé

ONNX (Weccoo Reseau Neural bu ubbeeku) formaa standard la bu ubbeeku ngir wane xeetu jàngu masin suko defee ñu mëna toxu ci diggante kaadar yi ak waxtu doxal yi. Daf lay may nga tàggat benn model ci benn jumtukaay, lu melni PyTorch, nga dugal ko ci beneen environmaa te doo ko binndaat.

ONNX ak Model biy jëflante ay bloku tabax xarala yu am njeexital ci kalite model bi, njëgu infrastructure bi, latency, ak wóor ci escale bi.

Plongeur bu xóot

Xeeti kaadar yu bari (PyTorch, TensorFlow, scikit-learn) dañuy denc ay model ci formaa yu wuute, te loolu dafay tax dugal gi metti. ONNX, bi __AIU_PROTECTED_5_ ak Facebook tëral ci 2017 te leegi ñu ngi koy jiite ci Fondation Linux, dafay saafara jafe-jafe yii ci joxe xeetu fichier buñ bokk ak benn xeetu operatër buñ yamale (lu melni Conv, MatMul, Relu) yuy fësal benn model ni graf ordinatër. Yaa ngi yóbbu ab model buñu tàggat ci ab fichier .onnx, te bépp runtime bu méngoo mën nako sarse. ONNX Runtime dafay jëfandikoo graphe bi ci anam wu jaar yoon ci ay aparey yu bari, jëfandikoo ay optimaasioŋ yu melni fusion operatër ak kantite, ak jëfandikoo xayma ci backend yu melni CPUs, GPUs NVIDIA (jaaraleko ci TensorRT), wala gaawaay yu yam. Loolu dafay tàqale tàggat model ak dugal.

Gis-gis xarala

Modèle ONNX graphe calcul serialisé la: node yi ay operatër lañu yuñ jëlee ci ensemble operatër buñ joxe version (opset), ba noppi boor yi dañuy yor ay tensor yu am jëmm ak xeetu jëmmal. Exportatër yi dañuy topp wala bind sa model ngir jàpp graf bii. Ci gàttal, ONNX Runtime dafay xaaj graphe bi ci 'fournisseurs de execution' (CPU, CUDA, TensorRT, ak ñoom seen), ku nekk ci ñoom yor operatër yi mu gëna jàppale, ba noppi jëfandikoo ay optimisation ci niveau graphe bi lu melni pliage constant ak node fusion ngir gaawlu mbir yi.

Xam ONNX ak xeetu jëflante

ONNX (Weccoo Reseau Neural bu ubbeeku) formaa standard la bu ubbeeku ngir wane xeetu jàngu masin suko defee ñu mëna toxu ci diggante kaadar yi ak waxtu doxal yi. Daf lay may nga tàggat benn model ci benn jumtukaay, lu melni PyTorch, nga dugal ko ci beneen environmaa te doo ko binndaat. ONNX ak Model biy jëflante ay bloku tabax xarala yu am njeexital ci kalite model bi, njëgu infrastructure bi, latency, ak wóor ci escale bi. Ngir tabax xam-xam bu xóot, jàppal ONNX ak Model Interoperability ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ak tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb kàngam.

Ci jëf, ekip yu am doole yiy jëfandikoo ONNX ak Model Interoperability dañuy gëna baaxal architecture, done, ak tànneefi infrastructure ci wàllu wóor ak njëg. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jamano jooju, Optimisation benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.

njeextalu pexe

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw.

Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal.

Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi.

Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Ëlëgu ONNX ak xeetu jëflante

ONNX mingi gëna dëgëral boppam ni lingua franca ngir jëfandikoo model, rawatina ci wàllu edge ak cross-platform. Xaarandi coverage bu gëna yaatu ci operatër yi ci modeli làkk yu mag yi ak transformatër yi, ndimmbal bu gëna dëgër ngir inference quantized ak low-bit, ak boole bu gëna xóot ak runtimes jaaykatu aparey yi. Lu ecosystemu puce IA yiñ jagleel di màgg, formaa bu amul benn boor bu melni ONNX dafay gëna am solo, may ekip yi ñu weccoo hardware te duñu defaraat model yi, te ONNX Runtime dafay wéy di yaatu ci mobile ak web (jaaraleko ci WebAssembly) ay target.

Doxal ci àdduna dëgg

Yobbu benn xeetu nataalu PyTorch ci ONNX te nga doxal ko ak ONNX Runtime ci serwëru defar C++ bu amul benn dependence Python.

Taxawal benn model ci mobile wala nawigatër jaaraleko ci ONNX Runtime Web (WebAssembly) ngir mëna jàpp ci aparey bi.

Gaawaale ab trafokat buñ yóbbu ci bitim reew ak NVIDIA TensorRT muy ONNX Runtime joxekat ngir wàññi latency.

Quantizing benn model ONNX ci int8 ngir wàññi dayoom ak gaawlu inference ci CPUs yu yam yi.

Modèlu jëfandikoo

ONNX ak xeetu jëflante ci jëf

Yobbu benn xeetu nataalu PyTorch ci ONNX te nga doxal ko ak ONNX Runtime ci serwëru defar C++ bu amul benn dependence Python.

Exporte ab PyTorch image classifier ci ONNX ak doxal ko ak ONNX Runtime ci ab serwëru defar C ++ bu amul benn dependence Python Teams yi dañuy faral di am njariñ yu gëna baax suñu joxe ay threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ak topp njariñu produit yi ak njuumte yi.

ONNX ak xeetu jëflante ci jëf

Taxawal benn model ci mobile wala nawigatër jaaraleko ci ONNX Runtime Web (WebAssembly) ngir mëna jàpp ci aparey bi.

Taxawal benn model ci mobile wala navigateur jaaraleko ci ONNX Runtime Web (WebAssembly) ngir inference ci aparey Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

ONNX ak xeetu jëflante ci jëf

Gaawaale ab trafokat buñ yóbbu ci bitim reew ak NVIDIA TensorRT muy ONNX Runtime joxekat ngir wàññi latency.

Gaawaay ab transformateur exporté ak NVIDIA TensorRT ni ONNX Runtime execution furnisër ngir latency bu néew Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee ay threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

ONNX ak xeetu jëflante ci jëf

Quantizing benn model ONNX ci int8 ngir wàññi dayoom ak gaawlu inference ci CPUs yu yam yi.

Quantizing model ONNX to int8 ngir wàññi dayoom ak gaaw ci inference ci CPUs ci boor Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir mbir yu boor, ak topp njuréefi produit ak njëgu njuumte ci diir bi.

Risk yi ak balustrade yi

!

Optimize benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi.

!

Njëg li ñuy fay ci infrastructure yi ak ci toppatoo dañuy faral di suufeel.

!

Bu sistem yi di gëna xawa jafee xam, jafe-jafe yi am ci wàllu kaaraange ak seetlu mën nañu gëna bari.

Roadmap ngir samp gi

1

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo.

Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

2

Benchmark ci biir sargal ak done yu dëggu.

Benchmark ci biir sargal ak done yu dëggu. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

3

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi.

Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

4

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale.

Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

Weyal di banneexu