Résumé
Sharpness-Aware Minimization (SAM) xeetu gëna xéewale la bu bëggul rek ñàkk lu néew waaye ñàkk lu néew ci dëkkandoo yépp ci diisaay - lu gëna ndaw. Minima yu plat yi ñooy gëna mëna yamale, moo tax SAM dafay faral di gëna yombal njubte ak dëgëraay bi te du soppi architecture model bi.
Wàññi giñ xam ci ñaw, jumtukaay la buy tabax xarala yu am njeexital ci kalite model bi, njëgu infrastructure bi, latency bi, ak wóor gi ci eskaal bi.
Plongeur bu xóot
Standard training dafay wàññi perte ci benn poñ ci espace poids, waaye ñaari pexe yu am benn perte de training mën nañu doxalee ci anam wu wuute lool: benn 'sharp' minimum toog ci vale bu sew fu perturbations poids yu ndaw spike perturbation, ci noonu la 'flat' minimum tolerante perturbation te dafay faral di generalise done gëna un. SAM, bi gëstukat yi dugal ci 2020, dafay leeral lii. Ci jéego bu nekk, dafay njëkka gis perturbation poid bi gëna jege (ci biir radius rho bu ndaw) biy yokk perte bi - dëkkandoo bi gëna bon - ba noppi yeesal poid yi njëkk ngir wàññi perte bi ci point perturbed bi. Bii mébet min-max dafay puus optimisation ci gox yu gëna suufe, di joxe generalisation bu gëna baax ci wàllu nataal ak ginaaw.
Gis-gis xarala
Jéego bu nekk ci SAM ñaari yoon la. Bi njëkk mooy nga xayma degrade bi ci poid yi fi nekk, nga jël jéego 'yéeg' bu tollu ci rho ci wàllu degrade bi ngir yegg ci barab bi gëna bon ci wetu bi. Ñaareel ba mooy xayma degrade bi ci poñ perturbé bi nga jëfandikoo ko ngir yeesal poid yi njëkk. Rayon rho mooy wane yaatuwaayu dëkkandoo bi ngay aar ci. Njëgglangi tollu ci ñaari paas ci kanam-ci ginaaw ci jéego bu nekk, loolu mooy yokk ñaari yoon xayma bi - mooy gëna ñaawe ci jëfandikoo gi.
Xam ñaw-xam-xam wàññi
Sharpness-Aware Minimization (SAM) xeetu gëna xéewale la bu bëggul rek ñàkk lu néew waaye ñàkk lu néew ci dëkkandoo yépp ci diisaay - lu gëna ndaw. Minima yu plat yi ñoo gëna mëna yamale, moo tax SAM dafay faral di gëna yombal njubte ak dëgëraay bi te du soppi architecture model bi. Wàññi giñ xam ci ñaw, jumtukaay la buy tabax xarala yu am njeexital ci kalite model bi, njëgu infrastructure bi, latency bi, ak wóor gi ci eskaal bi. Ngir tabax xam-xam bu xóot, jàppal Sharpness-Aware Minimization ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ba noppi tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb kàngam.
Ci jëf, ekip yu am doole yiy jëfandikoo Wàññi giy Xam Xam Xam, dañuy gëna baaxal arsitektir bi, done yi, ak tànneefi infrastructure yi ci wàllu wóor ak njëg. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jamano jooju, Optimisation benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.
njeextalu pexe
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw.
Dogal yi architecture di jël dañuy indi njariñ ak njëgu liggéey bi ay at ci ginaaw. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal.
Njàngalem xarala yi dafay jàppale ekip yi ñu tànn li gën, te baña yam ci li gëna bees daal. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi.
Tanneef yu gëna baax ci wàllu ingeñër dina wàññi jafe-jafe yi ci wàllu wóor ci liggéey bi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.
Doxal ci àdduna dëgg
Yokkatal Transformatëru gis-gis ak ResNet ci ImageNet ci tàggat ak SAM ci barabu SGD bu leer.
Yokkateg dëgëraay ci bruit etiket yi, ndax minima yu plat yi ñoo gëna néew luñu mëna memorise etiket yu yàqu yi.
Fine-tuning xeetu làkk yiñ njëkka tàggat ak SAM ngir gëna am generalisation ci ensemble done yu ndaw yi ci suuf.
Jëfandikoo ESAM wala LookSAM sudee njëgu xayma bu ñaari yoon ci vanille SAM seer na lool.
Modèlu jëfandikoo
Xam ñaw-xam wàññi ci jëf
Yokkatal Transformatëru gis-gis ak ResNet ci ImageNet ci tàggat ak SAM ci barabu SGD bu leer.
Boosting Vision Transformer ak ResNet njubte ci ImageNet ci tàggat ak SAM ci barabu SGD Teams yi dañuy faral di am njariñ yu gëna baax suñu joxe ay tegtal yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.
Xam ñaw-xam wàññi ci jëf
Yokkateg dëgëraay ci bruit etiket yi, ndax minima yu plat yi ñoo gëna néew luñu mëna memorise etiket yu yàqu yi.
Yokkateg robustness ngir etiket bruit, depi minima flat gëna néew luñu mëna memorise etiket yu yàqu Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds kalite ci kanam, tëye yoonu escalation nit ngir mbir yu am solo, ak topp njuréefi produit ak njëgu njuumte ci diir bi.
Xam ñaw-xam wàññi ci jëf
Fine-tuning xeetu làkk yiñ njëkka tàggat ak SAM ngir gëna am generalisation ci ensemble done yu ndaw yi ci suuf.
Fine-tuning xeetu làkk yiñ njëkka tàggat ak SAM ngir am generalisation bu gëna baax ci done yu ndaw yi ci suuf. Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee thresholds yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit yi ak njëgu njuumte yi ci diir bi.
Xam ñaw-xam wàññi ci jëf
Jëfandikoo ESAM wala LookSAM sudee njëgu xayma bu ñaari yoon ci vanille SAM seer na lool.
Jëfandikoo ESAM wala LookSAM variants sudee ñaari yoon njëgu ordinatëru vanille SAM seer lool Ekip yi dañuy faral di am njariñ yu gëna baax suñu leeralee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.
Risk yi ak balustrade yi
Optimize benn benchmark mën na nëbb ñakk kattan yu gëna yaatu ci sistem bi.
Njëg li ñuy fay ci infrastructure yi ak ci toppatoo dañuy faral di suufeel.
Bu sistem yi di gëna xawa jafee xam, jafe-jafe yi am ci wàllu kaaraange ak seetlu mën nañu gëna bari.
Roadmap ngir samp gi
Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo.
Mandargal latency, kalite, ak njëg yi laata ngay jëfandikoo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Benchmark ci biir sargal ak done yu dëggu.
Benchmark ci biir sargal ak done yu dëggu. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi.
Jumtukaay bi di saytu njuumte yi, derive bi ak njeextalu jëfandikukat bi. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.
Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale.
Waajal rollback ak yooni tontu ci jafe-jafe yi laata ngay eskale. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.