Làkk AI GUIDE

Rotary Position

Embeddings Position Rotary (RoPE) dafay kode fi token bu nekk di toog ci benn rang ci wëlbatiku laaj ak vecteur key ci angle bu méngoo ak position bi.

Résumé

Embeddings Position Rotary (RoPE) dafay kode fi token bu nekk di toog ci benn rang ci wëlbatiku laaj ak vecteur key ci angle bu méngoo ak position bi. Kaf gu taaru gii dafay may transformatër yi ñu xam distance relatif yi ba noppi dem ba ci contexte yu gëna gudd.

Rotary Position Embeddings bokk na ci lakk-IA stack bi ñuy jëfandikoo ngir jàng, defar, xaaj, ak soppi mbind ak wax ci eskaal.

Plongeur bu xóot

Transformatër yi amul benn gis-gis buñ tabax ci seen biir, moo tax dañu soxla leeral ci position bi ci anam wumu mëna doon. Modèle yu njëkk ya dañu daan yokk ay vecteur sinusoïdal yu fiks wala ñu jàng position ci biir duggal yi. RoPE, bi Su ak ay naataango tàmbale ci 2021, jël na beneen gis-gis: ludul yokk benn vecteur position, dafay wëlbati ñaari dimension ci laaj bi ak vecteur key yi ci angle buy màgg ak position token bi. Su model bi xaymaa produit dot bi ci digganté ab laajte ci position m ak ab caabi ci position n, math bi dafay dox suko defee resultaa bi a ngi aju ci seen distance relatif m dindi n. Loolu dafay joxe xam-xam bu dëggu ci position relatif, di jouer bu baax ak kernel yiy bàyyi xel, ba noppi di yàq bàyyi xel ci distance bi. Rope leegi ñu ngi koy jëfandikoo ci Llama, Mistral, Qwen ak ci model yu ubbeeku yi ci jamono jii.

Gis-gis xarala

RoPE dafay jëfandikoo dimension yuñ boole ci ñaar-ñaar, ba noppi def rotation 2D ci ñaar-ñaar bu nekk, ak ñaari-ñaar yu wuute yuy wëréelu ci frequence yu wuute, lu melni loxo montor yu bari yuy tic ci gaawaay yu wuute. Ndax wëlbatiku ci position m ba noppi jël produit dot ak luñu wëlbatiku ci position n du bàyyi ludul différence angle bi, poñ yi ñuy bàyyi xel dañuy nekk fonction position relatif. Peer yu am fréquence yu kawe yi dañuy jàpp doxalin bu baax ci gox bi; ñaari fréquence yu woyof yi dañuy jàpp position yu sori. Li gëna am solo mooy, dafay soppi laajte yi ak caabi yi, du valeur yi.

am xam-xam ci position rotary

Embeddings Position Rotary (RoPE) dafay kode fi token bu nekk di toog ci benn rang ci wëlbatiku laaj ak vecteur key ci angle bu méngoo ak position bi. Kaf gu taaru gii dafay may transformatër yi ñu xam distance relatif yi ba noppi dem ba ci contexte yu gëna gudd. Rotary Position Embeddings bokk na ci lakk-IA stack bi ñuy jëfandikoo ngir jàng, defar, xaaj, ak soppi mbind ak wax ci eskaal. Ngir tabax xam-xam bu xóot, jàppal Rotary Position Embeddings ni xeetu liggéey, du benn man-man: leeral njariñ yi nga bëgg, leeral xalaat yi, ak tàqale li sistem bi mëna def ci anam wu wóor ak li ba leegi soxla àtteb kàngam.

Ci jëf, ekip yu am doole yiy jëfandikoo Rotary Position Embeddings dañuy jëmmal, seetlu ak xoolaat ay loop ni benn sistemu jokkoo buñ boole. Dañuy bind kritër yu leer ngir am ndam, natt leen ci done yu dëggu ak def liggéey, ba noppi ñu baamtu ci anamu ñàkka mëna seetlu, du ci benn yoon benchmark wins. Mooy barab bi xam-xam theorie bi di soppiku nekk kàttan buy yàgg ci produit yi, ci politik yi ak ci liggéey yi.

Liggéeyukaay yi ci làkk yi mën nañu gëna gaaw te duñu yàq deggoo gi. Ci jamano jooju, mbiri Hallucinated mën nañu dugg ci rapoor yi, jàppale flow yi, wala gëstu yi génne. Xeetu jëf bi gëna dëgër mooy boole gaawaayu jàngat ak disipline nguur: doxal pilote, jàpp firnde, siiwal dogal yi, ak wéy di yeesal kaaraange gi ci anam wi ñuy doxalee, li jëfandikukat bi di xaar, ak sàrti sàrt yi di jëm kanam.

njeextalu pexe

Liggéeyukaay yi ci làkk yi mën nañu gëna gaaw te duñu yàq deggoo gi.

Liggéeyukaay yi ci làkk yi mën nañu gëna gaaw te duñu yàq deggoo gi. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Dafay yaatal jëfandikoo gi ci làkk yi ak ci anam yi ñuy jokkoo.

Dafay yaatal jëfandikoo gi ci làkk yi ak ci anam yi ñuy jokkoo. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Ekip yi mën nañu gëna yàgg ci àtte ci jamono ji otomatisation di liggéey ci baamtu.

Ekip yi mën nañu gëna yàgg ci àtte ci jamono ji otomatisation di liggéey ci baamtu. Ci jëfandikoo yu am kalite bu kawe, loolu dañu koy tekki ci sàrti liggéey yuñ mëna natt, ay peggu boroom, ak ay xew-xewu xoolaat yu bari suko defee ekip yi mëna yokk wóolu seen bopp ci barabu yokk lu jaxasoo.

Ëlëgu position Rotary

Liggéey bu bari ci jamono yii mingi sëssé ci tàllal RoPE ci anam wu gëna gudd ci anam wi ñu ko tàggate. Pexe yu melni interpolation position, NTK-xam scaling, ak YaRN dañuy yamale fréquence rotation yi suko defee benn model buñu tàggat ci, wax, jeton 4K mën na jëfandikoo 32K wala lu ëpp ak ajustement bu woyof. Xaarandi RoPE ngir des ci xeetu position bi gëna am solo, ak ay coppite yuy wéy ci frequency base ak scaling ngir ay contexte milioŋ-token, ak wéyal jàngat ci ni muy doxalee ak jeffin juy bàyyi xel.

Doxal ci àdduna dëgg

Jox Llama, Mistral, ak Qwen ñu wane seen gis-gis ci njubluwaay bu amul benn position buñ tàqale

Yaatalal xeetu jëfandikoo gi ci ay junni yu néew dem ba ci ay fukki junni token jaaraleko ci interpolation wala YaRN

Dimbali modelu kod yi ñu mëna topp diggante parenthèses yi, fonction yi ak royuwaayi fichier yu gudd yi

Jàppale tontub laaj bu yàgg ci këyit, fu position relatif bi am ci digganté laaj ak firnde

Modèlu jëfandikoo

Rotary Position ci jëf

Jox Llama, Mistral, ak Qwen seeni xeetu token yu amul benn position buñ tàqale.

Jox Llama, Mistral, ak Qwen xeetu seen gis-gis ci njubluwaay bu amul benn position embeddings Teams yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Rotary Position ci jëf

Yaatalal xeetu jëfandikoo gi ci ay junni yu néew dem ba ci ay fukki junni token jaaraleko ci interpolation wala YaRN.

Yaatalal xeetu jëfandikoo bu mën jëfandikoo ci ay junni yu néew ba fukki junni token jaaraleko ci interpolation wala YaRN Teams dañuy faral di am njariñ yu gëna baax suñu leeralee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, ba noppi topp njariñu produit ak njëgu njuumte ci diir bi.

Rotary Position ci jëf

Di jàppale modelu kod yi ñu mëna topp diggante parenthèse yi, fonction yi ak royuwaay yi ci biir fichier yu gudd yi.

Dimbali xeetu kode yi topp distance relatif yi diggante parenthèses yi, fonction yi, ak royuwaay yi ci biir fichier yu gudd yi Ekip yi dañuy faral di am njariñ yu gëna baax suñu joxee threshold yu baax ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, topp benefiis yi ak njëgu njuumte yi ci diir bi.

Rotary Position ci jëf

Jàppale tontub laaj bu yàgg ci këyitu dokimaa, fu position relatif bi am ci digganté laaj ak firnde am solo.

Jàppale laaj-dokimaa yu gudd tontu fu position relatif diggante laaj ak firnde jafe-jafe Ekip yi dañuy faral di am njariñ yu gëna baax suñu leeralee threshold yu kalite ci kanam, tëye yoonu escalation nit ngir jafe-jafe yi, topp ñaari produit yi ak njëgu njuumte yi ci diir bi.

Risk yi ak balustrade yi

!

Lépp lu jaarul yoon mën na dugg ci rapoor yi, jàppale ci liggéey bi, wala ci njariñu gëstu bi.

!

Sensibilite bu gaaw mën na jur njariñ yu wuute ci laajte yu noonu mel.

!

Done yu am solo mën nañu feeñ sudee seytu jëfandikoo gi néew doole.

Roadmap ngir samp gi

1

Mandargal formaa génne gi, melokaan bi, ak standard kalite yi laata ngay dugal ko.

Mandargal formaa génne gi, melokaan bi, ak standard kalite yi laata ngay dugal ko. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

2

Tontu yu am solo ak balluwaay yu wóor saa yu dëggu bi di am solo.

Tontu yu am solo ak balluwaay yu wóor saa yu dëggu bi di am solo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

3

Fexeel am barabu xool nit ñi ngir am njariñ yu am solo.

Fexeel am barabu xool nit ñi ngir am njariñ yu am solo. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

4

Toppal anami gacce yi ak di faral di tàggataat ay laaj wala def-liggéey.

Toppal anami gacce yi ak di faral di tàggataat ay laaj wala def-liggéey. Japp jéego bu nekk ni buntu firnde: sudee mattul kritër yi, noppali génne gi, tëj bërëb bi, ba noppi nga yaatal jëfandikoo gi.

Weyal di banneexu