HAGAHA Audio AI

AudioLM

AudioLM waa Google qaab cilmi baaris oo soo saarta maqal macquul ah - hadalka ama muusiga biyaano - iyadoo loola dhaqmo codka sida luqadda oo loo saadaaliyo calaamad ahaan.

Dulmar

AudioLM waa Google qaab cilmi baaris oo soo saarta maqal macquul ah - hadalka ama muusiga biyaano - iyadoo loola dhaqmo codka sida luqadda oo loo saadaaliyo calaamad ahaan. Waa arrin sababtoo ah waxay tustay inaad soo saari karto isku-dhafan, cod dabiici ah oo sii socon doona iyadoon wax qoraal ah laga helin ama dhibco muusig.

AudioLM waxay ku fadhidaa qulqulka shaqada maqal-AI ee u beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta.

quusitaanka qoto dheer

Waxaa soo bandhigay Google sanadka 2022, AudioLM waxay dib u habaysaa jiilka maqalka sidii mushkilad qaabaynta luqadda: waxay u beddeshaa waveforms ceeriin calaamado kala duwan ka dibna waxay saadaalisaa calaamadda xigta, sida qaabka qoraalka u saadaaliyo erayga xiga. Xeeladdeeda muhiimka ah waa kala sareynta noocyada calaamada. Calaamadaha 'Semantic' (oo ka soo jeeda moodeel sida w2v-BERT) waxay qabtaan qaab-dhismeedka muddada-dheer - codka codka, syntax, laxanka - halka calaamadaha 'coustic' (oo ka yimid koodka neural codec ee SoundStream) ay qabtaan faahfaahin wanaagsan sida aqoonsiga hadalka, timbre, iyo xaaladaha duubista. Marka ugu horeysa ee la saadaaliyo calaamadaha semantic, ka dibna qaboojiya calaamadaha dhawaaqa iyaga, AudioLM waxay soo saartaa sii wadida isku xirnaanta ilbiriqsiyo badan iyadoo la ilaalinayo codka asalka ah ama qalabka. Dhawr ilbiriqsi oo hadal ah, waxay ku sii socotaa ku hadalka isla cod; biyaano la siiyo, waxa ay hagaajinaysaa qaab la mid ah.

Aragtida Farsamada

AudioLM waxa lagu tababbaray kaliya maqal-ma jiro qoraallo qoraal ah. SoundStream waxay ku cadaadisaa maqalka calaamadaha dhawaaqa iyadoo la adeegsanayo tirinta vector-ka haraaga ah, halka w2v-BERT ay siinayso calaamado semantic oo adag. Tusmada moodooyinka luqadda Transformer-ka waxay saadaaliyaan calaamadaha marxaladaha: semantic marka hore qaab dhismeedka, ka dibna calaamado dhawaaq ah oo qalafsan oo qumman oo dib-u-dhis sare leh. Codeeyaha SoundStream wuxuu ugu dambeyntii u rogaa calaamadihii la saadaaliyay qaab mawjad, isagoo soo saaraya cod ilaalinaya codka afhayeenka iyo soo jeedintiisa mid joogto ah.

Aqoonta AudioLM

AudioLM waa Google qaab cilmi baaris oo soo saarta maqal macquul ah - hadalka ama muusiga biyaano - iyadoo loola dhaqmo codka sida luqadda oo loo saadaaliyo calaamad ahaan. Waa arrin sababtoo ah waxay tustay inaad soo saari karto isku-dhafan, cod dabiici ah oo sii socon doona iyadoon wax qoraal ah laga helin ama dhibco muusig. AudioLM waxay ku fadhidaa qulqulka shaqada maqal-AI ee u beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta. Si loo dhiso faham qoto dheer, ula dhaqan AudioLM qaab hawleed, ma aha hal sifo: qeex natiijooyinka la rabo, caddee fikradaha, oo kala saar waxa nidaamku si kalsooni leh u samayn karo iyo waxa weli u baahan go'aan khabiir.

Ficil ahaan, kooxaha xoogga leh ee isticmaalaya AudioLM waxay ula dhaqmaan tayada, daahitaanka, iyo oggolaanshaha sida qaybo muhiim ah oo isku mid ah oo ka mid ah istiraatiijiyadda geynta. Waxay diiwaangeliyaan shuruudaha guusha ee cad, tijaabiyaan xogta dhabta ah iyo qulqulka shaqada, waxayna ku celceliyaan ku saleysan qaababka guul darrida ee la arkay halkii ay hal mar ku guuleysan lahaayeen halbeegyada. Tani waa halka fahamka aragtida uu isu beddelo karti waara oo dhan badeecada, siyaasadda, iyo hawlgallada.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Isla mar ahaantaana, si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo. Habka ugu adkeysi badan waa in la isku daro xawaaraha tijaabada iyo anshaxa maamulka: socodsiinta duuliyayaasha, qabashada caddaynta, daabacaadda go'aanka, iyo si joogto ah u cusboonaysii ilaalinta sida habdhaqanka moodeelka, filashada isticmaale, iyo shuruudaha sharciyaynta.

Saamaynta Istiraatijiyadeed

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Mustaqbalka AudioLM

Qalabka calamada ku saleysan ee AudioLM ayaa noqday aasaaska nidaamyada dambe: Google's AudioLM fikradaha la geliyey MusicLM ee qoraalka-music iyo SoundStorm ee jiilka dhaqsaha badan, halka goobta ballaaran ay hadda isku daraan calaamadaha semantic iyo acoustic ee guud ahaan hadalka, muusiga, iyo saamaynta dhawaaqa. Filo dhaqsiyaha badan, jiilka waqtiga-dhabta ah, wax soo saarka isku xiran ee dheer, iyo kontoroolka hababka kala duwan ee qoraalka ama calaamadaha kale ay hagaan moodooyinka lagu tababaray maqalka. Farsamooyin isku mid ah ayaa sidoo kale xoojiya welwelka ku saabsan xidhitaanka codka iyo dhageysiga qoto dheer ee maqalka.

Dhaqangelinta Adduunka-dhabta ah

Ku sii wadida goos goos gaaban oo isla codka ku hadla iyo laxanka la'aan qoraal

Hagaajinta muusik cusub oo biyaano ah oo u dhigma qaabka degdega ah ee la duubay

U adeegida sidii laf dhabarta jiilka maqalka ee hababka qoraalka-ku-muusiga sida MusicLM

Cilmi-baadhis lagu sameeyo hab-dhismeed-hadalka oo dhawra prosody iyo duubista acoustics ee muunad

Hababka Dhaqangelinta

AudioLM ficil ahaan

Ku sii wadida goos goos gaaban oo isla codka ku hadla iyo laxanka la'aan qoraal.

Ku sii wadida qoraalka hadalka gaaban ee isla codka ku hadla iyo laxanka la'aanteed kooxuhu waxay inta badan helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

AudioLM ficil ahaan

Hagaajinta muusik cusub oo biyaano ah oo u dhigma qaabka degdega ah ee la duubay.

Hagaajinta muusiga piano-ga cusub ee u dhigma qaabka degdega ah ee duuban ee kooban Kooxuhu waxay inta badan helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, iyo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

AudioLM ficil ahaan

U adeegida sidii laf dhabarta jiilka maqalka ee hababka qoraalka-ku-muusiga sida MusicLM.

U adeegida sida laf dhabarta jiilka maqalka ee nidaamyada-muusigga-muusigga sida Kooxaha MusicLM waxay inta badan helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

AudioLM ficil ahaan

Cilmi-baadhis lagu sameeyo hab-dhismeed-hadalka oo dhawra prosody iyo duubista acoustics ee muunad.

Cilmi-baadhis lagu sameeyo isku-xidhka hadalka ee ilaalinaya soo-saarka iyo duubista acoustics-ka muunad kooxuhu caadi ahaan waxay helayaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadista bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka ah waqti ka dib.

Khatarta & Dariiqyada Ilaalada

!

Si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo.

!

Saxnimadu waxay hoos ugu dhici kartaa lahjadaha, lahjadaha, ama jawiga buuqa badan.

!

Maqalka synthetic waxaa lagu khaldi karaa hadal dhab ah iyada oo aan si cad loo calaamadin.

Qorshe Hawleedka Dhaqangelinta

1

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

2

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka.

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

3

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka.

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

4

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka.

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

Sii wad Sahaminta