HAGAHA Audio AI

Isku-duwayaasha Cepstral-Frequency Mel-Frequency

Mel-Frequency Cepstral Coefficients (MFCCs) waa tirooyin kooban oo soo koobaya qaabka dhawaaqa inta jeer ee sida ay dhegaha bini'aadamku u arkaan.

Dulmar

Mel-Frequency Cepstral Coefficients (MFCCs) waa tirooyin kooban oo soo koobaya qaabka dhawaaqa inta jeer ee sida ay dhegaha bini'aadamku u arkaan. Tobannaan sano waxay ahaayeen astaanta shaqada ee aqoonsiga hadalka, aqoonsiga hadalka, iyo falanqaynta muusigga.

Mel-Frequency Cepstral Coefficients waxay ku fadhiyaan qulqulka shaqada maqal-AI ee beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta.

quusitaanka qoto dheer

MVCC-yadu waxay u beddelaan jeex gaaban oo maqal ah qiyaastii 13 nambar oo qabsada timbre. Dhuunuhu waxay qaadaa qaabka hirarka, waxay u kala jebiyaan ~ 25ms, waxay ku xisaabisaa awoodda awoodda iyada oo loo marayo isbeddelka Fourier, ka dibna waxay ku dhufataa dhidibka soo noqnoqda ee miisaanka mel, kaas oo u kala xira habka cochlea u sameeyo: si ka hooseeya 1kHz iyo si aan toos ahayn. Tamarta mel waa la isku-buufiyey (oo iska ekaysiinaya aragtida qaylada) oo ugu dambayntii dhex martay isbeddelka cosine discrete, kaas oo qurxiya oo xog ururisa dhawrka qaybood ee ugu horreeya. Natiijadu waxay ku adag tahay dhawaaqa iyo dhawaaqa hadalka, waana sababta Hidden Markov Model ee caadiga ah iyo hababka hadalka ee isku dhafka ah ee Gaussian ay ku tiirsan yihiin MMFC-yada ku dhawaad ​​guud ahaan ka hor waxbarashada qoto dheer.

Aragtida Farsamada

Miisaanka mel wuxuu ku qiyaasaa aragtida garoonka ee mel = 2595 log10(1 + f/700), markaa tillaabooyinka mel siman ayaa si siman u kala fogaaday. Beddelka cosine-ka ugu dambeeya ee discrete (DCT) waa tallaabada 'cepstral': waxay u daaweysaa log-mel spectrum sidi calaamad waxayna kala saartaa qaabka codka si tartiib tartiib ah u kala duwan (xakamaynta hoose ee cepstral, qaybta aan ilaalinayno) laga soo bilaabo isku-dheellitirka garoonka degdega ah (isku-duwayaasha sare, inta badan waa la tuuraa), si habsami leh uga soocida aqoonsiga codka ee garoonka hadalka.

Hagaajinta Isku-xireyaasha Cepstral-ka-soo noqnoqda

Mel-Frequency Cepstral Coefficients (MFCCs) waa tirooyin kooban oo soo koobaya qaabka dhawaaqa inta jeer ee sida ay dhegaha bini'aadamku u arkaan. Tobannaan sano waxay ahaayeen astaanta shaqada ee aqoonsiga hadalka, aqoonsiga hadalka, iyo falanqaynta muusigga. Mel-Frequency Cepstral Coefficients waxay ku fadhiyaan qulqulka shaqada maqal-AI ee beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta. Si loo dhiso faham qoto dheer, ula dhaqan Mel-Frequency Cepstral Coefficients sidii qaab hawleed, ma aha hal sifo: qeex natiijooyinka la rabo, cadee fikradaha, oo kala saar waxa nidaamku si kalsooni leh u qaban karo iyo waxa wali u baahan go'aan khabiir.

Ficil ahaan, kooxaha xoogga leh ee isticmaalaya Isku-xireyaasha Cel-Frequency Cepstral waxay ula dhaqmaan tayada, daahitaanka, iyo oggolaanshaha sida qaybo isku mid ah oo muhiim ah oo ka mid ah istiraatiijiyadda geynta Waxay diiwaangeliyaan shuruudaha guusha ee cad, tijaabiyaan xogta dhabta ah iyo qulqulka shaqada, waxayna ku celceliyaan ku saleysan qaababka guul darrida ee la arkay halkii ay hal mar ku guuleysan lahaayeen halbeegyada. Tani waa halka fahamka aragtida uu isu beddelo karti waara oo dhan badeecada, siyaasadda, iyo hawlgallada.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Isla mar ahaantaana, si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo. Habka ugu adkeysi badan waa in la isku daro xawaaraha tijaabada iyo anshaxa maamulka: socodsiinta duuliyayaasha, qabashada caddaynta, daabacaadda go'aanka, iyo si joogto ah u cusboonaysii ilaalinta sida habdhaqanka moodeelka, filashada isticmaale, iyo shuruudaha sharciyaynta.

Saamaynta Istiraatijiyadeed

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Mustaqbalka Isku-duwayaasha Cepstral-Frequency Mel-Frequency

Shabakado qoto dheer ilaa dhamaad-ilaa-dhamaadka waxay si isa soo taraysa u bartaan sifooyin toos ah mowjadaha cayriin ama spectrograms log-mel, iyaga oo ka boodaya DCT, sidaa darteed MVCC-yada saafiga ah ayaa ka sii lumaya ASR-ka casriga ah. Haddana waxay caan ku yihiin hawlo fudud, qalab, iyo xog hoose: tilmaamida ereyga muhiimka ah, ogaanshaha dhaqdhaqaaqa codka, sawir qaadista codka, iyo bioacoustics. Filo in MCC-yadu ay ku sii jiraan si hufan, aasaaska la tarjumi karo xitaa sida darafyada hore ee la bartay ay u badan yihiin moodooyinka waaweyn.

Dhaqangelinta Adduunka-dhabta ah

Astaamaha codka ee HMM-GMM garashada hadalka caadiga ah sida Sphinx hore iyo nidaamyada HTK

Xaqiijinta hadalka iyo shubanka, kala saarida qofka ku hadlaya wicitaanka

Kala soocida nooca muusiga iyo faraha heesta (Shazam-style timbre is waafajinta)

Ogaanshaha khaladaadka mashiinka ama wicitaanada xayawaanka ee maqalka ee kormeerka warshadaha iyo noolaha

Hababka Dhaqangelinta

Isku-duwayaasha Cepstral-Frequency Mel-Frequency ee ficil ahaan

Astaamaha codka ee HMM-GMM garashada hadalka caadiga ah sida Sphinx hore iyo nidaamyada HTK.

Astaamaha codka ee HMM-GMM garashada hadalka caadiga ah sida Sphinx hore iyo nidaamyada HTK kooxuhu waxay badanaa helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

Isku-duwayaasha Cepstral-Frequency Mel-Frequency ee ficil ahaan

Xaqiijinta hadalka iyo shubanka, kala saarida qofka ku hadlaya wicitaanka.

Xaqiijinta hadalka iyo dhageysiga, kala soocidda qofka ku hadlaya wicitaanka Kooxuhu waxay badanaa helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

Isku-duwayaasha Cepstral-Frequency Mel-Frequency ee ficil ahaan

Kala soocida nooca muusiga iyo faraha heesaha (Timbre-style-style matching).

Kala soocida nooca muusiga iyo faraha heesaha (Shazam-style timbre matching) Kooxuhu badanaa waxay helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, waxayna la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

Isku-duwayaasha Cepstral-Frequency Mel-Frequency ee ficil ahaan

Ogaanshaha khaladaadka mashiinka ama wicitaanada xayawaanka ee maqalka ee kormeerka warshadaha iyo noolaha.

Ogaanshaha khaladaadka mishiinada ama wicitaanada xayawaanka ee maqalka ee warshadaha iyo la socodka noolaha Kooxaha sida caadiga ah waxay helayaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u kaca bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

Khatarta & Dariiqyada Ilaalada

!

Si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo.

!

Saxnimadu waxay hoos ugu dhici kartaa lahjadaha, lahjadaha, ama jawiga buuqa badan.

!

Maqalka synthetic waxaa lagu khaldi karaa hadal dhab ah iyada oo aan si cad loo calaamadin.

Qorshe Hawleedka Dhaqangelinta

1

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

2

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka.

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

3

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka.

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

4

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka.

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

Sii wad Sahaminta