HAGAHA Audio AI

DeepSpeech Architecture

DeepSpeech waa qaabka aqoonsiga hadalka dhamaadka-ilaa-dhamaadka oo ay soo bandhigtay Baidu 2014 kaas oo khariidado sifooyin maqal cayriin ah si toos ah ugu dhejiya qoraalka iyada oo la adeegsanayo shabakad neural ah oo soo noqnoqota oo lagu tababaray khasaaraha CTC.

Dulmar

DeepSpeech waa qaabka aqoonsiga hadalka dhamaadka-ilaa-dhamaadka oo ay soo bandhigtay Baidu 2014 kaas oo khariidado sifooyin maqal cayriin ah si toos ah ugu dhejiya qoraalka iyada oo la adeegsanayo shabakad neural ah oo soo noqnoqota oo lagu tababaray khasaaraha CTC. Waxa ay gacan ka gaysatay in laga guuro kakan, dhuumaha ASR-gacanta lagu farsameeyay ee u jihaystay wax la bartay, habab xogta lagu hago.

DeepSpeech Architecture wuxuu ku fadhiyaa qulqulka shaqada maqalka-AI kaas oo beddela hadalka, muusiga, iyo codka isgaarsiinta, gelista, iyo soosaarka warbaahinta.

quusitaanka qoto dheer

Aqoonta hadalka qadiimiga ah waxay isku toleen moodooyin dhawaaq gaar ah, qaamuusyo ku dhawaaqida, iyo moodooyinka luqadda oo leh qaybo gacanta lagu hagaajiyay. DeepSpeech ayaa taas inteeda badan ku beddeshay hal shabakad oo neerfaha ah oo u tababaran dhammaad ilaa dhammaad. Nashqaddeedu waxa ay qaadaa spectrogram ama MMFC muuqaalada fiimyada maqalka ee gaagaaban oo ay ku quudiyaan dhawr lakab oo si buuxda isugu xidhan, lakab laba jiho ah oo soo noqnoqda kaas oo qabta macnaha hore iyo mustaqbalka, iyo lakab wax soo saar ah oo soo saara qaybinta suurtogalka ah ee jilayaasha talaabo kasta. Muhiimad ahaan, waxay isticmaashaa Kala-saar ku-meel-gaar ah oo ku-meel-gaar ah (CTC), taas oo u oggolaanaysa shabakadu inay bartaan isku-habaynta u dhexeeya maqalka iyo qoraalka iyada oo aan loo baahnayn calaamado heer-jir ah. Mozilla ayaa markii dambe soo saartay hirgelinta il furan oo caan ah (oo leh noocyo cusub oo isticmaalaya LSTM-ku-saleysan, nashqada la socon karo), taasoo ka dhigaysa habka si ballaaran loo heli karo.

Aragtida Farsamada

Awood bixiyaha furaha waa khasaaraha CTC. Hadalka iyo qoraalku maaha kuwo isku toosan oo qaab-jir ah, markaa CTC waxay soo bandhigaysaa calaamad 'madhan' oo waxay koobaysaa dhammaan toosinta suurtogalka ah ee ku burburta qoraalka bartilmaameedka. Tani waxay u sahlaysaa moodelku inuu soo saaro jile mar kasta oo uu barto halka dhawaaqyada khariidadda xarfaha si toos ah u socdaan. RNN laba jiho ah ayaa siinaysa saadaal kasta marin u helida macnaha dhawaaqa ku xeeran, iyo qaabka luqadda n-gramka dibadda ayaa inta badan lagu daraa wakhtiga go'aaminta si loo hagaajiyo higaada iyo doorashada kelmadda.

Barashada DeepSpeech Architecture

DeepSpeech waa qaabka aqoonsiga hadalka dhamaadka-ilaa-dhamaadka oo ay soo bandhigtay Baidu 2014 kaas oo khariidado sifooyin maqal cayriin ah si toos ah ugu dhejiya qoraalka iyada oo la adeegsanayo shabakad neural ah oo soo noqnoqota oo lagu tababaray khasaaraha CTC. Waxa ay gacan ka gaysatay in laga guuro kakan, dhuumaha ASR-gacanta lagu farsameeyay ee u jihaystay wax la bartay, habab xogta lagu hago. DeepSpeech Architecture wuxuu ku fadhiyaa qulqulka shaqada maqalka-AI kaas oo beddela hadalka, muusiga, iyo codka isgaarsiinta, gelista, iyo soosaarka warbaahinta. Si loo dhiso faham qoto dheer, ula dhaqan DeepSpeech Architecture qaab hawleed, ma aha hal sifo: qeex natiijooyinka la rabo, cadee fikradaha, oo kala saar waxa nidaamku si kalsooni leh u qaban karo iyo waxa weli u baahan go'aan khabiir.

Ficil ahaan, kooxaha xoogga leh ee isticmaalaya DeepSpeech Architecture waxay ula dhaqmaan tayada, daahitaanka, iyo oggolaanshaha sida qaybo muhiim ah oo isku mid ah oo ka mid ah istiraatiijiyadda geynta. Waxay diiwaangeliyaan shuruudaha guusha ee cad, tijaabiyaan xogta dhabta ah iyo qulqulka shaqada, waxayna ku celceliyaan ku saleysan qaababka guul darrida ee la arkay halkii ay hal mar ku guuleysan lahaayeen halbeegyada. Tani waa halka fahamka aragtida uu isu beddelo karti waara oo dhan badeecada, siyaasadda, iyo hawlgallada.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Isla mar ahaantaana, si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo. Habka ugu adkeysi badan waa in la isku daro xawaaraha tijaabada iyo anshaxa maamulka: socodsiinta duuliyayaasha, qabashada caddaynta, daabacaadda go'aanka, iyo si joogto ah u cusboonaysii ilaalinta sida habdhaqanka moodeelka, filashada isticmaale, iyo shuruudaha sharciyaynta.

Saamaynta Istiraatijiyadeed

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Mustaqbalka DeepSpeech Architecture

DeepSpeech lafteedu waxa si weyn u beddelay feejignaan- iyo qaab-dhismeedka ku-salaysan beddelka (Conformer, Whisper, wav2vec 2.0) kaas oo qabsada macnaha guud iyo is-maamulida maqalka aan la summadaysan. Laakiin fikradaheeda asaasiga ah, tababarka dhamaadka-ilaa-dhamaadka iyo CTC-dajinta, ayaa weli ah aasaaska waxayna wali ka dhex muuqdaan nidaamyada isku-dhafan ee casriga ah. Dhaxalku waa fikradeed: waxa ay caddeeyeen in hal nooc oo la bartay uu la tartami karo dhuumaha si weyn loo farsameeyey, taas oo u gogol xaaraysa moodooyinka aasaasiga ah ee hadalka ee waaweyn, luuqado badan ku hadla, is-maamula maanta.

Dhaqangelinta Adduunka-dhabta ah

Qad la'aanta, aqoonsiga amarka codka aaladda ee codsiyada diirada saaraya sirta ah iyadoo la adeegsanayo Mozilla's DeepSpeech furan

Soo saarida qoraalada qoraalka ah ee podcasts ama muxaadarooyinka adiga oo aan ku tiirsanayn adeegga daruuraha

Barida aasaaska dhamaadka-ilaa-dhamaadka ASR iyo khasaaraha CTC ee koorsooyinka barashada mashiinka-jaamacadda

Dhisidda isku-xidhka codka gaarka ah ee IoT ama aaladaha ku-xidhan halka loo baahan yahay garane fudud oo la socon karo

Hababka Dhaqangelinta

DeepSpeech Architecture ficil ahaan

Qad la'aanta, aqoonsiga amarka codka aaladda ee codsiyada diirada saaraya sirta iyadoo la adeegsanayo Mozilla's DeepSpeech furan.

Khadka tooska ah, aqoonsiga amarka codka aaladda ee codsiyada sirta diirada saaraya iyadoo la adeegsanayo kooxaha DeepSpeech furan ee Mozilla waxay caadi ahaan helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadista bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

DeepSpeech Architecture ficil ahaan

Soo saarida qoraalada qoraalka ah ee podcasts ama muxaadarooyinka adiga oo aan ku tiirsanayn adeegga daruuraha.

Abuurista qoraalada qabyada ah ee podcasts ama muxaadarooyinka iyada oo aan lagu tiirsanayn adeegga daruuriga Kooxuhu waxay inta badan helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

DeepSpeech Architecture ficil ahaan

Barida aasaaska dhamaadka-ilaa-dhamaadka ASR iyo khasaaraha CTC ee koorsooyinka barashada mashiinka-jaamacadda.

Baritaanka aasaasiga ah ee dhamaadka-ilaa-dhamaadka ASR iyo khasaaraha CTC ee koorsooyinka barashada mashiinka-jaamacadda Kooxuhu waxay badanaa helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, waxay hayaan dariiqa kor u kaca bini'aadamka ee kiisaska cirifka ah, waxayna la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

DeepSpeech Architecture ficil ahaan

Dhisidda isku-xidhka codka gaarka ah ee IoT ama aaladaha ku-xidhan halka loo baahan yahay garane fudud oo la socon karo.

Dhisidda isku-xidhka codka caadiga ah ee IoT ama aaladaha gundhigga ah halkaas oo loo baahan yahay garane fudud, oo la socon karo Kooxuhu inta badan waxay helayaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, waxay hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, waxayna la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

Khatarta & Dariiqyada Ilaalada

!

Si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo.

!

Saxnimadu waxay hoos ugu dhici kartaa lahjadaha, lahjadaha, ama jawiga buuqa badan.

!

Maqalka synthetic waxaa lagu khaldi karaa hadal dhab ah iyada oo aan si cad loo calaamadin.

Qorshe Hawleedka Dhaqangelinta

1

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

2

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka.

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

3

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka.

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

4

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka.

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

Sii wad Sahaminta