Nchịkọta
UnivNet bụ GAN vocoder nke na-ekpe ikpe na-emepụta ọdịyo site na iji ọtụtụ spectrogram gbakọrọ na mkpebi STFT dị iche iche, na-amụba nkọwa zuru oke. Ọ na-achọ ịbụ vocoder zuru ụwa ọnụ nke na-agbasa nke ọma na ndị na-ekwu okwu na-adịghị ahụ anya na ọnọdụ ndekọ.
UnivNet Multi-Resolution Vocoder na-anọdụ na usoro ọrụ ọdịyo-AI na-agbanwe okwu, egwu na ụda maka nzikọrịta ozi, nnweta na mmepụta mgbasa ozi.
Ime miri emi
UnivNet, nke Jang et al tụpụtara ya. na 2021, na-egbochi adịghị ike nke GAN vocoders na-ahụkarị: ugboro ugboro dị elu nke gbachiri emechi ma ọ bụ ihe arụrụ arụ. Ọnọdụ generator ya na mel-spectrograms zuru oke ma na-eji ọnọdụ mgbanwe mgbanwe ọnọdụ (LVC), ebe a na-ebu amụma kernel convolution na ofufe site na njirimara ntinye ka nzacha ahụ dabara na ọdịnaya mpaghara. Echiche isiokwu bụ multi-resolution spectrogram discriminator (MRSD): kama ikpe naanị ụdị waveform, UnivNet na-agbakọ ọtụtụ STFT nwere windo dị iche iche na nha hop ma na-agba ndị ịkpa ókè n'ogo spectrogram ahụ. Nke a na-akpali onye na-emepụta ọkụ ka ọ nweta ma ọmarịcha nkọwapụta na nhazi oge sara mbara nke ọma. N'ịbụ onye a zụrụ n'ọtụtụ ndị na-ekwu okwu, UnivNet na-ewepụta okwu okike maka olu ọ na-ahụtụbeghị n'oge ọzụzụ, na-enweta akara ya zuru ụwa ọnụ.
Nghọta nka nka
Ọnọdụ UnivNet na-agbanwe agbanwe na-ewepụta oke kernel ya ike site na njirimara mel na-edozi site na obere netwọkụ kernel-predictor, yabụ usoro oge ọ bụla na-eji nzacha na-eme ka ọ dị mma karịa kernel ekekọrịtara. Ejikọtara ya na ịkpa ókè spectrogram nke ọtụtụ mkpebi, nke na-agbasa ọtụtụ oge azụmaahịa n'otu oge, nke a na-elekwasị anya n'otu egwu dị elu ebe ndị vocoders GAN dị mfe na-agbaji ma ọ bụ na-akparị.
Mastering UnivNet Multi-Resolution Vocoder
UnivNet bụ GAN vocoder nke na-ekpe ikpe na-emepụta ọdịyo site na iji ọtụtụ spectrogram gbakọrọ na mkpebi STFT dị iche iche, na-amụba nkọwa zuru oke. Ọ na-achọ ịbụ vocoder zuru ụwa ọnụ nke na-agbasa nke ọma na ndị na-ekwu okwu na-adịghị ahụ anya na ọnọdụ ndekọ. UnivNet Multi-Resolution Vocoder na-anọdụ na usoro ọrụ ọdịyo-AI na-agbanwe okwu, egwu na ụda maka nzikọrịta ozi, nnweta na mmepụta mgbasa ozi. Iji wulite nghọta miri emi, na-emeso UnivNet Multi-Resolution Vocoder dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewapụ ihe sistemụ ahụ nwere ike ime nke ọma na ihe ka chọrọ mkpebi ndị ọkachamara.
Na omume, ndị otu siri ike na-eji UnivNet Multi-Resolution Vocoder na-emeso ịdịmma, latency, na nkwenye dị ka akụkụ dị mkpa nke atụmatụ mbugharị. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'otu oge ahụ, iji olu eme ihe n'ụzọ na-ezighị ezi na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.
Mmetụta atụmatụ
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Mmejuputa n'ezie n'ụwa
Ọrụ TTS ọtụtụ ndị na-ekwu okwu nke ga-adarịrị ụda eke na olu adịghị adị na data ọzụzụ
Pipeline cloning olu ebe otu vocoder zuru ụwa ọnụ na-ejere ọtụtụ ndị na-ekwu okwu ebumnuche
Akwụkwọ ọdịyo nwere ntụkwasị obi dị elu na akụkọ pọdkastị chọrọ sibilance dị nkọ na ugboro dị elu
Vocoder azụ maka sistemu TTS ngwụcha ruo ọgwụgwụ na-ejikọ onye amụma spectrogram na igwe na-ebupụta ebili mmiri siri ike.
Usoro mmejuputa
UnivNet Multi-Resolution Vocoder na omume
Ọrụ TTS ọtụtụ ndị na-ekwu okwu nke ga-adarịrị ụda eke na olu adịghị adị na data ọzụzụ.
Ọrụ TTS ọtụtụ ndị na-ekwu okwu nke ga-ada ụda dị mma na ụda adịghị adị na data ọzụzụ Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka ikpe ọnụ, ma soro ma uru nrụpụta na ụgwọ njehie n'ime oge.
UnivNet Multi-Resolution Vocoder na omume
Pipeline cloning olu ebe otu vocoder zuru ụwa ọnụ na-ejere ọtụtụ ndị na-ekwu okwu ebumnuche.
Pipeline cloning olu ebe otu vocoder zuru ụwa ọnụ na-ejere ọtụtụ ndị na-ekwu okwu lekwasịrị anya Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka oke ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.
UnivNet Multi-Resolution Vocoder na omume
Akwụkwọ ọdịyo nwere ntụkwasị obi dị elu na akụkọ pọdkastị chọrọ sibilance dị nkọ na ugboro dị elu.
Akwụkwọ ọdịyo nwere ntụkwasị obi dị elu na akụkọ pọdkastị chọrọ crisp sibilance na ọnụ ọgụgụ dị elu Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, na-edobe ụzọ ịrị elu mmadụ maka ikpe ikpe, ma soro ma uru nrụpụta yana ọnụ ahịa njehie ka oge na-aga.
UnivNet Multi-Resolution Vocoder na omume
Vocoder azụ maka sistemu TTS ngwụcha ruo ọgwụgwụ na-ejikọ amụma spectrogram na igwe na-ebupụta ebili mmiri siri ike.
Backend vocoder maka sistemu TTS nke ngwụcha ruo na ngwụcha nke na-ejikọ onye amụma spectrogram na igwe na-emepụta ebili mmiri siri ike Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ ịrị elu mmadụ maka ikpe ọnụ, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.
Ihe ize ndụ & okporo ụzọ nche
Iji olu eme ihe na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu.
Izi ezi nwere ike ịdaba n'ofe ụda olu, olumba ma ọ bụ gburugburu mkpọtụ.
Enwere ike imehie ọdịyo sịntetik dị ka ezigbo okwu na-enweghị akara doro anya.
Map mmejuputa
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị.
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.