Nchịkọta
FastSpeech na-ewepụta spectrogram okwu dum n'otu n'otu karịa otu etiti n'otu oge, na-eme ka njikọ ahụ dị ngwa ngwa ma kwụsie ike. Ọ doziri ọgbọ na-adịghị ngwa ngwa, nke na-enweghi ike imejọ nke mebiri ụdị autoregressive mbụ dị ka Tacotron.
FastSpeech na ndị na-abụghị Autoregressive TTS na-anọdụ na ụda-AI workflows na-agbanwe okwu, egwu, na ụda maka nkwurịta okwu, nnweta, na mgbasa ozi mmepụta.
Ime miri emi
Ụdị TTS ndị mbụ dị ka Tacotron 2 bụ ndị na-emegharị anya: ha na-ebu amụma ụda olu ọ bụla nwere ọnọdụ na nke gara aga, nke na-adị ngwa ngwa ma na-adịkarị mfe mafe ma ọ bụ okwu ugboro ugboro mgbe nlebara anya na-ezighị ezi. FastSpeech, nke __AIU_PROTECTED_5_ na Mahadum Zhejiang webatara na 2019, tụgharịrị nke a site na ịkọ okpokolo agba niile n'otu oge. Netwọk mgbasa ozi nke dabere na ntụgharị na-ewe fọnịm, na-ebu amụma n'ụzọ doro anya ogologo oge ekwentị ọ bụla ga-adịru site na iji ogologo nhazi ogologo, wee gbasaa usoro ahụ gaa na ọnụọgụ okpomoku ziri ezi tupu ịmepụta spectrogram n'otu ngafe. FastSpeech 2 kwalitere na nke a site n'ịkọ ọkwa ọkwa na ike yana site na ọzụzụ oge ebumnuche site na itinye mmanye kama ịwepụ ha site na ụdị onye nkuzi dị nwayọ, na-enyekwu okwu okike na njikwa.
Nghọta nka nka
Isi aghụghọ bụ ogologo regulator. N'ihi na ederede na ọdịyo nwere ogologo dị iche iche, FastSpeech na-ebu amụma ogologo oge maka fọnịm ọ bụla ma na-ekwughachi ọnọdụ ezoro ezo nke fọnịm ahụ ọtụtụ oge iji dakọọ ogologo spectrogram. Nhazi a doro anya na-anọchi anya adịghị ike. Ịmepụta etiti ọ bụla n'otu n'otu pụtara oge ntinye aka na-adabere na ogologo nkebiokwu, na iwepụ akaghị aka na-ekpochapụ mperi nke ịwụ na ikwughachi okwu.
Ịkwalite Okwu FastSpeech na TTS na-abụghị nke autoregressive
FastSpeech na-ewepụta spectrogram okwu dum n'otu n'otu karịa otu etiti n'otu oge, na-eme ka njikọ ahụ dị ngwa ngwa ma kwụsie ike. Ọ doziri ọgbọ na-adịghị ngwa ngwa, nke na-enweghi ike imejọ nke mebiri ụdị autoregressive mbụ dị ka Tacotron. FastSpeech na ndị na-abụghị Autoregressive TTS na-anọdụ na ụda-AI workflows na-agbanwe okwu, egwu, na ụda maka nkwurịta okwu, nnweta, na mgbasa ozi mmepụta. Iji wuo nghọta miri emi, na-emeso FastSpeech na ndị na-abụghị Autoregressive TTS dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewaa ihe usoro ahụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.
Na omume, ndị otu siri ike na-eji FastSpeech na ndị na-abụghị Autoregressive TTS na-emeso ịdịmma, latency, na nkwenye dị ka akụkụ dị mkpa nke atụmatụ mbughari. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'otu oge ahụ, iji olu eme ihe n'ụzọ na-ezighị ezi na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.
Mmetụta atụmatụ
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Mmejuputa n'ezie n'ụwa
Ngwa igodo ozugbo na-emepụta mkpali olu na-atụgharị n'otu ntabi anya site na iji nhazi ụdị FastSpeech.
Sistemụ ọrụ ndị ahịa-IVR na-atụgharị ederede dị ike ka ọ bụrụ okwu n'ọtụtụ na-enweghị njehie mwụli okwu.
Ndị na-agụ ihuenyo nnweta na-ewepụta ngwa ngwa, okwu ntụkwasị obi maka akwụkwọ ogologo na ngwaike dị obere.
Ngwa ọdịnaya olu na-eme ka ndị okike tweak pitch na ọnụego ikwu okwu ozugbo, ekele maka ngwa ngwa ngwa ngwa na amụma ike nke FastSpeech 2.
Usoro mmejuputa
FastSpeech na TTS na-abụghị Autoregressive na omume
Ngwa igodo ozugbo na-emepụta mkpali olu na-atụgharị n'otu ntabi anya site na iji nhazi ụdị FastSpeech.
Ngwa ịnyagharị oge na-emepụta ụda olu na-atụgharị n'otu ntabi anya na-eji ngwa ngwa ngwa ngwa ngwa ngwa ngwa ngwa na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ okwu, ma soro ma uru nrụpụta yana ụgwọ njehie na oge.
FastSpeech na TTS na-abụghị Autoregressive na omume
Sistemụ ọrụ ndị ahịa-IVR na-atụgharị ederede dị ike ka ọ bụrụ okwu n'ọtụtụ na-enweghị njehie mwụli okwu.
Sistemụ ọrụ IVR nke ndị ahịa na-atụgharị ederede siri ike gaa n'okwu n'ọtụtụ na-enweghị njehie mpụ okwu Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-edobe ụzọ ịrị elu mmadụ maka ikpe ihu, ma soro ma uru nrụpụta na ụgwọ njehie na oge.
FastSpeech na TTS na-abụghị Autoregressive na omume
Ndị na-agụ ihuenyo nnweta na-ewepụta ngwa ngwa, okwu ntụkwasị obi maka akwụkwọ ogologo na ngwaike dị obere.
Ndị na-agụ ihuenyo nnweta na-ewepụta ngwa ngwa, okwu a pụrụ ịdabere na ya maka akwụkwọ ogologo oge na otu ngwaike dị ala na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka oke ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie ka oge na-aga.
FastSpeech na TTS na-abụghị Autoregressive na omume
Ngwa ọdịnaya olu na-eme ka ndị okike tweak pitch na ọnụego ikwu okwu ozugbo, ekele maka ngwa ngwa ngwa ngwa na amụma ike nke FastSpeech 2.
Ngwá ọrụ ọdịnaya olu na-eme ka ndị okike tweak pitch na ọnụ ọgụgụ ikwu okwu ozugbo, n'ihi FastSpeech 2's pịtị doro anya na ike amụma Otu dị iche iche na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ okwu, ma soro ma uru mmepụta na ụgwọ njehie na oge.
Ihe ize ndụ & okporo ụzọ nche
Iji olu eme ihe na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu.
Izi ezi nwere ike ịdaba n'ofe ụda olu, olumba ma ọ bụ gburugburu mkpọtụ.
Enwere ike imehie ọdịyo sịntetik dị ka ezigbo okwu na-enweghị akara doro anya.
Map mmejuputa
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị.
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.