Nchịkọta
SpecAugment bụ ụzọ dị mfe ma dị ike na-eme ka data dịkwuo ike nke na-ekpuchi ma na-agbagha spectrogram nke okwu iji mee ka ụdị njirimara sie ike karị. Ọ kwalitere izi ezi na akara akara na-enweghị mgbanwe ọ bụla ọhụrụ ma ọ bụ ihe atụ.
SpecAugment for Speech Recognition na-anọdụ na ụda-AI workflows na-agbanwe okwu, egwu, na ụda maka nzikọrịta ozi, nnweta, na mmepụta mgbasa ozi.
Ime miri emi
SpecAugment, nke Google Brain (Park et al.) webatara na 2019, na-akwalite ọzụzụ njiri mara okwu site na-edezi log-mel spectrogram ozugbo karịa ụdị waveform. Ọ na-emetụta atọ arụmọrụ: oge warping, nke ubé agbatị ma ọ bụ compresses audio tinyere oge axis; ugboro ugboro masking, nke zeroes pụọ bandeji nke ugboro ọwa; na nkpuchi oge, nke na-ewepụ ogologo oge usoro. Site n'ịmanye ihe nlereanya ka ọ mata okwu ọbụlagodi mgbe ezoro ezo nke spectrogram, SpecAugment na-arụ ọrụ dị ka nhazigharị ma na-egbochi oke. Ọ dị oke ọnụ ala ma dị irè, na-enyere ụdị ụdị LAS aka iru ọnụ ọgụgụ njehie okwu ọgbara ọhụrụ na LibriSpeech na Switchboard, ọ na-anọgide na-abụ ihe ndabere na pipeline ọzụzụ ASR ọgbara ọhụrụ.
Nghọta nka nka
SpecAugment na-arụ ọrụ na 2D spectrogram dị ka a ga-asị na ọ bụ onyonyo. Nkpuchi ugboro ugboro na-ewepụ ihe mgbochi nke ọwa mel-frequency; oge nkpuchi na-ewepụ ihe mgbochi nke okpokolo agba ugboro ugboro; oge warping na-agbanwe ebe a họọrọ n'akụkụ axis oge site na iji interpolation. Enwere ike itinye ọtụtụ ihe mkpuchi kwa otu okwu. N'ihi na ihe mkpuchi ahụ na-agbanwe oge ọ bụla, ihe nlereanya ahụ na-ahụ nke ọma ọdịiche na-adịghị agwụ agwụ nke ihe atụ ọ bụla, na-emeziwanye mkpokọta na-enweghị ịnakọta data ọhụrụ.
Mastering SpecAugment maka nnabata okwu
SpecAugment bụ ụzọ dị mfe ma dị ike na-eme ka data dịkwuo ike nke na-ekpuchi ma na-agbagha spectrogram nke okwu iji mee ka ụdị njirimara sie ike karị. Ọ kwalitere izi ezi na akara akara na-enweghị mgbanwe ọ bụla ọhụrụ ma ọ bụ ihe atụ. SpecAugment for Speech Recognition na-anọdụ na ụda-AI workflows na-agbanwe okwu, egwu, na ụda maka nzikọrịta ozi, nnweta, na mmepụta mgbasa ozi. Iji wuo nghọta miri emi, na-emeso SpecAugment for Speech Recognition dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewaa ihe sistemụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.
Na omume, ndị otu siri ike na-eji SpecAugment for Speech Recognition na-emeso ịdịmma, nkwụsịtụ, na nkwenye dị ka akụkụ dị mkpa nke atụmatụ mbugharị. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'otu oge ahụ, iji olu eme ihe n'ụzọ na-ezighị ezi na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.
Mmetụta atụmatụ
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu.
Ọ na-eme ka nnweta ya dịkwuo mma site na ndegharị, ịkọ akụkọ, na ntụgharị olu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego.
Ndị otu mgbasa ozi nwere ike ibubata ọdịyo a na-egbu maramara ngwa ngwa site na iji obere mmefu ego. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu.
Sistemụ na-eche ihu ndị ahịa nwere ike hazie mkparịta ụka n'ọtụtụ buru ibu. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Mmejuputa n'ezie n'ụwa
Na-emeziwanye ọnụego mperi okwu na LibriSpeech site na ikpuchi igwe spectrogram n'oge ọzụzụ
Na-ahazi ụdị ASR ngwụcha ruo ọgwụgwụ dị ka LAS ma ọ bụ Conformer iji belata nfefe
Na-emewanye obere dataset maka asụsụ ndị dị ala na-enweghị ndekọ ọdịyo ọhụrụ
Na-emegharị echiche nkpuchi na nkwenye ọkà okwu na nhazi ọkwa mmemme ọdịyo
Usoro mmejuputa
SpecAugment maka nnabata okwu na omume
Na-emeziwanye ọnụego mperi okwu na LibriSpeech site na ikpuchi igwe spectrogram n'oge ọzụzụ.
Ịkwalite ọnụego njehie okwu na LibriSpeech site na ikpuchi spectrogram band n'oge ọzụzụ Ndị otu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ ọnụ, ma soro ma uru nrụpụta na ụgwọ njehie na oge.
SpecAugment maka nnabata okwu na omume
Na-ahazi ụdị ASR ngwụcha ruo ọgwụgwụ dị ka LAS ma ọ bụ Conformer iji belata nfefe.
Ịhazi ụdị ASR nke njedebe na njedebe dị ka LAS ma ọ bụ Conformer iji belata otu ndị na-emebiga ihe ókè na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ dịkwuo elu maka ikpe ikpe, ma soro ma uru nrụpụta na ụgwọ njehie na oge.
SpecAugment maka nnabata okwu na omume
Na-emewanye obere dataset maka asụsụ ndị dị ala na-enweghị ndekọ ọdịyo ọhụrụ.
Ịkwalite obere dataset maka asụsụ ndị dị ala na-enweghị ndekọ otu egwu ọdịyo ọhụrụ na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, debe ụzọ mmụba mmadụ maka oke ikpe, ma soro ma uru nrụpụta yana ọnụ ahịa njehie ka oge na-aga.
SpecAugment maka nnabata okwu na omume
Na-emegharị echiche nkpuchi na nkwenye ọkà okwu na nhazi ọkwa mmemme ọdịyo.
Ịmeghari echiche masking na nkwenye ọkà okwu na nhazi ọkwa ihe omume ọdịyo Otu dị iche iche na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ okwu, ma soro ma uru nrụpụta na ụgwọ njehie na-agafe oge.
Ihe ize ndụ & okporo ụzọ nche
Iji olu eme ihe na ihe egwu mpụta ga-abawanye mgbe nkwenye na-efu.
Izi ezi nwere ike ịdaba n'ofe ụda olu, olumba ma ọ bụ gburugburu mkpọtụ.
Enwere ike imehie ọdịyo sịntetik dị ka ezigbo okwu na-enweghị akara doro anya.
Map mmejuputa
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị.
Nweta nkwenye doro anya maka ijide olu, imechi, na ijigharị. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere.
Nwale ogo n'ofe ndị na-ekwu okwu dị iche iche yana ọnọdụ ndabere. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye.
Kọwaa mgbe mmadụ ga-enyocha ma ọ bụ kwado nsonye. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ.
Deba aha ọdịyo sịntetik ma debe ndekọ ihe ndekọ maka ịza ajụjụ. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.