HAGAHA Audio AI

SoundStream Neural Codec

SoundStream waa Google-dhammaadka-ilaa-dhamaadka cod-koodka maqalka neerfaha kaas oo ku cadaadiya hadalka iyo muusigga bitrate-yada aadka u hooseeya iyadoo la ilaalinayo tayada.

Dulmar

SoundStream waa Google-dhammaadka-ilaa-dhamaadka cod-koodka maqalka neerfaha kaas oo ku cadaadiya hadalka iyo muusigga bitrate-yada aadka u hooseeya iyadoo la ilaalinayo tayada. Waa arrin sababtoo ah waxay ku garaacday codecs-dhaqameedka sida Opus isla bitrate waxayna awood u yeelataa moodooyinka maqalka ee casriga ah.

SoundStream Neural Codec wuxuu ku fadhiyaa qulqulka shaqada ee maqalka-AI kaas oo u beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta.

quusitaanka qoto dheer

Waxaa soo bandhigay Google sanadka 2021, SoundStream waa codec neural ah oo si buuxda looga dhisay saddex qaybood oo la wada tababaray: koodhare kontorol ah oo u rogaya qaab-dhismeedka cayriin ee isku xigxiga ee vectors, quantizer vector haraaga (RVQ) kaas oo ka saara vectorskaas, iyo wax ka beddelka kacaanka. Waxaa lagu tababbaray khasaaraha dib-u-dhiska iyo qaab-takoorka iska soo horjeeda ee qaabka GAN, marka wax-soo-saarku wuxuu u eg yahay mid dabiici ah halkii uu tiro ahaan u dhow yahay. Sifada taagan waa 'la cabiri karo' ama tababbarka quantizer- dropout: hal nooc ayaa ka shaqayn kara guud ahaan bitrates qiyaastii 3 ilaa 18 kbps si fudud iyada oo la isticmaalayo wax ka badan ama ka yar oo lakabyo quantizer ah marka la eego, iyada oo aan dib loo tababarin. Marka la joogo 3 kbps waxaa lagu soo waramayaa in ay Opus kaga fiican tahay 12 kbps marka la eego tijaabooyinka dhegeysiga, maaraynta hadalka, muusiga, iyo maqalka guud ee hal nooc oo ku shaqayn kara wakhtiga dhabta ah ee CPU casriga ah.

Aragtida Farsamada

Qaabka mawjaduhu waxa uu dhex maraa rogrogga fidsan kuwaas oo si aad ah hoos ugu dhacay, soona saaraya hal xidhidh halkii jir (tusaale 75 fiim/ilbiriqsi). RVQ ka dib waxay u codeeeysaa wax kasta oo la dhexgelinayo sida xirmo tusmooyinka koodka. Bitrate waxay le'eg tahay heerka qaabaynta wakhtiyada tirada wakhtiyada qiyaasaha firfircoon ee buugii koodka. Ka tagista Quantizer waxay si aan kala sooc lahayn u gooyaa rasmada RVQ inta lagu jiro tababarka, taasoo ku qasabta buugaag codeedyo hore inay qaadaan macluumaadka ugu muhiimsan si codec-ku si qurux badan u hooseeyo heerar hoose.

Mastering SoundStream Neural Codec

SoundStream waa Google-dhammaadka-ilaa-dhamaadka cod-koodka maqalka neerfaha kaas oo ku cadaadiya hadalka iyo muusigga bitrate-yada aadka u hooseeya iyadoo la ilaalinayo tayada. Waa arrin sababtoo ah waxay ku garaacday codecs-dhaqameedka sida Opus isla bitrate waxayna awood u yeelataa moodooyinka maqalka ee casriga ah. SoundStream Neural Codec wuxuu ku fadhiyaa qulqulka shaqada ee maqalka-AI kaas oo u beddela hadalka, muusiga, iyo codka isgaarsiinta, gelitaanka, iyo soosaarka warbaahinta. Si loo dhiso faham qoto dheer, ula dhaqan SoundStream Neural Codec sidii moodal hawleed, ma aha hal sifo: qeex natiijooyinka la rabo, cadee fikradaha, oo kala saar waxa nidaamku si kalsooni leh u qaban karo iyo waxa weli u baahan go'aan khabiir.

Ficil ahaan, kooxaha xoogga leh ee isticmaalaya SoundStream Neural Codec waxay ula dhaqmaan tayada, daahitaanka, iyo oggolaanshaha sida qaybo isku mid ah oo muhiim ah oo ka mid ah istiraatiijiyadda geynta. Waxay diiwaangeliyaan shuruudaha guusha ee cad, tijaabiyaan xogta dhabta ah iyo qulqulka shaqada, waxayna ku celceliyaan ku saleysan qaababka guul darrida ee la arkay halkii ay hal mar ku guuleysan lahaayeen halbeegyada. Tani waa halka fahamka aragtida uu isu beddelo karti waara oo dhan badeecada, siyaasadda, iyo hawlgallada.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Isla mar ahaantaana, si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo. Habka ugu adkeysi badan waa in la isku daro xawaaraha tijaabada iyo anshaxa maamulka: socodsiinta duuliyayaasha, qabashada caddaynta, daabacaadda go'aanka, iyo si joogto ah u cusboonaysii ilaalinta sida habdhaqanka moodeelka, filashada isticmaale, iyo shuruudaha sharciyaynta.

Saamaynta Istiraatijiyadeed

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod.

Waxay wanaajisaa marin u helida iyada oo loo marayo qoraal-qorid, sheeko, iyo is-dhexgalyo cod. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar.

Kooxaha warbaahintu waxay ku soo rari karaan codka sifaysan si degdeg ah iyagoo wata miisaaniyado yaryar. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn.

Nidaamyada u jeedda macmiisha waxay ka baaraandegi karaan isdhexgalka hadalka si weyn. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Mustaqbalka SoundStream Neural Codec

SoundStream waxay dejisay jaantuska markii dambe codecs sida EnCodec iyo DAC la safeeyey, iyo calaamadaheeda kala duwan waxay noqdeen substrate-ka nidaamyada wax-soo-saarka sida AudioLM iyo MusicLM. Filo faraca u riixaya xattaa xattaa bitrates hoose, calaamado habaysan oo macne ahaan loo habeeyey oo labanlaabanaya sidii wax-soo-saarka soosaarayaasha maqalka ee qaabka luqadda, iyo diritaanka qalabka si adag ee wicitaanada tooska ah, aalada maqalka, iyo qulqulka halka xawaaraha iyo daahitaanka si adag loo xaddiday.

Dhaqangelinta Adduunka-dhabta ah

Cadaadiska wicitaanada codka ilaa ~ 3 kbps iyadoo ay ka dhawaajinayaan codecyada dhaxalka ah ee bitrates sare

Soo saarista calaamado maqal oo kala duwan oo quudiya Google's AudioLM iyo moodooyinka wax-abuurka ee MusicLM

Ku daawashada maqalka-bandwidth-yar ee waqtiga-dhabta ah ee aaladaha mobilada oo leh koodka-CPU-ga iyo dejinta

Kaydinta ama gudbinta muusiga iyo dhawaaqa ambient si hufan oo hal moodeel ah kaas oo gacanta ku haya dhammaan noocyada nuxurka

Hababka Dhaqangelinta

SoundStream Neural Codec ficil ahaan

Cadaadiska wicitaanada codka ilaa ~ 3 kbps iyadoo ay ka dhawaajinayaan codecyada dhaxalka ah ee bitrates sare.

Cadaadiska wicitaanada codka ~ 3 kbps iyadoo ay ka dhawaajinayaan codecs dhaxalka ah ee bitrates sare Kooxuhu waxay badanaa helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, waxay hayaan dariiqa kor u kaca bini'aadamka ee kiisaska cirifka ah, waxayna la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

SoundStream Neural Codec ficil ahaan

Soo saarista calaamado maqal oo gooni ah oo quudiya Google's AudioLM iyo moodooyinka wax-abuurka ee MusicLM.

Soo saarista calaamado maqal ah oo kala duwan oo quudiya Google's AudioLM iyo moodooyinka wax-soo-saarka MusicLM Kooxuhu waxay inta badan helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

SoundStream Neural Codec ficil ahaan

Ku daawashada maqalka-bandwidth-yar ee-waqtiga-dhabta ah ee aaladaha moobaylka oo leh koodka-CPU-ga iyo dejinta

Daawashada codka-bandwidth-yar ee waqtiga-dhabta ah ee aaladaha mobilada leh ee ku jira-CPU-ga iyo kooxuhu sida caadiga ah waxay helayaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadista bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

SoundStream Neural Codec ficil ahaan

Kaydinta ama gudbinta muusiga iyo dhawaaqa ambient si hufan oo hal moodeel ah kaas oo gacanta ku haya dhammaan noocyada nuxurka.

Kaydinta ama u gudbinta muusiga iyo dhawaaqa jawiga si hufan oo hal qaab ah oo wax ka qabta dhammaan noocyada nuxurka Kooxuhu waxay inta badan helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, iyo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

Khatarta & Dariiqyada Ilaalada

!

Si xun u isticmaalka codka iyo khataraha is-yeelyeelku way kordhaan marka oggolaanshaha la waayo.

!

Saxnimadu waxay hoos ugu dhici kartaa lahjadaha, lahjadaha, ama jawiga buuqa badan.

!

Maqalka synthetic waxaa lagu khaldi karaa hadal dhab ah iyada oo aan si cad loo calaamadin.

Qorshe Hawleedka Dhaqangelinta

1

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka

Hel ogolaansho cad oo ku saabsan qabashada codka, xidhitaanka, iyo dib u isticmaalka Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

2

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka.

Tijaabi tayada ku hadasha kala duwan iyo xaaladaha asalka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

3

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka.

Qeex marka bani'aadamku ay tahay inuu dib u eego ama oggolaado wax soo saarka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

4

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka.

Ku calaamadee codka synthetic oo xafid diiwaannada la-xisaabtanka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

Sii wad Sahaminta