Visual AI GUIDE

VQGAN iyo Buug-gacmeedka Sawirka

VQGAN waxay ku cadaadisaa sawirada isku xidhka calaamado kala duwan oo laga soo qaatay buug kood la bartay, taas oo u ogolaanaysa transformer-ku inuu soo saaro sawiro si la mid ah qaababka luqaddu u soo saaraan qoraalka.

Dulmar

VQGAN waxay ku cadaadisaa sawirada isku xidhka calaamado kala duwan oo laga soo qaatay buug kood la bartay, taas oo u ogolaanaysa transformer-ku inuu soo saaro sawiro si la mid ah qaababka luqaddu u soo saaraan qoraalka.

VQGAN iyo Codebook Image Synthesis waxaa iska leh socodka shaqada-aragga kombiyuuterka taasoo tarjumeysa ama dhalinaysa warbaahin muuqaal ah oo loogu talagalay falanqaynta, hawlgallada, iyo hal-abuurka.

quusitaanka qoto dheer

VQGAN, oo lagu soo bandhigay xaashida 2021 'Taming Transformers for High-Resolution Image Synthesis', waxay isku daraysaa qalab-ku-tiri-ku-tiriseedka autoencoder (VQVAE) oo leh tababbar iska soo horjeeda iyo garashada. Encoder-ku wuxuu sawiraa sawir sixir yar oo muuqaal ah; vector kastaa waxa la jeexjeexay meesha ugu dhow ee buug-codee ee la bartay, dheh, 1024 codes, oo sawirka u beddelaya taxane calaamado ah. Qalab-sameeyaha ayaa dib-u-dhis ku sameeya sawirka calaamadahaas, oo lagu tababaray takoorka GAN iyo luminta garashada si dib-u-dhisku u ekaado mid fiiqan halkii uu ka dhalan lahaa. Sababtoo ah sawiradu hadda waa taxane calaamado kala duwan, transformer autoregressive wuxuu u qaabayn karaa sida luqadda, isaga oo saadaaliya calaamado mid mid ah. VQGAN waxay si caan ah u xoojisay qoraal-u-sawir hore qalab farshaxan markii lagu lammaaniyay hagida CLIP.

Aragtida Farsamada

Hawlgalka xudunta u ah waa qiyaasida vector: soo saarida codeeyaha joogtada ah waxaa lagu badalaa vectors-kooda buuga koodka ee kuugu dhow, oo leh 'toos-dhex-dhexaad ah' qiyaase si uu codeeyaha wali wax u baran karo inkasta oo aan la kala duwanayn. Ku darista midabtakoorka GAN-ku-salaysan ee dusha sare ee autoencoder-ka ayaa ah waxa u ogolaanaya VQGAN inay adeegsato shabaqooda calaamad aad uga yar (tusaale 16x16) marka loo eego VQVAE iyadoo la ilaalinayo textures, taasoo ka dhigaysa qaab beddelka qaabaynta.

Barashada VQGAN iyo Sawirka Buugga Codebook

VQGAN waxay ku cadaadisaa sawirada isku xidhka calaamado kala duwan oo laga soo qaatay buug kood la bartay, taas oo u ogolaanaysa transformer-ku inuu soo saaro sawiro si la mid ah qaababka luqaddu u soo saaraan qoraalka. VQGAN iyo Codebook Image Synthesis waxaa iska leh socodka shaqada-aragga kombiyuuterka taasoo tarjumeysa ama dhalinaysa warbaahin muuqaal ah oo loogu talagalay falanqaynta, hawlgallada, iyo hal-abuurka. Si loo dhiso faham qoto dheer, ula dhaqan VQGAN iyo Codebook Image Synthesis sidii qaab hawleed, ma aha hal sifo: qeex natiijooyinka la rabo, cadee fikradaha, oo kala saar waxa nidaamku si kalsooni leh u qaban karo iyo waxa weli u baahan go'aan khabiir.

Ficil ahaan, kooxaha xoogga leh ee isticmaalaya VQGAN iyo Codebook Image Synthesis dheelitirnaanta saxnaanta iyo xaqiiqooyinka hawlgelinta sida tayada xogta, kala duwanaanta iftiinka, iyo calaamadaynta joogteynta. Waxay diiwaangeliyaan shuruudaha guusha ee cad, tijaabiyaan xogta dhabta ah iyo qulqulka shaqada, waxayna ku celceliyaan ku saleysan qaababka guul darrida ee la arkay halkii ay hal mar ku guuleysan lahaayeen halbeegyada. Tani waa halka fahamka aragtida uu isu beddelo karti waara oo dhan badeecada, siyaasadda, iyo hawlgallada.

Visual AI wuxuu si otomaatig ah u samayn karaa baadhista, ogaanshaha, iyo sumadaynta hawlaha miisaanka. Isla mar ahaantaana, xuquuqda sawirku iyo ogolaanshaha waxay noqon karaan khataro sharci ah haddii caddayntu aanay caddayn. Habka ugu adkeysi badan waa in la isku daro xawaaraha tijaabada iyo anshaxa maamulka: socodsiinta duuliyayaasha, qabashada caddaynta, daabacaadda go'aanka, iyo si joogto ah u cusboonaysii ilaalinta sida habdhaqanka moodeelka, filashada isticmaale, iyo shuruudaha sharciyaynta.

Saamaynta Istiraatijiyadeed

Visual AI wuxuu si otomaatig ah u samayn karaa baadhista, ogaanshaha, iyo sumadaynta hawlaha miisaanka.

Visual AI wuxuu si otomaatig ah u samayn karaa baadhista, ogaanshaha, iyo sumadaynta hawlaha miisaanka. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Kooxaha hal-abuurka leh waxay hindise karaan fikradaha si dhakhso leh iyagoo leh dib-u-eegis buugeed yar.

Kooxaha hal-abuurka leh waxay hindise karaan fikradaha si dhakhso leh iyagoo leh dib-u-eegis buugeed yar. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Hawlgalladu waxay isticmaali karaan calaamadaha muuqaalka iyo muuqaalka kuwaas oo markii hore adkeyd in la farsameeyo.

Hawlgalladu waxay isticmaali karaan calaamadaha muuqaalka iyo muuqaalka kuwaas oo markii hore adkeyd in la farsameeyo. Hawlgelinta tayada sare leh, tan waxaa loo tarjumaa shuruuc hawleed la cabbiri karo, xuduudaha lahaanshaha, iyo caadooyinka dib u eegista soo noqnoqda si kooxuhu ay u cabbiraan kalsoonida halkii ay ka saari lahaayeen madmadowga.

Mustaqbalka VQGAN iyo Buug-gacmeedka Sawirka Sawirka

VQGAN's calaamo-calaamad gooni ah waxay noqotay aasaaska sawirka calaamooyinka ku salaysan iyo moodooyinka fiidyaha, laga bilaabo MaskGIT ilaa nidaamyada hab-dhaqameedka badan ee isku dara sawirka iyo calaamadaha qoraalka hal beddelka. Cilmi baaristu hadda waxay u riixdaa buug- codeedyo waaweyn, heer-kooban ama-fiirin-la'aan ah oo ka fogaanaya burburka buug-gacmeedka iyo dhinaca moodooyinka midaysan halkaas oo erayo isku mid ah ay ka kooban yihiin sawirro, maqal, iyo luqad, taasoo awood u siinaysa jiil kasta.

Dhaqangelinta Adduunka-dhabta ah

Ku dhejinta sawirka 16x16 grid ee calaamadaha buuga koodka si uu transformerku u qaabeeyo oo dib u soo kiciyo

Isku-dubbaridka VQGAN iyo hagida CLIP si loo abuuro farshaxanimada 'VQGAN+CLIP' AI ee dhabta ah ee fayraska galay 2021

Ku cadaadinta sawirada koodh kooban oo is haysta oo kaydinta hufan ama tababbarka wax-soo-saarka hoose

U adeega sida calaamadeeyaha sawirka gudaha soosaarayaasha ku saleysan calaamada sida MaskGIT iyo transformers multimodal

Hababka Dhaqangelinta

VQGAN iyo Buug-gacmeedka Sawirka ee ficil ahaan

Ku dhejinta sawir 16x16 shabag ah oo calaamada buug-qodeedka si uu transformer-ku u qaabeeyo oo dib u soo kiciyo.

Ku dhejinta sawirka 16x16 xayndaabyada calaamadaha codebook-ka si transformer-ku u qaabeeyo oo dib u soo nooleeyo Kooxuhu badanaa waxay helayaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

VQGAN iyo Buug-gacmeedka Sawirka ee ficil ahaan

Isku-dubbarididda VQGAN iyo hagidda CLIP si loo abuuro farshaxanimada 'VQGAN+CLIP' AI ee dhabta ah ee faafay 2021.

Isku-dubbarididda VQGAN iyo hagidda CLIP si loo abuuro farshaxan-dhisidda 'VQGAN+CLIP' AI fanka fayraska galay 2021 Kooxuhu waxay badanaa helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u kaca bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada khaladka waqti ka dib.

VQGAN iyo Buug-gacmeedka Sawirka ee ficil ahaan

Ku cadaadinta sawirada koodh kooban oo is haysta oo kaydinta hufan ama tababbarka wax-soo-saarka hoose.

Ku cadaadinta sawirada koodhadhka kooban ee kaydinta hufan ama tababbarka wax-soo-saarka ee hoose Kooxuhu waxay caadi ahaan helaan natiijooyin wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, oo ay la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

VQGAN iyo Buug-gacmeedka Sawirka ee ficil ahaan

U adeegaya sidii calaamadeeyaha sawirka gudaha soosaarayaasha calaamooyinka ku salaysan ee waaweyn sida MaskGIT iyo transformers multimodal.

U adeegida sida sumeeeyaha sawirka gudaha matoorayaasha waaweyn ee ku saleysan calaamada sida MaskGIT iyo transformers multimodal Teams inta badan waxay helaan natiijooyin ka wanaagsan marka ay qeexaan heerarka tayada ee hore, u hayaan dariiqa kor u qaadida bini'aadamka ee kiisaska cirifka ah, waxayna la socdaan labadaba faa'iidooyinka wax soo saarka iyo kharashyada qaladka waqti ka dib.

Khatarta & Dariiqyada Ilaalada

!

Xuquuqda sawirka iyo ogolaanshaha waxay noqon kartaa khataro sharci ah haddii caddayntu aanay caddayn.

!

Waxqabadka moodeelku wuu ku kala duwanaan karaa iftiinka, tirakoobka, iyo deegaanka.

!

Wanaagga beenta ah waxa laga yaabaa inaan la dareemin ilaa xadka kalsoonida aan la kormeerin.

Dhaqangelinta Roadmapka

1

Qeex shuruudaha aqbalida ee saxnaanta, dib u celinta, iyo kharashyada khaladka.

Qeex shuruudaha aqbalida ee saxnaanta, dib u celinta, iyo kharashyada khaladka. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

2

Ku tijaabi xogta ku habboon xaaladaha wax soo saarka dhabta ah.

Ku tijaabi xogta ku habboon xaaladaha wax soo saarka dhabta ah. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

3

Ku dar dib u eegis bini'aadamka si aad u hesho kalsoonida hoose ama saameeynta sare.

Ku dar dib u eegis bini'aadamka si aad u hesho kalsoonida hoose ama saameeynta sare. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

4

Lasoco moodeel dhaqaaqa oo dib u cusboonaysii kamarada ama xogta kaydinta ka dib.

Lasoco moodeel dhaqaaqa oo dib u cusboonaysii kamarada ama xogta kaydinta ka dib. Tallaabo kasta ula dhaqan sida albaabka caddaynta: haddii shuruudaha la buuxin waayo, hakad soo bixidda, xidh farqiga, ka dibna balaadhi isticmaalka.

Sii wad Sahaminta