Kayayyakin AI JAGORA

Masked Autoencoders

Masked Autoencoders (MAE) hanya ce mai kulawa da kai wanda ke koyar da ƙirar hangen nesa don sake gina hotuna bayan an ɓoye yawancin hoton.

Dubawa

Masked Autoencoders (MAE) hanya ce mai kulawa da kai wanda ke koyar da ƙirar hangen nesa don sake gina hotuna bayan an ɓoye yawancin hoton. Ta hanyar koyon cike guraben, ƙirar tana gina wadataccen fahimtar gani ba tare da kowane tambarin ɗan adam ba.

Masked Autoencoders na cikin ayyukan aikin hangen nesa na kwamfuta wanda ke fassara ko samar da kafofin watsa labarai na gani don bincike, ayyuka, da kerawa.

Zurfafa nutsewa

Masked Autoencoders, wanda Kaiming He da abokan aiki suka gabatar a Meta AI a cikin 2021, suna ɗaukar hoto, raba shi zuwa ƙananan faci, kuma ba da gangan ɓoye babban juzu'in su ba, yawanci 75%. Mai canza hangen nesa yana aiwatar da facin da ake iya gani kawai, yayin da na'ura mai sauƙi yana ƙoƙarin sake gina ainihin pixels na waɗanda suka ɓace. Saboda abubuwa da yawa suna ɓoye, ƙirar ba za ta iya kwafin pixels na kusa ba kawai kuma dole ne su koyi tsari mai ma'ana, kamar siffofi da sassan abubuwa. Mai rikodin rikodin tsallake facin abin rufe fuska yana sa horo cikin sauri da ingantaccen ƙwaƙwalwar ajiya. Bayan riga-kafi, ana jefar da mai rikodin rikodin kuma mai rikodin yana canjawa da ƙarfi zuwa rarrabuwa, ganowa, da ayyukan rarrabawa.

Fahimtar Fasaha

Dabarar maɓalli shine asymmetry: mai ɗaukar hoto mai nauyi yana ganin kashi 25% na facin da ba a rufe shi ba, yayin da ƙaramin dikodi ke sake gina sauran. Faci-faci an daidaita su, an saka su a layi, kuma an ba su rikodi na matsayi. Asarar sake ginawa ita ce kuskuren ƙididdigewa mai murabba'i da aka ƙididdige shi kawai akan faci da aka rufe, yawanci akan ƙimar pixel daidaitacce. Matsakaicin abin rufe fuska yana tilasta koyo na ma'anar maimakon ƙaramin matakin tsaka-tsaki, da tsallake alamomin rufe fuska a cikin yankan ramin ƙididdigewa da sarrafa cikakken hoto.

Kwarewar Masked Autoencoders

Masked Autoencoders (MAE) hanya ce mai kulawa da kai wanda ke koyar da ƙirar hangen nesa don sake gina hotuna bayan an ɓoye yawancin hoton. Ta hanyar koyon cike guraben, ƙirar tana gina wadataccen fahimtar gani ba tare da kowane tambarin ɗan adam ba. Masked Autoencoders na cikin ayyukan aikin hangen nesa na kwamfuta wanda ke fassara ko samar da kafofin watsa labarai na gani don bincike, ayyuka, da kerawa. Don haɓaka fahimta mai zurfi, bi da Masked Autoencoders azaman ƙirar aiki, ba sifa ɗaya ba: ayyana sakamakon da ake so, fayyace zato, da raba abin da tsarin zai iya dogara da abin da har yanzu ke buƙatar yanke hukunci na ƙwararru.

A aikace, ƙungiyoyi masu ƙarfi masu amfani da Masked Autoencoders daidaita daidaito tare da haƙiƙanin aiki kamar ingancin bayanai, bambancin haske, da daidaiton lakabi. Suna rubuta ƙayyadaddun ƙa'idodin nasara, gwaji akan bayanan gaskiya da gudanawar aiki, da jujjuyawar bisa ga tsarin gazawar da aka lura maimakon cin nasara na lokaci ɗaya. Wannan shine inda fahimtar ka'idar ta juya zuwa iyawa mai dorewa a cikin samfura, manufofi, da ayyuka.

Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin. A lokaci guda, Haƙƙin Hoto da yarda na iya zama haɗari na shari'a idan ba a fayyace ba. Hanyar da ta fi dacewa ita ce haɗa saurin gwaji tare da horon gudanarwa: gudanar da matukin jirgi, kama shaida, buga rajistan ayyukan yanke shawara, da ci gaba da sabunta abubuwan tsaro kamar yadda halayen ƙira, tsammanin mai amfani, da buƙatun tsari ke tasowa.

Dabarun Tasiri

Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin.

Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.

Ƙungiyoyin ƙirƙira za su iya samar da ra'ayoyi cikin sauri tare da ƙarancin bita da hannu.

Ƙungiyoyin ƙirƙira za su iya samar da ra'ayoyi cikin sauri tare da ƙarancin bita da hannu. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.

Ayyuka na iya amfani da siginar hoto da bidiyo waɗanda a baya suke da wahalar aiwatarwa.

Ayyuka na iya amfani da siginar hoto da bidiyo waɗanda a baya suke da wahalar aiwatarwa. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.

Makomar Masked Autoencoders

Sake gina abin rufe fuska-style MAE yana zama tsoho girke-girke na pretraining a duk hanyoyin. Masu bincike suna mika shi zuwa bidiyo (boye kubes na sararin samaniya), na'urar kallon sauti, sikanin likitanci, da hotunan tauraron dan adam, inda alamomin ba su da yawa kuma masu tsada. Yi tsammanin haɗuwa mai ƙarfi tare da harshe don ƙirar tushen tushe na multimodal, mafi inganci na'urar dikodi, da abin rufe fuska mai daidaitawa waɗanda ke keɓance yankuna masu ba da labari. Yayin da ƙididdigewa ke girma, horarwar da abin rufe fuska akan ɗimbin hotuna marasa lakabi ya kamata ya ci gaba da haɓaka daidaiton ƙasa tare da rage dogaro ga bayanin ɗan adam mai tsada.

Aiwatar da Gaskiyar Duniya

Gabatar da Mai Canja Hankali akan miliyoyin hotuna marasa lakabi, sannan kuma daidaita shi don rarraba ImageNet tare da daidaito mai ƙarfi.

Fasalolin koyo daga sikanin likitanci mara lakabi (X-ray, MRIs) inda bayanin ƙwararru ke da tsada kuma yana da iyaka.

Daidaita hanyar zuwa bidiyo ta hanyar rufe faci na lokacin sararin samaniya don horar da ƙirar aikin-gane (VideoMAE)

Horarwa akan tauraron dan adam da hotunan sararin sama don tallafawa taswirar amfani da ƙasa da kuma canza ganowa ba tare da alamun hannu ba.

Hanyoyin Aiwatarwa

Masked Autoencoders a aikace

Gabatar da Mai Canja Hankali akan miliyoyin hotuna marasa lakabi, sannan kuma daidaita shi don rarraba ImageNet tare da daidaito mai ƙarfi.

Horar da Mai Canjin hangen nesa akan miliyoyin hotuna marasa lakabi, sannan daidaita shi don rarrabawar ImageNet tare da daidaito mai ƙarfi Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓaka ɗan adam don ƙararraki, da kuma bin diddigin nasarorin samarwa da ƙimar kuskure akan lokaci.

Masked Autoencoders a aikace

Fasalolin koyo daga sikanin likita marasa lakabi (X-ray, MRIs) inda bayanin ƙwararru ke da tsada da iyaka.

Siffofin koyo daga sikanin likitanci marasa lakabi (X-ray, MRIs) inda bayanin ƙwararru ke da tsada kuma Ƙungiyoyi masu iyaka yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don lokuta masu gefe, da kuma bin diddigin abubuwan da ake samu da ƙimar kuɗi a kan lokaci.

Masked Autoencoders a aikace

Daidaita hanyar zuwa bidiyo ta hanyar rufe faci na lokacin sararin samaniya don horar da ƙirar aikin-gane (VideoMAE).

Daidaita hanyar zuwa bidiyo ta hanyar rufe facin sararin samaniya don fara horar da ƙirar aikin-ganewa (VideoMAE) Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don ƙararraki, da kuma bin diddigin nasarorin samarwa da ƙimar kuskure akan lokaci.

Masked Autoencoders a aikace

Horowa akan tauraron dan adam da hotuna na iska don tallafawa taswirar amfani da ƙasa da gano ganowa ba tare da alamun hannu ba.

Horarwa akan tauraron dan adam da hotunan sararin sama don tallafawa taswirar amfani da ƙasa da gano ganowa ba tare da alamun hannu Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don ƙararraki, da bin diddigin nasarorin samarwa da ƙimar kuskure a kan lokaci.

Hatsari & Tsare-tsare

!

Haƙƙoƙin hoto da yarda na iya zama haɗari na shari'a idan ba a fayyace ba.

!

Ayyukan samfuri na iya bambanta a ko'ina cikin haske, ƙididdiga, da mahalli.

!

Ƙarya tabbataccen ƙila ba za a iya lura da shi ba sai dai idan an kula da ƙofofin amincewa.

Taswirar Hanya

1

Ƙayyade ma'auni na karɓa don daidaito, tunowa, da farashi na kuskure.

Ƙayyade ma'auni na karɓa don daidaito, tunowa, da farashi na kuskure. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.

2

Gwada tare da bayanan da suka dace da ainihin yanayin samarwa.

Gwada tare da bayanan da suka dace da ainihin yanayin samarwa. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.

3

Ƙara bita na ɗan adam don ƙarancin amincewa ko tsinkaya mai tasiri.

Ƙara bita na ɗan adam don ƙarancin amincewa ko tsinkaya mai tasiri. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.

4

Bi diddigin ƙirar ƙira kuma sake ingantawa bayan canje-canjen kamara ko saitin bayanai.

Bi diddigin ƙirar ƙira kuma sake ingantawa bayan canje-canjen kamara ko saitin bayanai. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.

Ci gaba da Bincike