Dubawa
DepthAnything samfurin tushe ne wanda ke kimanta nisa kowane pixel daga hoto na yau da kullun, ba tare da kayan masarufi na musamman ba. Ya yi ƙarfi, zurfin maƙasudin maƙasudi mai arha da samun dama ga komai daga wayoyi zuwa mutummutumi.
Zurfin Duk wani Zurfin Monocular nasa ne na ayyukan aikin hangen nesa na kwamfuta wanda ke fassara ko samar da kafofin watsa labarai na gani don bincike, ayyuka, da kerawa.
Zurfafa nutsewa
DepthAnything (2024, wanda masu bincike suka fitar ciki har da waɗanda ke TikTok/ByteDance da HKU) suna magance ƙima mai zurfi na monocular: tsinkayar taswira mai zurfi daga hoton RGB guda ɗaya. Ci gabansa ya kasance ma'auni: maimakon dogaro da iyakataccen bayanan zurfin da ake samu, ƙungiyar ta ƙera injin wanda ya yi wa kansa lakabi da hotuna kusan miliyan 62 da ba a lakabi ta hanyar amfani da ƙirar malami, sannan ta horar da ɗalibi kan wannan babbar ƙungiyar. Wannan yana ba da juzu'i mai ƙarfi na sifili a cikin gida, waje, da wuraren da ba a saba gani ba. Sakamakon asali na asali yana fitar da zurfin dangi (waɗanda pixels suke kusa ko nesa, ba daidaitattun mita ba). DepthAnything V2 (tsakiyar 2024) ya kaifafa cikakkun bayanai ta hanyar horar da malami kan bayanan roba tare da cikakkiyar gaskiya ta gaskiya, sannan karkatar da hotuna na gaske, gyara gefuna masu duhu da kurakuran abu.
Fahimtar Fasaha
Yana amfani da DINov2 mai canza hangen nesa-mai canza hangen nesa yana ciyar da babban tsinkayar irin salon DPT. Makullin dabara ita ce distillation da ake kula da shi: malami wanda ya horar da kan lakabin bayanan karya-lakabin miliyoyin hotuna marasa lakabi, kuma dalibi yana koyo daga duka biyun. V2 yana musanya haƙiƙanin alamun surutu don bayanan roba tare da cikakkiyar zurfin pixel, sannan ya mayar da baya zuwa ainihin hotuna, yana kawar da rashi da hayaniyar bayanan zurfin bayanai yayin kiyaye iyakoki.
Jagoran Zurfin Komai Zurfin Halitta
DepthAnything samfurin tushe ne wanda ke kimanta nisa kowane pixel daga hoto na yau da kullun, ba tare da kayan masarufi na musamman ba. Ya yi ƙarfi, zurfin maƙasudin maƙasudi mai arha da samun dama ga komai daga wayoyi zuwa mutummutumi. Zurfin Duk wani Zurfin Monocular nasa ne na ayyukan aikin hangen nesa na kwamfuta wanda ke fassara ko samar da kafofin watsa labarai na gani don bincike, ayyuka, da kerawa. Don gina zurfin fahimta, bi DepthAnything Monocular Depth a matsayin samfurin aiki, ba sifa ɗaya ba: ayyana sakamakon da ake so, fayyace zato, da kuma raba abin da tsarin zai iya dogara da abin da har yanzu yana buƙatar yanke hukunci na ƙwararru.
A aikace, ƙungiyoyi masu ƙarfi suna amfani da daidaiton ma'auni mai zurfi na DepthAnything Monocular tare da haƙiƙanin aiki kamar ingancin bayanai, bambancin haske, da daidaiton lakabi. Suna rubuta ƙayyadaddun ƙa'idodin nasara, gwaji akan bayanan gaskiya da gudanawar aiki, da jujjuyawar bisa ga tsarin gazawar da aka lura maimakon cin nasara na lokaci ɗaya. Wannan shine inda fahimtar ka'idar ta juya zuwa iyawa mai dorewa a cikin samfura, manufofi, da ayyuka.
Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin. A lokaci guda, Haƙƙin Hoto da yarda na iya zama haɗari na shari'a idan ba a fayyace ba. Hanyar da ta fi dacewa ita ce haɗa saurin gwaji tare da horon gudanarwa: gudanar da matukin jirgi, kama shaida, buga rajistan ayyukan yanke shawara, da ci gaba da sabunta abubuwan tsaro kamar yadda halayen ƙira, tsammanin mai amfani, da buƙatun tsari ke tasowa.
Dabarun Tasiri
Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin.
Kayayyakin AI na iya sarrafa aiki da bincike, ganowa, da ayyuka masu alama a sikelin. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.
Ƙungiyoyin ƙirƙira za su iya samar da ra'ayoyi cikin sauri tare da ƙarancin bita da hannu.
Ƙungiyoyin ƙirƙira za su iya samar da ra'ayoyi cikin sauri tare da ƙarancin bita da hannu. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.
Ayyuka na iya amfani da siginar hoto da bidiyo waɗanda a baya suke da wahalar aiwatarwa.
Ayyuka na iya amfani da siginar hoto da bidiyo waɗanda a baya suke da wahalar aiwatarwa. A cikin ƙawance masu inganci, ana fassara wannan zuwa ƙa'idodin aiki waɗanda za a iya aunawa, iyakokin ikon mallaka, da kuma bita-da-kullin bita don ƙungiyoyi su iya haɓaka kwarin gwiwa a maimakon ɓata shakku.
Aiwatar da Gaskiyar Duniya
Ƙirƙirar taswira mai zurfi don fitar da ɓacin rai na gaskiya (bokeh) a cikin hotunan wayar ruwan tabarau guda ɗaya.
Samar da hasashe na cikas na 3D ga jiragen sama marasa tsada da mutummutumi waɗanda ba su da LiDAR ko kyamarori na sitiriyo.
Ƙirƙirar taswirorin sanyaya zurfafa don ControlNet don haka masu samar da hoto su adana lissafi na yanayi.
Mayar da hotuna da fina-finai na 2D zuwa 3D ko tasirin parallax don VR da nunin stereoscopic.
Hanyoyin Aiwatarwa
Zurfin Komai Zurfin Monocular a aikace
Ƙirƙirar taswira mai zurfi don fitar da ɓacin rai na gaskiya (bokeh) a cikin hotunan wayar ruwan tabarau guda ɗaya.
Ƙirƙirar taswira mai zurfi don fitar da haƙiƙanin blur baya (bokeh) a cikin hotunan hoto na wayar hannu guda ɗaya Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don ƙararraki, da bin duk nasarorin samarwa da ƙimar kuskure akan lokaci.
Zurfin Komai Zurfin Monocular a aikace
Samar da hasashe na cikas na 3D ga jiragen sama marasa tsada da mutummutumi waɗanda ba su da LiDAR ko kyamarori na sitiriyo.
Samar da hangen nesa na cikas na 3D don ƙananan jiragen sama marasa tsada da robots waɗanda ba su da LiDAR ko kyamarori na sitiriyo Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ƙofofin inganci a gaba, kiyaye hanyar haɓakar ɗan adam don shari'o'in gefe, da bin diddigin nasarorin samarwa da tsadar kurakurai a kan lokaci.
Zurfin Komai Zurfin Monocular a aikace
Ƙirƙirar taswirorin sanyaya zurfafa don ControlNet don haka masu samar da hoto su adana lissafi na yanayi.
Ƙirƙirar taswirorin daidaitawa mai zurfi don ControlNet don haka masu samar da hoto suna adana yanayin lissafi Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don shari'o'in gefe, da bin duk nasarorin samarwa da farashi na kuskure akan lokaci.
Zurfin Komai Zurfin Monocular a aikace
Mayar da hotuna da fina-finai na 2D zuwa 3D ko tasirin parallax don VR da nunin stereoscopic.
Mayar da hotuna da fina-finai na 2D zuwa 3D ko tasirin parallax don VR da nunin stereoscopic Ƙungiyoyi yawanci suna samun sakamako mafi kyau lokacin da suka ayyana ma'auni masu inganci a gaba, kiyaye hanyar haɓakar ɗan adam don ƙararrakin gaba, da bin diddigin nasarorin samarwa da ƙimar kuskure akan lokaci.
Hatsari & Tsare-tsare
Haƙƙoƙin hoto da yarda na iya zama haɗari na shari'a idan ba a fayyace ba.
Ayyukan samfuri na iya bambanta a ko'ina cikin haske, ƙididdiga, da mahalli.
Ƙarya tabbataccen ƙila ba za a iya lura da shi ba sai dai idan an kula da ƙofofin amincewa.
Taswirar Hanya
Ƙayyade ma'auni na karɓa don daidaito, tunowa, da farashi na kuskure.
Ƙayyade ma'auni na karɓa don daidaito, tunowa, da farashi na kuskure. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.
Gwada tare da bayanan da suka dace da ainihin yanayin samarwa.
Gwada tare da bayanan da suka dace da ainihin yanayin samarwa. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.
Ƙara bita na ɗan adam don ƙarancin amincewa ko tsinkaya mai tasiri.
Ƙara bita na ɗan adam don ƙarancin amincewa ko tsinkaya mai tasiri. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.
Bi diddigin ƙirar ƙira kuma sake ingantawa bayan canje-canjen kamara ko saitin bayanai.
Bi diddigin ƙirar ƙira kuma sake ingantawa bayan canje-canjen kamara ko saitin bayanai. Ɗauki kowane mataki azaman ƙofar shaida: idan ba a cika sharuɗɗa ba, dakatar da fitar, rufe tazarar, sannan kawai faɗaɗa amfani.