Mwongozo wa AI unaoonekana

Ukadiriaji wa Kina cha Usambazaji wa Marigold

Marigold anatumia tena muundo wa uenezaji wa taswira uliofunzwa awali (Usambazaji Imara) ili kutabiri ramani zenye kina.

Muhtasari

Marigold anatumia tena muundo wa uenezaji wa taswira uliofunzwa awali (Usambazaji Imara) ili kutabiri ramani zenye kina. Inaonyesha kuwa unaweza kubadilisha maarifa tele ya kuona ya jenereta kuwa zana sahihi ya utambuzi yenye data ya mafunzo kidogo.

Ukadiriaji wa Kina cha Usambaaji wa Marigold ni wa mtiririko wa kuona wa kompyuta ambao hufasiri au kutoa midia ya kuona kwa uchanganuzi, utendakazi na ubunifu.

Dive ya kina

Marigold (ETH Zurich, CVPR 2024 Karatasi Bora Kutajwa kwa Heshima) huweka upya makadirio ya kina kama tatizo la kuzalishwa kwa masharti. Badala ya kufunza mtandao wa kina kutoka mwanzo, husanikisha Usambazaji Imara ili 'kutoa' ramani ya kina iliyochorwa kwenye picha ya uingizaji. Maarifa ni kwamba kielelezo kilichofunzwa kuunganisha picha za uhalisia tayari kimejifunza jiometri ya eneo, mwangaza na muundo ndani kabisa ya nafasi yake iliyofichika, mambo muhimu hasa kwa kina. Inashangaza, Marigold alirekebishwa vyema kwenye hifadhidata za syntetisk pekee (kama Hypersim na KITTI Virtual) bado inajumlisha vyema kwa picha halisi zisizo na risasi. Hutoa kina cha jamaa kisichobadilika na chenye maelezo mazuri ya kipekee, ingawa upanuzi wa mara kwa mara huifanya iwe polepole kuliko miundo ya kusambaza mbele kama vile DepthAnything.

Ufahamu wa Kiufundi

Marigold hufanya kazi katika nafasi fiche ya Diffusion. Picha na ramani ya kina imesimbwa na VAE sawa; U-Net imesanifiwa vyema ili kutoa sauti ya kina iliyofichika kwenye picha safi iliyofichika. Kwa makisio huendesha kitanzi cha kawaida cha kutoa sauti ya kurudiarudia, kisha hutenganisha kina kificho. Kwa sababu ni sampuli, kukimbia nyingi kunaweza kuunganishwa kwa uthabiti, kukokotoa biashara kwa usahihi. Baadaye 'LCM' na matoleo ya hatua moja ya kuyeyushwa yalipunguza kadhaa ya hatua hadi pasi moja.

Kusimamia Ukadiriaji wa Kina cha Usambazaji wa Marigold

Marigold anatumia tena muundo wa uenezaji wa taswira uliofunzwa awali (Usambazaji Imara) ili kutabiri ramani zenye kina. Inaonyesha kuwa unaweza kubadilisha maarifa tele ya kuona ya jenereta kuwa zana sahihi ya utambuzi yenye data ya mafunzo kidogo. Ukadiriaji wa Kina cha Usambaaji wa Marigold ni wa mtiririko wa kuona wa kompyuta ambao hufasiri au kutoa midia ya kuona kwa uchanganuzi, utendakazi na ubunifu. Ili kujenga uelewa wa kina, chukulia Ukadiriaji wa Kina cha Marigold kama kielelezo cha uendeshaji, si kipengele kimoja: kufafanua matokeo yanayotarajiwa, kufafanua mawazo, na kutenganisha kile ambacho mfumo unaweza kufanya kwa uhakika na kile ambacho bado kinahitaji uamuzi wa kitaalamu.

Katika mazoezi, timu dhabiti zinazotumia Usawa wa Usawa wa Ukadiriaji wa Kina wa Marigold na hali halisi ya kiutendaji kama vile ubora wa data, tofauti ya mwanga na uthabiti wa lebo. Huandika vigezo dhahiri vya kufaulu, kujaribu dhidi ya data halisi na mtiririko wa kazi, na kurudia kulingana na mifumo ya kushindwa iliyoonekana badala ya ushindi wa mara moja wa benchmark. Hapa ndipo uelewa wa kinadharia unapogeuka kuwa uwezo wa kudumu katika bidhaa, sera na uendeshaji.

Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango. Wakati huo huo, haki za picha na idhini zinaweza kuwa hatari za kisheria ikiwa asili haiko wazi. Mbinu thabiti zaidi ni kuchanganya kasi ya majaribio na nidhamu ya utawala: kuendesha majaribio, kunasa ushahidi, kuchapisha kumbukumbu za maamuzi, na kuendelea kusasisha ulinzi huku tabia ya kielelezo, matarajio ya watumiaji na mahitaji ya udhibiti yanapobadilika.

Athari za kimkakati

Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango.

Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Timu bunifu zinaweza kuiga dhana kwa haraka zaidi na masahihisho machache ya mikono.

Timu bunifu zinaweza kuiga dhana kwa haraka zaidi na masahihisho machache ya mikono. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Uendeshaji unaweza kutumia ishara za picha na video ambazo hapo awali zilikuwa ngumu kuchakata.

Uendeshaji unaweza kutumia ishara za picha na video ambazo hapo awali zilikuwa ngumu kuchakata. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.

Mustakabali wa Ukadiriaji wa Kina cha Mtawanyiko wa Marigold

Kichocheo cha Marigold, urekebishaji mzuri wa vipengee vya awali vya uenezaji kwa utabiri mnene, unajumuisha zaidi ya kina hadi kanuni za uso, mtengano wa picha halisi, na ukadiriaji wa nyenzo. Vibadala vya kasi zaidi na vya muundo wa uthabiti vinafunga mwango wa kasi kwa mitandao ya usambazaji-mbele, na kufanya mtizamo unaotegemea uenezaji uweze kutumika katika zana wasilianifu. Tarajia mwelekeo mpana zaidi ambapo uti wa mgongo mmoja uliozoeshwa mapema unatumika kwa kazi nyingi za jiometri na utambuzi, na hivyo kupunguza hitaji la seti kubwa za data zilizo na lebo maalum ya kazi.

Utekelezaji wa Ulimwengu Halisi

Kuchimbua kina cha kusawazisha kutoka kwa picha za usanifu na za bidhaa kwa ajili ya kuwasha tena na picha za 3D.

Inazalisha ramani zenye maelezo ya juu zinazotumika kama hali ya kutengeneza picha na video zinazoweza kudhibitiwa.

Filamu ya usaidizi na timu za VFX katika matte na parallax hufanya kazi ambapo usahihi wa makali ni muhimu.

Inatumika kama msingi wa utafiti unaoonyesha jinsi ya kurekebisha vitangulizi vya uzalishaji kwa kazi mnene za utabiri.

Miundo ya Utekelezaji

Ukadiriaji wa Kina cha Usambazaji wa Marigold katika mazoezi

Kuchimbua kina cha kusawazisha kutoka kwa picha za usanifu na za bidhaa kwa ajili ya kuwasha tena na picha za 3D.

Kuchopoa kina cha kina kutoka kwa picha za usanifu na za bidhaa kwa ajili ya kuangazia upya na picha za 3D kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora wa juu, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za hitilafu kwa wakati.

Ukadiriaji wa Kina cha Usambazaji wa Marigold katika mazoezi

Inazalisha ramani zenye maelezo ya juu zinazotumika kama hali ya kutengeneza picha na video zinazoweza kudhibitiwa.

Kutengeneza ramani zenye maelezo ya juu zinazotumika kama hali ya kutengeneza picha na video zinazoweza kudhibitiwa kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya juu vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za hitilafu kwa wakati.

Ukadiriaji wa Kina cha Usambazaji wa Marigold katika mazoezi

Filamu ya usaidizi na timu za VFX katika matte na parallax hufanya kazi ambapo usahihi wa makali ni muhimu.

Filamu ya usaidizi na timu za VFX katika kazi ya matte na parallax ambapo mambo ya usahihi wa hali ya juu Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Ukadiriaji wa Kina cha Usambazaji wa Marigold katika mazoezi

Inatumika kama msingi wa utafiti unaoonyesha jinsi ya kurekebisha vitangulizi vya uzalishaji kwa kazi mnene za utabiri.

Hufanya kazi kama msingi wa utafiti unaoonyesha jinsi ya kurekebisha mambo muhimu ya awali kwa majukumu mazito ya kutabiri Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.

Hatari & Walinzi

!

Haki za picha na idhini zinaweza kuwa hatari za kisheria ikiwa asili haiko wazi.

!

Utendaji wa muundo unaweza kutofautiana katika mwangaza, idadi ya watu na mazingira.

!

Chanya za uwongo zinaweza kutotambuliwa isipokuwa viwango vya uaminifu vifuatiliwe.

Ramani ya Utekelezaji

1

Bainisha vigezo vya kukubalika vya usahihi, kumbukumbu na gharama za makosa.

Bainisha vigezo vya kukubalika vya usahihi, kumbukumbu na gharama za makosa. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

2

Jaribu kwa kutumia data inayolingana na hali halisi ya uzalishaji.

Jaribu kwa kutumia data inayolingana na hali halisi ya uzalishaji. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

3

Ongeza ukaguzi wa kibinadamu kwa utabiri wa chini au utabiri wa athari kubwa.

Ongeza ukaguzi wa kibinadamu kwa utabiri wa chini au utabiri wa athari kubwa. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

4

Fuatilia mtindo wa kuteleza na uthibitishe upya baada ya mabadiliko ya kamera au mkusanyiko wa data.

Fuatilia mtindo wa kuteleza na uthibitishe upya baada ya mabadiliko ya kamera au mkusanyiko wa data. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.

Endelea Kuchunguza