Muhtasari
DragGAN hukuwezesha kuhariri picha kwa kuburuta pointi kihalisi: kamata doa na uiburute hadi kwa lengo, na picha inaharibika kihalisi, kubadilisha mkao, umbo au mwonekano. Ni muhimu kwa sababu hurahisisha uboreshaji wa picha na angavu bila vitelezi, vinyago, au vidokezo vya maandishi.
Uhariri wa Maingiliano wa DragGAN ni wa mtiririko wa maono ya kompyuta ambao hufasiri au kutoa midia ya kuona kwa uchanganuzi, utendakazi na ubunifu.
Dive ya kina
DragGAN, kutoka Pan, Tewari, Leimkuhler na wenzake katika Max Planck na washirika (SIGGRAPH 2023), alianzisha uhariri shirikishi unaozingatia pointi wa picha zinazozalishwa na GAN. Mtumiaji anaweka alama moja au zaidi ya 'kushughulikia' kwenye picha na sehemu 'lengwa' zinazolingana ambapo wanapaswa kuhamishwa. DragGAN kisha hugusa mara kwa mara msimbo uliofichika ili yaliyomo chini ya kila mpini yatelezeshe kwenye shabaha yake huku picha nyingine ikisalia kushikana. Unaweza kurefusha miguu ya mnyama, kumfanya mtu atabasamu, kuzungusha gari, au kubadilisha mtaro wa mandhari, yote hayo kwa kuburuta. Muhimu zaidi, mabadiliko yanaheshimu wingi wa picha zilizofunzwa, kwa hivyo matokeo hubaki kuwa ya kweli badala ya kupaka pikseli. Kinyago cha hiari huzuia maeneo ambayo yanaruhusiwa kuhama, na kutoa udhibiti mzuri wa ujanibishaji.
Ufahamu wa Kiufundi
DragGAN hufanya kazi katika nafasi iliyofichwa na ya kipengele ya GAN iliyofunzwa awali. Hutumia hatua mbili zinazopishana: usimamizi wa mwendo, ambao huhamisha msimbo fiche ili vipengele karibu na kila mpini kusogezwa kuelekea mwelekeo lengwa, na ufuatiliaji wa pointi, ambao huhamisha mpini ili kufuata kipengele ambacho kiliwekewa nanga kwa kutumia utafutaji wa jirani wa karibu zaidi katika ramani za vipengele. Kurudia hatua hizi hutembeza picha kando ya mfumo wa GAN, na kutoa kasoro laini na za kweli.
Kusimamia Uhariri wa Maingiliano wa DragGAN
DragGAN hukuwezesha kuhariri picha kwa kuburuta pointi kihalisi: kamata doa na uiburute hadi kwa lengo, na picha inaharibika kihalisi, kubadilisha mkao, umbo au mwonekano. Ni muhimu kwa sababu hurahisisha uboreshaji wa picha na angavu bila vitelezi, vinyago, au vidokezo vya maandishi. Uhariri wa Maingiliano wa DragGAN ni wa mtiririko wa maono ya kompyuta ambao hufasiri au kutoa midia ya kuona kwa uchanganuzi, utendakazi na ubunifu. Ili kujenga uelewaji wa kina, chukulia Uhariri wa Maingiliano wa DragGAN kama muundo wa uendeshaji, sio kipengele kimoja: fafanua matokeo unayotaka, fafanua mawazo, na utenganishe kile ambacho mfumo unaweza kufanya kwa uaminifu na kile ambacho bado kinahitaji uamuzi wa kitaalamu.
Katika mazoezi, timu dhabiti zinazotumia usahihi wa usawa wa Uhariri wa DragGAN na hali halisi ya kiutendaji kama vile ubora wa data, tofauti ya mwanga na uthabiti wa lebo. Huandika vigezo dhahiri vya kufaulu, kujaribu dhidi ya data halisi na mtiririko wa kazi, na kurudia kulingana na mifumo ya kushindwa iliyoonekana badala ya ushindi wa mara moja wa benchmark. Hapa ndipo uelewa wa kinadharia unapogeuka kuwa uwezo wa kudumu katika bidhaa, sera na uendeshaji.
Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango. Wakati huo huo, haki za picha na idhini zinaweza kuwa hatari za kisheria ikiwa asili haiko wazi. Mbinu thabiti zaidi ni kuchanganya kasi ya majaribio na nidhamu ya utawala: kuendesha majaribio, kunasa ushahidi, kuchapisha kumbukumbu za maamuzi, na kuendelea kusasisha ulinzi huku tabia ya kielelezo, matarajio ya watumiaji na mahitaji ya udhibiti yanapobadilika.
Athari za kimkakati
Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango.
Visual AI inaweza kufanya ukaguzi, ugunduzi na kazi za kuweka lebo kiotomatiki kwa kiwango. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.
Timu bunifu zinaweza kuiga dhana kwa haraka zaidi na masahihisho machache ya mikono.
Timu bunifu zinaweza kuiga dhana kwa haraka zaidi na masahihisho machache ya mikono. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.
Uendeshaji unaweza kutumia ishara za picha na video ambazo hapo awali zilikuwa ngumu kuchakata.
Uendeshaji unaweza kutumia ishara za picha na video ambazo hapo awali zilikuwa ngumu kuchakata. Katika utumaji wa ubora wa juu, hii inatafsiriwa katika sheria zinazoweza kupimika za uendeshaji, mipaka ya umiliki, na desturi za ukaguzi wa mara kwa mara ili timu ziweze kuongeza imani badala ya kuongeza utata.
Utekelezaji wa Ulimwengu Halisi
Kurekebisha mwonekano wa picha, mwelekeo wa kutazama, au mtindo wa nywele kwa kuburuta sehemu za uso
Kubadilisha mkao na mwelekeo wa mnyama au gari, kama vile kuzungusha gari au kuweka kichwa cha simba tena.
Kuunda upya picha za bidhaa (kurefusha, kupanua, au kuweka upya vitu) kwa nakala za muundo
Urekebishaji mzuri wa mandhari au picha za mitindo kwa kuburuta kontua, kama vile kubadilisha maumbo ya mlima au kitovu cha nguo.
Miundo ya Utekelezaji
DragGAN Interactive Editing katika mazoezi
Kurekebisha mwonekano wa picha, mwelekeo wa kutazama, au mtindo wa nywele kwa kuburuta sehemu za uso.
Kurekebisha mwonekano wa picha, mwelekeo wa kutazama, au mtindo wa nywele kwa kuburuta alama za uso Kwa kawaida Timu hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda juu ya hali ya juu ya binadamu, na kufuatilia faida za tija na gharama za makosa kwa wakati.
DragGAN Interactive Editing katika mazoezi
Kubadilisha mkao na mwelekeo wa mnyama au gari, kama vile kuzungusha gari au kuweka upya kichwa cha simba.
Kubadilisha mkao na mwelekeo wa mnyama au gari, kama vile kuzungusha gari au kuweka kichwa cha simba Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora wa juu, kuweka njia ya kupanda juu ya binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.
DragGAN Interactive Editing katika mazoezi
Kuunda upya picha za bidhaa (kurefusha, kupanua, au kuweka upya vitu) kwa nakala za muundo.
Kuunda upya picha za bidhaa (kurefusha, kupanua, au kuweka upya vitu) kwa nakala za muundo. Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua viwango vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.
DragGAN Interactive Editing katika mazoezi
Urekebishaji mzuri wa mandhari au picha za mitindo kwa kuburuta mtaro, kama vile kubadilisha maumbo ya mlima au kutoshea nguo.
Urekebishaji mzuri wa mandhari au picha za mitindo kwa kuburuta mtaro, kama vile kubadilisha umbo la milima au kutoshea mavazi Timu kwa kawaida hupata matokeo bora zaidi zinapofafanua vizingiti vya ubora mbele, kuweka njia ya kupanda kwa binadamu kwa matukio makali, na kufuatilia faida za tija na gharama za makosa kwa wakati.
Hatari & Walinzi
Haki za picha na idhini zinaweza kuwa hatari za kisheria ikiwa asili haiko wazi.
Utendaji wa muundo unaweza kutofautiana katika mwangaza, idadi ya watu na mazingira.
Chanya za uwongo zinaweza kutotambuliwa isipokuwa viwango vya uaminifu vifuatiliwe.
Ramani ya Utekelezaji
Bainisha vigezo vya kukubalika vya usahihi, kumbukumbu na gharama za makosa.
Bainisha vigezo vya kukubalika vya usahihi, kumbukumbu na gharama za makosa. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.
Jaribu kwa kutumia data inayolingana na hali halisi ya uzalishaji.
Jaribu kwa kutumia data inayolingana na hali halisi ya uzalishaji. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.
Ongeza ukaguzi wa kibinadamu kwa utabiri wa chini au utabiri wa athari kubwa.
Ongeza ukaguzi wa kibinadamu kwa utabiri wa chini au utabiri wa athari kubwa. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.
Fuatilia mtindo wa kuteleza na uthibitishe upya baada ya mabadiliko ya kamera au mkusanyiko wa data.
Fuatilia mtindo wa kuteleza na uthibitishe upya baada ya mabadiliko ya kamera au mkusanyiko wa data. Chukulia kila hatua kama lango la ushahidi: ikiwa vigezo havitatimizwa, sitisha uchapishaji, funga pengo, kisha upanue matumizi.