ቪዥዋል AI መመሪያ

DragGAN መስተጋብራዊ አርትዖት

DragGAN በቀጥታ ነጥቦችን በመጎተት ምስልን እንዲያርትዑ ይፈቅድልዎታል፡ አንድ ቦታ ይያዙ እና ወደ ኢላማ ይጎትቱት፣ እና ስዕሉ በእውነታው ይለውጣል፣ አቀማመጥ፣ ቅርፅ ወይም አገላለጽ ይቀይራል።

አጠቃላይ እይታ

DragGAN በቀጥታ ነጥቦችን በመጎተት ምስልን እንዲያርትዑ ይፈቅድልዎታል፡ አንድ ቦታ ይያዙ እና ወደ ኢላማ ይጎትቱት፣ እና ስዕሉ በእውነታው ይለውጣል፣ አቀማመጥ፣ ቅርፅ ወይም አገላለጽ ይቀይራል። ያለ ተንሸራታቾች፣ ጭምብሎች ወይም የጽሑፍ መጠየቂያዎች ትክክለኛ፣ ሊታወቅ የሚችል የምስል ማጭበርበር ስለሚቻል አስፈላጊ ነው።

DragGAN መስተጋብራዊ አርትዖት ለመተንተን፣ ለአሰራር እና ለፈጠራ ምስላዊ ሚዲያን የሚተረጉሙ ወይም የሚያመነጩ የኮምፒውተር-እይታ የስራ ፍሰቶች ናቸው።

ጥልቅ ዳይቭ

ድራግጋን፣ ከፓን፣ ቴዋሪ፣ ሊምኩህለር እና ባልደረቦች በማክስ ፕላንክ እና አጋሮች (SIGGRAPH 2023)፣ በ GAN የመነጩ ምስሎችን በነጥብ ላይ የተመሰረተ መስተጋብራዊ አርትዖትን አስተዋውቀዋል። ተጠቃሚው አንድ ወይም ከዚያ በላይ 'የእጅ መያዣ' ነጥቦችን በምስል እና ተዛማጅ 'ዒላማ' ነጥቦችን መንቀሳቀስ አለባቸው። ድራግጋን በመቀጠል ድብቅ ኮድን ደጋግሞ ገፋ ያደርገዋል ስለዚህም በእያንዳንዱ እጀታ ስር ያለው ይዘት ወደ ዒላማው ሲንሸራተት የተቀረው ምስል ወጥነት ያለው ሆኖ ይቆያል። የእንስሳትን እግር ማራዘም፣ ሰውን ፈገግ ማድረግ፣ መኪና ማሽከርከር ወይም የመሬት አቀማመጥን በመጎተት መለወጥ ትችላለህ። በወሳኝ መልኩ፣ አርትዖቶች የተማረውን የምስል ልዩ ልዩ ያከብራሉ፣ ስለዚህ ውጤቶቹ ፒክስሎችን ከመቀባት ይልቅ እውነተኛ እንደሆኑ ይቆያሉ። የአማራጭ ጭንብል የትኛዎቹ ክልሎች እንዲንቀሳቀሱ እንደሚፈቀድ ይገድባል፣ ይህም ጥሩ የአካባቢ ቁጥጥር ያደርጋል።

ቴክኒካዊ ግንዛቤ

DragGAN ቀድሞ በሰለጠነ የ GAN ድብቅ እና ባህሪ ቦታ ላይ ይሰራል። ሁለት ተለዋጭ ደረጃዎችን ይጠቀማል፡ የእንቅስቃሴ ቁጥጥር፣ ስውር ኮድን ስለሚቀይር በእያንዳንዱ እጀታ አጠገብ ያሉ ባህሪያት ወደ ዒላማው አቅጣጫ እንዲሄዱ እና የነጥብ መከታተያ፣ ይህም መያዣውን ወደ ሌላ ቦታ የሚያዛውረው በባህሪ ካርታዎች ውስጥ የቅርብ ጎረቤት ፍለጋን በመጠቀም ነው። እነዚህን እርምጃዎች መድገም ምስሉን በ GAN ማኒፎልድ በኩል ይራመዳል፣ ይህም ለስላሳ እና ተጨባጭ ለውጦችን ይፈጥራል።

DragGAN መስተጋብራዊ አርትዖት ማስተር

DragGAN በቀጥታ ነጥቦችን በመጎተት ምስልን እንዲያርትዑ ይፈቅድልዎታል፡ አንድ ቦታ ይያዙ እና ወደ ኢላማ ይጎትቱት፣ እና ስዕሉ በእውነታው ይለውጣል፣ አቀማመጥ፣ ቅርፅ ወይም አገላለጽ ይቀይራል። ያለ ተንሸራታቾች፣ ጭምብሎች ወይም የጽሑፍ መጠየቂያዎች ትክክለኛ፣ ሊታወቅ የሚችል የምስል ማጭበርበር ስለሚቻል አስፈላጊ ነው። DragGAN መስተጋብራዊ አርትዖት ለመተንተን፣ ለአሰራር እና ለፈጠራ ምስላዊ ሚዲያን የሚተረጉሙ ወይም የሚያመነጩ የኮምፒውተር-እይታ የስራ ፍሰቶች ናቸው። ጥልቅ ግንዛቤን ለመገንባት፣ DragGAN Interactive Editingን እንደ የክወና ሞዴል፣ አንድ ባህሪ ሳይሆን፡ የሚፈለጉትን ውጤቶች ይግለጹ፣ ግምቶችን ያብራሩ እና ስርዓቱ አሁንም የባለሙያዎችን ፍርድ ከሚያስፈልገው ነገር ለይ።

በተግባር፣ DragGAN በይነተገናኝ የአርትዖት ሚዛን ትክክለኛነትን የሚጠቀሙ እንደ የውሂብ ጥራት፣ የመብራት ልዩነት እና የመለያ ወጥነት ካሉ ተግባራዊ እውነታዎች ጋር የሚጠቀሙ ጠንካራ ቡድኖች። ግልጽ የስኬት መስፈርቶችን ይመዘግባሉ፣ በተጨባጭ መረጃ እና የስራ ፍሰቶች ላይ ይፈትሻሉ፣ እና የአንድ ጊዜ ቤንችማርክ ከማሸነፍ ይልቅ በተስተዋሉ የውድቀት ቅጦች ላይ ተመስርተው ይደግማሉ። ይህ የንድፈ ሃሳባዊ ግንዛቤ በምርት፣ ፖሊሲ እና ኦፕሬሽኖች ላይ ወደ ዘላቂ አቅም የሚቀየርበት ነው።

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል። በተመሳሳይ ጊዜ፣ የምስል መብቶች እና ፍቃድ ማረጋገጫው ግልጽ ካልሆነ ህጋዊ አደጋዎች ሊሆኑ ይችላሉ። በጣም ጠንካራው አካሄድ የሙከራ ፍጥነትን ከአስተዳደር ዲሲፕሊን ጋር ማጣመር ነው፡ አብራሪዎችን ማስኬድ፣ ማስረጃን መያዝ፣ የውሳኔ ምዝግብ ማስታወሻዎችን ማተም እና የሞዴል ባህሪ፣ የተጠቃሚ የሚጠበቁ እና የቁጥጥር መስፈርቶች ሲዳብሩ ጥበቃዎችን ያለማቋረጥ ማዘመን ነው።

ስልታዊ ተጽእኖ

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል።

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የፈጠራ ቡድኖች በጥቂት የእጅ ክለሳዎች ጽንሰ-ሀሳቦችን በፍጥነት መተየብ ይችላሉ።

የፈጠራ ቡድኖች በጥቂት የእጅ ክለሳዎች ጽንሰ-ሀሳቦችን በፍጥነት መተየብ ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

ክዋኔዎች ከዚህ ቀደም ለማስኬድ አስቸጋሪ የነበሩትን የምስል እና የቪዲዮ ምልክቶችን መጠቀም ይችላሉ።

ክዋኔዎች ከዚህ ቀደም ለማስኬድ አስቸጋሪ የነበሩትን የምስል እና የቪዲዮ ምልክቶችን መጠቀም ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የ DragGAN በይነተገናኝ አርትዖት የወደፊት

ድራግጋን ፈጣን የክትትል ስራን አስነስቷል ጎትት-ተኮር ቁጥጥር ወደ ስርጭት ሞዴሎች (እንደ DragDiffusion እና FreeDrag ያሉ) እውነተኛ ፎቶዎችን እና የዘፈቀደ ይዘቶችን ከGANs የበለጠ በብቸኝነት የሚያስተናግዱ። ድራግ አርትዖት በፈጠራ ሶፍትዌሮች ውስጥ መደበኛ መሳሪያ እንዲሆን ከጽሑፍ እና ከክልል መቆጣጠሪያዎች ጋር ተዳምሮ እና ወደ ቪዲዮ እና 3D የተዘረጋ ተጠቃሚዎች ነገሮችን በፍሬም ላይ እንዲያነሱ ወይም በይነተገናኝ ምስሉን እንዲቀርጹ ይጠብቁ፣ ሁሉም ፎቶሪያሊዝምን በመጠበቅ ላይ።

የእውነተኛ-ዓለም አተገባበር

የፊት ነጥቦችን በመጎተት የቁም አቀማመጥ፣ የአመለካከት አቅጣጫ ወይም የፀጉር አሠራር ማስተካከል

የእንስሳትን ወይም የተሸከርካሪውን አቀማመጥ እና አቅጣጫ መቀየር፣ እንደ መኪና ማሽከርከር ወይም የአንበሳ ጭንቅላትን ማስተካከል

ለንድፍ መሳለቂያዎች የምርት ፎቶዎችን (እቃዎችን ማራዘም፣ ማስፋት ወይም ማስተካከል) እንደገና መቅረጽ

እንደ የተራራ ቅርጾችን ወይም ተስማሚ ልብሶችን የመሳሰሉ ቅርጾችን በመጎተት ጥሩ መልክዓ ምድራዊ ወይም የፋሽን ምስሎችን ማስተካከል

የትግበራ ቅጦች

DragGAN መስተጋብራዊ አርትዖት በተግባር

የፊት ነጥቦችን በመጎተት የቁም አቀማመጥ፣ የአመለካከት አቅጣጫ ወይም የፀጉር አሠራር ማስተካከል።

የፊት ገጽታዎችን በመጎተት የቁም አቀማመጥን ፣ የእይታ አቅጣጫን ወይም የፀጉር አሠራሩን ማስተካከል ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ከፊት ሲወስኑ የተሻለ ውጤት ያገኛሉ ፣ ለጫፍ ጉዳዮች የሰውን እድገት መንገድ ሲይዙ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

DragGAN መስተጋብራዊ አርትዖት በተግባር

የእንስሳትን ወይም የተሸከርካሪውን አቀማመጥ እና አቅጣጫ መቀየር፣ እንደ መኪና ማሽከርከር ወይም የአንበሳ ጭንቅላትን ማስተካከል።

የእንስሳትን ወይም የተሸከርካሪውን አቀማመጥ እና አቅጣጫ መቀየር፣ እንደ መኪና ማሽከርከር ወይም የአንበሳ ጭንቅላትን ማስተካከል ቡድኖቹ ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ይጠብቁ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

DragGAN መስተጋብራዊ አርትዖት በተግባር

ለንድፍ መሳለቂያዎች የምርት ፎቶዎችን (እቃዎችን ማራዘም፣ ማስፋት ወይም ማስተካከል) እንደገና መቅረጽ።

ለንድፍ መሳለቂያዎች የምርት ፎቶዎችን (ማራዘሚያ፣ ማስፋት ወይም መልሶ ማቋቋም) እንደገና መቅረጽ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለጫፍ ጉዳዮች የሰው ልጅ መሻሻል መንገድን ሲይዙ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

DragGAN መስተጋብራዊ አርትዖት በተግባር

እንደ የተራራ ቅርጾችን ወይም ተስማሚ ልብሶችን የመሳሰሉ ቅርጾችን በመጎተት ጥሩ መልክዓ ምድራዊ ወይም የፋሽን ምስሎችን ማስተካከል.

ቅርጻ ቅርጾችን በመጎተት ጥሩ መልክዓ ምድራዊ አቀማመጥ ወይም ፋሽን ምስሎችን ለምሳሌ የተራራ ቅርጾችን ወይም የልብስ ተስማሚነትን መለወጥ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ከፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ, ለዳር ጉዳዮች የሰው ልጅ መሻሻል መንገድን ይጠብቃሉ, እና ሁለቱንም የምርታማነት ትርፍ እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ.

አደጋዎች እና የጥበቃ መንገዶች

!

የምስል መብቶች እና ፈቃድ ግልጽ ካልሆነ ህጋዊ አደጋዎች ሊሆኑ ይችላሉ።

!

የሞዴል አፈጻጸም በብርሃን፣ በስነ-ሕዝብ እና በአካባቢው ሊለያይ ይችላል።

!

የመተማመን ገደቦች ካልተቆጣጠሩ የውሸት አወንታዊ ነገሮች ላይታዩ ይችላሉ።

የትግበራ ፍኖተ ካርታ

1

ለትክክለኛነት፣ ለማስታወስ እና ለስህተት ወጪዎች የመቀበያ መስፈርቶችን ይግለጹ።

ለትክክለኛነት፣ ለማስታወስ እና ለስህተት ወጪዎች የመቀበያ መስፈርቶችን ይግለጹ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

2

ከእውነተኛ የምርት ሁኔታዎች ጋር በሚዛመድ ውሂብ ይሞክሩ።

ከእውነተኛ የምርት ሁኔታዎች ጋር በሚዛመድ ውሂብ ይሞክሩ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

3

ለዝቅተኛ እምነት ወይም ከፍተኛ ተጽዕኖ ትንበያ የሰው ግምገማን ያክሉ።

ለዝቅተኛ እምነት ወይም ከፍተኛ ተጽዕኖ ትንበያ የሰው ግምገማን ያክሉ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

4

ከካሜራ ወይም የውሂብ ስብስብ ለውጦች በኋላ የሞዴሉን ተንሸራታች ይከታተሉ እና እንደገና ያረጋግጡ።

ከካሜራ ወይም የውሂብ ስብስብ ለውጦች በኋላ የሞዴሉን ተንሸራታች ይከታተሉ እና እንደገና ያረጋግጡ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

ማሰስዎን ይቀጥሉ