ቪዥዋል AI መመሪያ

ጭምብል ያደረጉ አውቶኢንኮደሮች

Masked Autoencoders (MAE) አብዛኛው ሥዕል ከተደበቀ በኋላ ምስሎችን እንደገና ለመገንባት የእይታ ሞዴልን የሚያስተምር በራስ ቁጥጥር የሚደረግበት ዘዴ ነው።

አጠቃላይ እይታ

Masked Autoencoders (MAE) አብዛኛው ሥዕል ከተደበቀ በኋላ ምስሎችን እንደገና ለመገንባት የእይታ ሞዴልን የሚያስተምር በራስ ቁጥጥር የሚደረግበት ዘዴ ነው። ባዶውን መሙላት በመማር ሞዴሉ ያለ ምንም የሰው መለያዎች የበለፀገ የእይታ ግንዛቤን ይገነባል።

Masked Autoencoders ለመተንተን፣ ኦፕሬሽኖች እና ፈጠራ ምስላዊ ሚዲያን የሚተረጉሙ ወይም የሚያመነጩ የኮምፒውተር-እይታ የስራ ፍሰቶች ናቸው።

ጥልቅ ዳይቭ

Masked Autoencoders፣ በ Kaiming He እና ባልደረቦቹ በMeta AI በ2021 አስተዋውቀዋል፣ ምስል ያንሱ፣ ወደ ትናንሽ ፕላስተሮች ከፋፍለው እና በጣም ትልቅ የሆነውን ክፍልፋይ በዘፈቀደ ይደብቁ፣ ብዙ ጊዜ 75%። ቪዥን ትራንስፎርመር ኢንኮደር የታዩትን ጥገናዎች ብቻ ይሰራል፣ ቀላል ክብደት ያለው ዲኮደር የጎደሉትን የመጀመሪያ ፒክሰሎች መልሶ ለመገንባት ይሞክራል። ብዙ የተደበቀ ስለሆነ ሞዴሉ በቀላሉ በአቅራቢያ ያሉ ፒክሰሎችን መቅዳት አይችልም እና እንደ ቅርጾች እና የቁስ አካላት ያሉ ትርጉም ያለው መዋቅር መማር አለበት። ኢንኮደር ጭምብል የተሸፈኑ ፕላቶችን መዝለል ስልጠና ፈጣን እና ውጤታማ ያደርገዋል። ከቅድመ ስልጠና በኋላ ዲኮደሩ ይጣላል እና ኢንኮደሩ በጥብቅ ወደ ምደባ፣ ፍለጋ እና ክፍፍል ተግባራት ያስተላልፋል።

ቴክኒካዊ ግንዛቤ

ቁልፉ ብልሃቱ asymmetry ነው፡ ከባድ ኢንኮደር የሚያየው ጭምብል ያልተደረገውን 25% ጥገና ብቻ ሲሆን ትንሽ ዲኮደር ቀሪውን እንደገና ይገነባል። ንጣፎች ጠፍጣፋ፣ በመስመራዊ የተከተቱ እና የአቀማመጥ ኢንኮዲንግ የተሰጡ ናቸው። የመልሶ ግንባታው መጥፋት ማለት አራት ማዕዘን ቅርጽ ያለው ስህተት በተሸፈኑ ፕላቶች ላይ ብቻ ይሰላል፣ በተለይም በተለመደው የፒክሰል ዋጋዎች። ከፍተኛ የመሸፈኛ ሬሾዎች ከዝቅተኛ ደረጃ መስተጋብር ይልቅ የትርጓሜ ትምህርትን ያስገድዳሉ፣ እና ጭምብል የተደረገባቸው ምልክቶችን በመቀየሪያው ውስጥ መዝለል ሙሉውን ምስል ከማቀናበር ጋር በሚያስደንቅ ሁኔታ ይሰላል።

ጭምብል ያደረጉ አውቶኢንኮደሮችን ማስተማር

Masked Autoencoders (MAE) አብዛኛው ሥዕል ከተደበቀ በኋላ ምስሎችን እንደገና ለመገንባት የእይታ ሞዴልን የሚያስተምር በራስ ቁጥጥር የሚደረግበት ዘዴ ነው። ባዶውን መሙላት በመማር ሞዴሉ ያለ ምንም የሰው መለያዎች የበለፀገ የእይታ ግንዛቤን ይገነባል። Masked Autoencoders ለመተንተን፣ ኦፕሬሽኖች እና ፈጠራ ምስላዊ ሚዲያን የሚተረጉሙ ወይም የሚያመነጩ የኮምፒውተር-እይታ የስራ ፍሰቶች ናቸው። ጥልቅ ግንዛቤን ለመገንባት፣ Masked Autoencodersን እንደ ኦፕሬሽን ሞዴል እንጂ አንድ ባህሪ አይደለም፡ የሚፈለጉትን ውጤቶች ይግለጹ፣ ግምቶችን ያብራሩ እና ስርዓቱ አሁንም የባለሙያዎችን ፍርድ ከሚያስፈልገው ነገር ይለዩ።

በተግባር፣ Masked Autoencoders የሚጠቀሙ ጠንካራ ቡድኖች እንደ የውሂብ ጥራት፣ የመብራት ልዩነት እና የመለያ ወጥነት ካሉ ተግባራዊ እውነታዎች ጋር ትክክለኛነትን ያመጣሉ። ግልጽ የስኬት መስፈርቶችን ይመዘግባሉ፣ በተጨባጭ መረጃ እና የስራ ፍሰቶች ላይ ይፈትሻሉ፣ እና የአንድ ጊዜ ቤንችማርክ ከማሸነፍ ይልቅ በተስተዋሉ የውድቀት ቅጦች ላይ ተመስርተው ይደግማሉ። ይህ የንድፈ ሃሳባዊ ግንዛቤ በምርት፣ ፖሊሲ እና ኦፕሬሽኖች ላይ ወደ ዘላቂ አቅም የሚቀየርበት ነው።

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል። በተመሳሳይ ጊዜ፣ የምስል መብቶች እና ፍቃድ ማረጋገጫው ግልጽ ካልሆነ ህጋዊ አደጋዎች ሊሆኑ ይችላሉ። በጣም ጠንካራው አካሄድ የሙከራ ፍጥነትን ከአስተዳደር ዲሲፕሊን ጋር ማጣመር ነው፡ አብራሪዎችን ማስኬድ፣ ማስረጃን መያዝ፣ የውሳኔ ምዝግብ ማስታወሻዎችን ማተም እና የሞዴል ባህሪ፣ የተጠቃሚ የሚጠበቁ እና የቁጥጥር መስፈርቶች ሲዳብሩ ጥበቃዎችን ያለማቋረጥ ማዘመን ነው።

ስልታዊ ተጽእኖ

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል።

ቪዥዋል AI የመመርመሪያ፣ የማወቅ እና የመለያ ስራዎችን በሚዛን መጠን በራስ ሰር ሊያደርግ ይችላል። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የፈጠራ ቡድኖች በጥቂት የእጅ ክለሳዎች ጽንሰ-ሀሳቦችን በፍጥነት መተየብ ይችላሉ።

የፈጠራ ቡድኖች በጥቂት የእጅ ክለሳዎች ጽንሰ-ሀሳቦችን በፍጥነት መተየብ ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

ክዋኔዎች ከዚህ ቀደም ለማስኬድ አስቸጋሪ የነበሩትን የምስል እና የቪዲዮ ምልክቶችን መጠቀም ይችላሉ።

ክዋኔዎች ከዚህ ቀደም ለማስኬድ አስቸጋሪ የነበሩትን የምስል እና የቪዲዮ ምልክቶችን መጠቀም ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የፊት ጭንብል አውቶኢንኮደሮች

የMAE-style ጭንብል መልሶ መገንባት በሁሉም የሥልጠና ዘዴዎች ውስጥ ነባሪ የቅድመ ሥልጠና አዘገጃጀት እየሆነ ነው። ተመራማሪዎች በቪዲዮ (የመደበቅ የስፔስታይም ኪዩብ)፣ የኦዲዮ ስፔክትሮግራሞች፣ የህክምና ስካን እና የሳተላይት ምስሎች፣ መለያዎች እምብዛም እና ውድ ወደሆኑበት እያራዘሙት ነው። ለመልቲሞዳል ፋውንዴሽን ሞዴሎች፣ የበለጠ ቀልጣፋ ዲኮደሮች እና መረጃ ሰጭ ክልሎችን የሚያነጣጥር ጭንብል ከቋንቋ ጋር ጥብቅ ውህደትን ይጠብቁ። ኮምፒዩት እያደገ ሲሄድ፣ በትልቅ መለያ ባልተደረገባቸው የምስል ስብስቦች ላይ ጭምብል ማድረጉ የታችኛ ተፋሰስ ትክክለኛነትን ማሻሻል እና ውድ በሆነ የሰው ልጅ ማብራሪያ ላይ ያለውን ጥገኛነት እየቀነሰ መቀጠል አለበት።

የእውነተኛ-ዓለም አተገባበር

በሚሊዮኖች በሚቆጠሩ ያልተሰየሙ ፎቶዎች ላይ የእይታ ትራንስፎርመርን ቀድመው ማሰልጠን፣ ከዚያም ለኢምጅኔት ፋይዳ በጠንካራ ትክክለኛነት ማስተካከል

የባለሙያ ማብራሪያ ውድ እና የተገደበ ከሆነ መለያ ከሌለው የሕክምና ስካን (ኤክስሬይ፣ ኤምአርአይ) የመማሪያ ባህሪያት

የድርጊት ማወቂያ ሞዴሎችን (VideoMAE) ለማሰልጠን የspacetime ጥገናዎችን በመደበቅ ዘዴውን ከቪዲዮ ጋር ማላመድ።

የመሬት አጠቃቀምን ካርታ ለመደገፍ በሳተላይት እና በአየር ምስሎች ላይ ቅድመ ስልጠና መስጠት እና በእጅ መለያዎች መለየትን መለወጥ

የትግበራ ቅጦች

ጭምብል አውቶኢንኮደሮች በተግባር

በሚሊዮኖች በሚቆጠሩ ያልተሰየሙ ፎቶዎች ላይ ራዕይ ትራንስፎርመርን ቀድመው ማሰልጠን፣ በመቀጠልም ለImageNet ምደባ በጠንካራ ትክክለኛነት ማስተካከል።

ቪዥን ትራንስፎርመርን በሚሊዮኖች በሚቆጠሩ ያልተሰየሙ ፎቶዎች ላይ አስቀድሞ ማሰልጠን፣ በመቀጠልም ለ ImageNet ምደባ በጠንካራ ትክክለኛነት ማስተካከል ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ከፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ይጠብቃሉ እና ሁለቱንም የምርታማነት ትርፍ እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

ጭምብል አውቶኢንኮደሮች በተግባር

የባለሙያ ማብራሪያ ውድ እና የተገደበ ከሆነ መለያ ከሌለው የሕክምና ስካን (ኤክስሬይ፣ ኤምአርአይ) የመማር ባህሪያት።

የባለሙያዎች ማብራሪያ ውድ ከሆነ እና ውሱን በሆነበት ካልተሰየመ የህክምና ስካን (ኤክስሬይ፣ ኤምአርአይ) የመማር ባህሪያት ብዙውን ጊዜ የተሻለ ውጤት የሚያገኙ ቡድኖች ከፊት ለፊት የጥራት ደረጃዎችን ሲገልጹ፣ ለዳር ጉዳዮች የሰው ልጅ መሻሻል መንገድን ሲይዙ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

ጭምብል አውቶኢንኮደሮች በተግባር

የድርጊት ማወቂያ ሞዴሎችን (VideoMAE) ለማሰልጠን የቦታ ጊዜ ጥገናዎችን በመደበቅ ዘዴውን ከቪዲዮ ጋር ማላመድ።

የድርጊት ማወቂያ ሞዴሎችን (VideoMAE) ለማሰልጠን ስልቱን ከቪዲዮ ጋር በማላመድ የቦታ ጊዜ መጠገኛዎችን ማላመድ (VideoMAE) ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ መሻሻል መንገድን ሲይዙ እና ሁለቱንም የምርታማነት ትርፍ እና የስህተት ወጪዎችን በጊዜ ሂደት መከታተል።

ጭምብል አውቶኢንኮደሮች በተግባር

የመሬት አጠቃቀምን ካርታ ለመደገፍ በሳተላይት እና በአየር ምስሎች ላይ ቅድመ ስልጠና እና በእጅ መለያዎች መለየትን መለወጥ።

የሳተላይት እና የአየር ላይ ምስሎችን አስቀድሞ ማሰልጠን የመሬት አጠቃቀምን ካርታ ለመደገፍ እና ማወቂያን ያለ በእጅ መለያዎች መለወጥ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ, ለጫፍ ጉዳዮች የሰው ልጅ እድገትን መንገድ ይዘዋል, እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ.

አደጋዎች እና የጥበቃ መንገዶች

!

የምስል መብቶች እና ፈቃድ ግልጽ ካልሆነ ህጋዊ አደጋዎች ሊሆኑ ይችላሉ።

!

የሞዴል አፈጻጸም በብርሃን፣ በስነ-ሕዝብ እና በአካባቢው ሊለያይ ይችላል።

!

የመተማመን ገደቦች ካልተቆጣጠሩ የውሸት አወንታዊ ነገሮች ላይታዩ ይችላሉ።

የትግበራ ፍኖተ ካርታ

1

ለትክክለኛነት፣ ለማስታወስ እና ለስህተት ወጪዎች የመቀበያ መስፈርቶችን ይግለጹ።

ለትክክለኛነት፣ ለማስታወስ እና ለስህተት ወጪዎች የመቀበያ መስፈርቶችን ይግለጹ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

2

ከእውነተኛ የምርት ሁኔታዎች ጋር በሚዛመድ ውሂብ ይሞክሩ።

ከእውነተኛ የምርት ሁኔታዎች ጋር በሚዛመድ ውሂብ ይሞክሩ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

3

ለዝቅተኛ እምነት ወይም ከፍተኛ ተጽዕኖ ትንበያ የሰው ግምገማን ያክሉ።

ለዝቅተኛ እምነት ወይም ከፍተኛ ተጽዕኖ ትንበያ የሰው ግምገማን ያክሉ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

4

ከካሜራ ወይም የውሂብ ስብስብ ለውጦች በኋላ የሞዴሉን ተንሸራታች ይከታተሉ እና እንደገና ያረጋግጡ።

ከካሜራ ወይም የውሂብ ስብስብ ለውጦች በኋላ የሞዴሉን ተንሸራታች ይከታተሉ እና እንደገና ያረጋግጡ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

ማሰስዎን ይቀጥሉ