Преглед
Mixup и CutMix са методи за увеличаване на данни, които създават нови примери за обучение чрез смесване на две изображения и техните етикети. Mixup линейно интерполира цели изображения и етикети, докато CutMix поставя правоъгълна кръпка от едно изображение върху друго и смесва етикети по област на кръпка — както намалява прекомерното приспособяване, така и подобрява здравината.
Mixup и CutMix Augmentation е технически градивен елемент, който влияе върху качеството на модела, цената на инфраструктурата, латентността и надеждността в мащаб.
Дълбоко гмуркане
Mixup (Zhang et al., 2017) формира нова извадка като x̃ = λ·x_a + (1−λ)·x_b с етикета ỹ, смесен от същия λ, където λ е извлечен от бета разпределение. Това насърчава модела да се държи линейно между примерите, изглаждайки границите на решенията и подобрявайки калибрирането. Вместо това CutMix (Yun et al., 2019) изрязва правоъгълен регион от изображение B и го поставя върху изображение A; теглото на етикета се задава от съотношението на пикселите, които всяко изображение допринася. Тъй като CutMix поддържа локално кохерентни региони на изображението (вместо призрачни смеси), той запазва полезна пространствена структура, като същевременно принуждава модела да обръща внимание на множество обекти и части. И двете техники действат като силни регулатори, повишават точността на сравнителните показатели в мащаба на ImageNet и по-специално подобряват устойчивостта към корупция и противопоставяне.
Техническа информация
И двата метода променят целта за загуба, а не само входа. Етикетът се превръща в мека, смесена цел, така че загубата на кръстосана ентропия е λ-претеглена комбинация от два класа - ефективно форма на изглаждане на етикета, свързана със съотношението на смесване на пикселите. В CutMix λ се равнява на частта от непроменени пиксели, изчислена от площта на полето за изрязване, разделена на общата площ на изображението, което поддържа пропорцията на етикета в съответствие с това колко от всяко изображение е видимо.
Овладяване на Mixup и CutMix Augmentation
Mixup и CutMix са методи за увеличаване на данни, които създават нови примери за обучение чрез смесване на две изображения и техните етикети. Mixup линейно интерполира цели изображения и етикети, докато CutMix поставя правоъгълна кръпка от едно изображение върху друго и смесва етикети по област на кръпка — както намалява прекомерното приспособяване, така и подобрява здравината. Mixup и CutMix Augmentation е технически градивен елемент, който влияе върху качеството на модела, цената на инфраструктурата, латентността и надеждността в мащаб. За да изградите дълбоко разбиране, третирайте Mixup и CutMix Augmentation като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.
На практика силни екипи, използващи Mixup и CutMix Augmentation, оптимизират избора на архитектура, данни и инфраструктура срещу надеждност и цена. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години. В същото време оптимизирането на един бенчмарк може да скрие по-широки системни слабости. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.
Стратегическо въздействие
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години.
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Техническото образование помага на екипите да изберат правилния стек, а не само най-новия.
Техническото образование помага на екипите да изберат правилния стек, а не само най-новия. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
По-добрият инженерен избор намалява инцидентите, свързани с надеждността в производството.
По-добрият инженерен избор намалява инцидентите, свързани с надеждността в производството. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Внедряване в реалния свят
Обучение на класификатори на ImageNet с CutMix за повишаване на точността от първо място и подобряване на локализацията на обекти.
Прилагане на Mixup за подобряване на калибрирането на модела, така че прогнозираните уверености да съответстват по-добре на истинската точност.
Силно регулиращи зрителни трансформатори (напр. DeiT) с комбинирани Mixup и CutMix за обучение върху ограничени данни.
Повишаване на устойчивостта към повреда на изображението и входове извън разпространението в критични за безопасността визуални системи.
Модели на изпълнение
Mixup и CutMix Augmentation на практика
Обучение на класификатори на ImageNet с CutMix за повишаване на точността от първо място и подобряване на локализацията на обекти.
Обучение на класификатори на ImageNet с CutMix за повишаване на точността на топ 1 и подобряване на локализацията на обекти Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Mixup и CutMix Augmentation на практика
Прилагане на Mixup за подобряване на калибрирането на модела, така че прогнозираните уверености да съответстват по-добре на истинската точност.
Прилагане на Mixup за подобряване на калибрирането на модела, така че прогнозираните уверености да съвпадат по-добре с истинската точност Екипите обикновено получават по-добри резултати, когато дефинират предварително прагове за качество, поддържат човешки път на ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Mixup и CutMix Augmentation на практика
Силно регулиращи зрителни трансформатори (напр. DeiT) с комбинирани Mixup и CutMix за обучение върху ограничени данни.
Силно регулиране на зрителните трансформатори (напр. DeiT) с комбинирани Mixup и CutMix за обучение върху ограничени данни Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Mixup и CutMix Augmentation на практика
Повишаване на устойчивостта към повреда на изображението и входове извън разпространението в критични за безопасността визуални системи.
Повишаване на устойчивостта към повреда на изображението и входове извън разпространението в критични за безопасността визуални системи Екипите обикновено получават по-добри резултати, когато дефинират предварително прагове за качество, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Рискове и предпазни огради
Оптимизирането на един бенчмарк може да скрие по-широки системни слабости.
Разходите за инфраструктура и поддръжка често се подценяват.
Пропуските в сигурността и видимостта могат да нарастват, когато системите стават по-сложни.
Пътна карта за изпълнение
Определете целите за латентност, качество и разходи преди внедряването.
Определете целите за латентност, качество и разходи преди внедряването. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Бенчмарк при реалистични условия на натоварване и данни.
Бенчмарк при реалистични условия на натоварване и данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Мониторинг на инструмента за грешки, отклонение и въздействие върху потребителя.
Мониторинг на инструмента за грешки, отклонение и въздействие върху потребителя. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Подгответе пътеките за връщане назад и реакция на инцидент преди мащабиране.
Подгответе пътеките за връщане назад и реакция на инцидент преди мащабиране. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.