Преглед
Немаксималното потискане (NMS) е стъпката за почистване, която превръща разхвърляна купчина от припокриващи се кутии за откриване в една подредена кутия за обект. Без него детекторите биха отчели една и съща кола пет или десет пъти.
Немаксималното потискане принадлежи към работните потоци за компютърно зрение, които интерпретират или генерират визуална медия за анализ, операции и творчество.
Дълбоко гмуркане
Детекторите на обекти обикновено предсказват много квадратчета кандидати около всеки реален обект, всеки с оценка на доверието. NMS подрязва това излишък. Класическият алчен алгоритъм сортира всички кутии по резултат, запазва този с най-висок резултат, след което премахва всички останали кутии, чието припокриване с него (измерено чрез Intersection over Union, IoU) надвишава праг като 0,5. Повтаря това върху оцелелите кутии, докато не остане нито една. Резултатът е една представителна кутия на обект. NMS е проста, бърза и с леки параметри, но има слабости: фиксиран праг на IoU може погрешно да потисне истински близък обект в сцени с много хора и третира припокриването като двоично. Варианти като резултати от затихване на Soft-NMS вместо директно изтриване на кутии за справяне с това.
Техническа информация
Основната мярка е IoU: площта на пресичането на две кутии, разделена на площта на тяхното обединение. Алчният NMS е O(n^2) в най-лошия случай, но бърз на практика. Прагът на IoU заменя прецизността и извикването: нисък праг премахва повече кутии (рискувайки пропуснати близки обекти), докато високият праг запазва повече (рискувайки дубликати). NMS обикновено се прилага за клас, така че кутиите от различни категории да не се потискат взаимно.
Овладяване на немаксималното потискане
Немаксималното потискане (NMS) е стъпката за почистване, която превръща разхвърляна купчина от припокриващи се кутии за откриване в една подредена кутия за обект. Без него детекторите биха отчели една и съща кола пет или десет пъти. Немаксималното потискане принадлежи към работните потоци за компютърно зрение, които интерпретират или генерират визуална медия за анализ, операции и творчество. За да изградите дълбоко разбиране, третирайте Non-Maximum Suppression като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.
На практика, силни екипи, използващи Non-Maximum Suppression, балансират точността с оперативните реалности като качество на данните, вариация на осветлението и последователност на етикетите. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.
Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб. В същото време правата върху изображението и съгласието могат да се превърнат в правни рискове, ако произходът е неясен. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.
Стратегическо въздействие
Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб.
Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Творческите екипи могат да създават прототипи на концепции по-бързо с по-малко ръчни ревизии.
Творческите екипи могат да създават прототипи на концепции по-бързо с по-малко ръчни ревизии. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Операциите могат да използват изображения и видео сигнали, които преди са били трудни за обработка.
Операциите могат да използват изображения и видео сигнали, които преди са били трудни за обработка. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Внедряване в реалния свят
Свиване на десетки припокриващи се кутии с лица в по едно на лице в приложения за камера и маркиране на снимки
Създаване на чисти, единични ограничителни кутии за превозно средство и пешеходец в детектори за автономно шофиране
Дедупликиране на припокриващи се полета за текстови региони в OCR конвейери за документи и регистрационни табели
Почистване на предложения за излишни обекти в системи за наблюдение на рафтове на дребно и инвентаризация
Модели на изпълнение
Немаксимално потискане на практика
Свиване на десетки припокриващи се кутии с лица в по едно на лице в приложения за камера и маркиране на снимки.
Свиване на десетки припокриващи се полета за лице в едно на лице в приложения за камера и маркиране на снимки Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество отпред, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Немаксимално потискане на практика
Създаване на чисти, единични ограничителни кутии за превозно средство и пешеходец в детектори за автономно шофиране.
Създаване на чисти, единични ограничителни кутии за превозно средство и пешеходец в детектори за автономно шофиране Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество отпред, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Немаксимално потискане на практика
Дедупликиране на припокриващи се полета за текстови региони в OCR конвейери за документи и регистрационни табели.
Премахване на дублиране на припокриващи се текстови региони в канали за OCR на документи и регистрационни табели Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество отпред, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Немаксимално потискане на практика
Почистване на предложения за излишни обекти в системи за наблюдение на рафтове на дребно и инвентаризация.
Почистване на предложения за излишни обекти в системи за наблюдение на рафтове на дребно и инвентаризация Екипите обикновено получават по-добри резултати, когато дефинират праговете за качество предварително, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Рискове и предпазни огради
Правата върху изображението и съгласието могат да се превърнат в правни рискове, ако произходът е неясен.
Производителността на модела може да варира в зависимост от осветлението, демографските данни и средата.
Фалшивите положителни резултати могат да останат незабелязани, освен ако не се наблюдават праговете на достоверност.
Пътна карта за изпълнение
Определете критерии за приемане за прецизност, извикване и разходи за грешки.
Определете критерии за приемане за прецизност, извикване и разходи за грешки. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Тествайте с данни, които съответстват на реалните производствени условия.
Тествайте с данни, които съответстват на реалните производствени условия. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Добавете преглед от човек за прогнози с ниска степен на сигурност или с голямо въздействие.
Добавете преглед от човек за прогнози с ниска степен на сигурност или с голямо въздействие. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Проследявайте дрейфа на модела и проверявайте отново след промени в камерата или набора от данни.
Проследявайте дрейфа на модела и проверявайте отново след промени в камерата или набора от данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.