РЪКОВОДСТВО за визуален AI

Пленоксели и вокселни радиационни полета

Plenoxels показаха, че можете да реконструирате 3D сцена с резултати с NeRF качество без каквато и да е невронна мрежа - просто решетка от воксели, съхраняваща цвят и плътност.

Преглед

Plenoxels показаха, че можете да реконструирате 3D сцена с резултати с NeRF качество без каквато и да е невронна мрежа - просто решетка от воксели, съхраняваща цвят и плътност. Резултатът се тренира приблизително 100 пъти по-бързо от оригиналния NeRF, като същевременно съответства на визуалното му качество.

Plenoxels и Voxel Radiance Fields принадлежат към работни потоци за компютърно зрение, които интерпретират или генерират визуална медия за анализ, операции и творчество.

Дълбоко гмуркане

NeRF постига фотореализъм, но е бавен, защото всяка проба изисква преминаване напред през дълбока невронна мрежа и обучението може да отнеме часове или дни. Plenoxels (Sara Fridovich-Keil, Alex Yu et al., 2022) зададоха провокативен въпрос: необходима ли е мрежата? Техният отговор беше не. Те представят сцената като рядка 3D вокселна мрежа. Всеки зает воксел съхранява една стойност на непрозрачност плюс сферични хармонични коефициенти, които кодират зависим от изгледа цвят. За да изобрази пиксел, системата трилинейно интерполира тези стойности по лъча и ги комбинира със стандартно обемно изобразяване. Тъй като няма мрежа, цялото нещо се оптимизира директно с градиентно спускане на стойностите на вокселите, регулирани за гладкост. Основният резултат: сравнимо качество с NeRF, обучен за минути на един GPU.

Техническа информация

Зависещият от изгледа цвят е умната част. Вместо мрежа, извеждаща RGB за ъгъл на гледане, всеки воксел съхранява малък набор от коефициенти на сферична хармоника (SH) за цветен канал. Оценяването на SH основата в посоката на лъча възстановява как цветът на тази точка се променя в зависимост от гледната точка – улавяйки огледални светлини и отражения. Непрозрачността не зависи от посоката. Диференцируема трилинейна интерполация плюс изобразяване на обема прави всяка стойност на воксел директно обучаема, така че оптимизацията е просто, без мрежа напасване в стил на най-малките квадрати.

Овладяване на пленоксели и вокселни радиационни полета

Plenoxels показаха, че можете да реконструирате 3D сцена с резултати с NeRF качество без каквато и да е невронна мрежа - просто решетка от воксели, съхраняваща цвят и плътност. Резултатът се тренира приблизително 100 пъти по-бързо от оригиналния NeRF, като същевременно съответства на визуалното му качество. Plenoxels и Voxel Radiance Fields принадлежат към работни потоци за компютърно зрение, които интерпретират или генерират визуална медия за анализ, операции и творчество. За да изградите дълбоко разбиране, третирайте Plenoxels и Voxel Radiance Fields като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.

На практика силни екипи, използващи Plenoxels и Voxel Radiance Fields, балансират точността с оперативните реалности като качество на данните, вариация на осветлението и последователност на етикетите. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.

Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб. В същото време правата върху изображението и съгласието могат да се превърнат в правни рискове, ако произходът е неясен. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.

Стратегическо въздействие

Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб.

Visual AI може да автоматизира задачи за проверка, откриване и маркиране в мащаб. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Творческите екипи могат да създават прототипи на концепции по-бързо с по-малко ръчни ревизии.

Творческите екипи могат да създават прототипи на концепции по-бързо с по-малко ръчни ревизии. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Операциите могат да използват изображения и видео сигнали, които преди са били трудни за обработка.

Операциите могат да използват изображения и видео сигнали, които преди са били трудни за обработка. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Бъдещето на пленокселите и вокселните радиационни полета

Plenoxels доказа, че представянето, а не невронната мрежа, движи качеството на NeRF - находка, която промени полето. Той директно вдъхнови експлицитни и хибридни методи като хеш-решетките на Instant-NGP и, в крайна сметка, 3D Gaussian Splatting, който сега доминира в изобразяването на излъчване в реално време. Очаквайте непрекъснато движение към изрични, удобни за GPU примитиви, които се обучават за секунди и изобразяват в реално време, като невронните мрежи се използват селективно, а не като хранилище на основна сцена.

Внедряване в реалния свят

Бързо реконструиране на заснет обект в 3D актив за минути за електронна търговия или музейна цифровизация, вместо да чакате с часове.

Бързо създаване на прототипи на синтез на нов изглед на един потребителски GPU за научни изследвания и образование.

Генериране на редактируеми, ясни вокселни сцени, които артистите могат директно да инспектират и подрязват, за разлика от непрозрачните мрежови тежести.

Служи като учебен пример, че представянето на сцената, а не дълбокото обучение, е това, което дава фотореалистични резултати.

Модели на изпълнение

Plenoxels и Voxel Radiance Fields на практика

Бързо реконструиране на заснет обект в 3D актив за минути за електронна търговия или музейна цифровизация, вместо да чакате с часове.

Бързо реконструиране на заснет обект в 3D актив за минути за електронна търговия или музейна дигитализация, вместо часове на изчакване Екипите обикновено получават по-добри резултати, когато дефинират предварително прагове за качество, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Plenoxels и Voxel Radiance Fields на практика

Бързо създаване на прототипи на синтез на нов изглед на един потребителски GPU за научни изследвания и образование.

Бързо прототипиране на синтез на нов изглед на един потребителски графичен процесор за научни изследвания и образование Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Plenoxels и Voxel Radiance Fields на практика

Генериране на редактируеми, ясни вокселни сцени, които артистите могат директно да инспектират и подрязват, за разлика от непрозрачните мрежови тежести.

Генериране на редактируеми, изрични вокселни сцени, които артистите могат директно да инспектират и отрязват, за разлика от непрозрачните мрежови тегла Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество отпред, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Plenoxels и Voxel Radiance Fields на практика

Служи като учебен пример, че представянето на сцената, а не дълбокото обучение, е това, което дава фотореалистични резултати.

Служейки като поучителен пример, че представянето на сцената, а не задълбоченото обучение, е това, което произвежда фотореалистични резултати. Екипите обикновено получават по-добри резултати, когато дефинират праговете на качеството предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Рискове и предпазни огради

!

Правата върху изображението и съгласието могат да се превърнат в правни рискове, ако произходът е неясен.

!

Производителността на модела може да варира в зависимост от осветлението, демографските данни и средата.

!

Фалшивите положителни резултати могат да останат незабелязани, освен ако не се наблюдават праговете на достоверност.

Пътна карта за изпълнение

1

Определете критерии за приемане за прецизност, извикване и разходи за грешки.

Определете критерии за приемане за прецизност, извикване и разходи за грешки. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

2

Тествайте с данни, които съответстват на реалните производствени условия.

Тествайте с данни, които съответстват на реалните производствени условия. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

3

Добавете преглед от човек за прогнози с ниска степен на сигурност или с голямо въздействие.

Добавете преглед от човек за прогнози с ниска степен на сигурност или с голямо въздействие. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

4

Проследявайте дрейфа на модела и проверявайте отново след промени в камерата или набора от данни.

Проследявайте дрейфа на модела и проверявайте отново след промени в камерата или набора от данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Продължете да изследвате