РУКОВОДСТВО ПО ОСНОВАМ

Гипотеза о лотерейном билете

Гипотеза лотерейного билета гласит, что внутри большой, случайно инициализированной нейронной сети скрывается небольшая подсеть — «выигрышный билет», которая, обученная отдельно с теми же начальными весами, может соответствовать точности всей сети.

Обзор

Гипотеза лотерейного билета гласит, что внутри большой, случайно инициализированной нейронной сети скрывается небольшая подсеть — «выигрышный билет», которая, обученная отдельно с теми же начальными весами, может соответствовать точности всей сети. Это важно, поскольку предполагает, что мы тренируем гораздо больше параметров, чем нам действительно нужно.

Гипотеза лотерейных билетов входит в основной набор инструментов искусственного интеллекта. Когда вы это поймете, другие темы ИИ станет легче оценивать и сравнивать.

Глубокое погружение

Гипотеза, предложенная Джонатаном Франклом и Майклом Карбином из Массачусетского технологического института в 2018 году, выросла из исследований обрезки. Обычно вы можете сократить вес обученной сети до 10–20% без потери точности, но обучение этой небольшой сети с нуля не удается. Франкл и Карбин нашли трюк: сохранить исходные первоначальные веса уцелевших соединений. Эта разреженная подсеть — выигрышный билет — затем изолированно тренируется до полной точности, иногда быстрее, чем плотный оригинал. Они идентифицировали билеты с помощью «итеративного сокращения величины»: обучали, отсекали веса наименьшей величины, перематывали остальные к исходным значениям и повторяли. Результат подразумевает, что плотная сверхпараметризация в основном помогает оптимизации найти хорошую разреженную структуру, а не то, что все эти веса необходимы индивидуально.

Техническая информация

Основная процедура — это итеративное сокращение величины с перемоткой весов: после обучения удаляются веса с наименьшей величиной, сбрасываются оставшиеся веса до их исходной инициализации (или контрольной точки раннего обучения, уточнения, называемой «перемоткой»), а затем переобучаются. Комбинация конкретной разреженной маски И ее соответствующей инициализации — вот что делает билет «выигрышным» — случайная повторная инициализация той же маски уничтожает эффект.

Освоение гипотезы о лотерейных билетах

Гипотеза лотерейного билета гласит, что внутри большой, случайно инициализированной нейронной сети скрывается небольшая подсеть — «выигрышный билет», которая, обученная отдельно с теми же начальными весами, может соответствовать точности всей сети. Это важно, поскольку предполагает, что мы тренируем гораздо больше параметров, чем нам действительно нужно. Гипотеза лотерейных билетов входит в основной набор инструментов искусственного интеллекта. Когда вы это поймете, другие темы ИИ станет легче оценивать и сравнивать. Чтобы достичь глубокого понимания, рассматривайте гипотезу лотерейного билета как операционную модель, а не как отдельную функцию: определите желаемые результаты, проясните предположения и отделите то, что система может делать надежно, от того, что все еще требует экспертной оценки.

На практике сильные команды, использующие гипотезу лотерейного билета, сначала создают надежные концептуальные модели, а затем сопоставляют эти модели с реальными производственными ограничениями. Они документируют явные критерии успеха, проводят тестирование на основе реалистичных данных и рабочих процессов, а также выполняют итерации на основе наблюдаемых моделей неудач, а не разовых побед в тестах. Именно здесь теоретическое понимание превращается в прочные возможности в отношении продукта, политики и операций.

Это поможет вам отделить четкие технические заявления от маркетингового языка. В то же время разные команды могут использовать один и тот же термин по-разному, поэтому заранее определите масштаб. Самый устойчивый подход — сочетать скорость экспериментирования с дисциплиной управления: запускать пилотные проекты, собирать доказательства, публиковать журналы решений и постоянно обновлять меры безопасности по мере развития поведения модели, ожиданий пользователей и нормативных требований.

Стратегическое воздействие

Это поможет вам отделить четкие технические заявления от маркетингового языка.

Это поможет вам отделить четкие технические заявления от маркетингового языка. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.

Вы можете задать более эффективные вопросы по реализации, прежде чем тратить деньги или время.

Вы можете задать более эффективные вопросы по реализации, прежде чем тратить деньги или время. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.

Команды с общим пониманием принимают более эффективные решения по продуктам, политике и обучению.

Команды с общим пониманием принимают более эффективные решения по продуктам, политике и обучению. В высококачественных развертываниях это выражается в измеримых рабочих правилах, границах владения и повторяющихся ритуалах проверки, что позволяет командам повышать уверенность, а не увеличивать двусмысленность.

Гипотеза о будущем лотерейных билетов

Лотерейные билеты стимулируют исследования по обучению разреженных сетей с самого начала для экономии вычислений и энергии, а также по вопросу о том, передаются ли билеты между наборами данных и задачами. Масштабирование итеративного сокращения до моделей с миллиардом параметров остается дорогостоящим, поэтому работа по поиску дешевых билетов или доказательству их существования продолжается («сильная» гипотеза лотерейных билетов гласит, что билеты существуют при инициализации без какого-либо обучения). Ожидайте связи с эффективными моделями устройств и экологически чистым искусственным интеллектом.

Реальная реализация

Сжатие большого классификатора изображений до менее 20 % его веса для развертывания на телефоне с сохранением точности.

Ускорение обучения за счет выявления и обучения только редкой выигрышной подсети.

Изучение возможности переноса веса путем повторного использования билета, найденного в одном наборе данных, для запуска тренировок по связанному.

Сокращение энергии вывода и объема памяти на периферийных устройствах за счет доставки сокращенного выигрышного билета вместо плотной модели.

Шаблоны реализации

Гипотеза о лотерейном билете на практике

Сжатие большого классификатора изображений до менее 20 % его веса для развертывания на телефоне с сохранением точности.

Сжатие большого классификатора изображений до менее 20 % его веса для развертывания на телефоне с сохранением точности. Команды обычно получают лучшие результаты, если заранее определяют пороговые значения качества, сохраняют возможность человеческой эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.

Гипотеза о лотерейном билете на практике

Ускорение обучения за счет выявления и обучения только редкой выигрышной подсети.

Ускорение обучения за счет выявления и обучения только редкой победившей подсети. Команды обычно добиваются лучших результатов, если заранее определяют пороговые значения качества, сохраняют возможность эскалации вручную для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.

Гипотеза о лотерейном билете на практике

Изучение переносимости веса путем повторного использования билета, найденного в одном наборе данных, для запуска тренировок по связанному.

Изучение возможности переноса веса путем повторного использования билета, найденного в одном наборе данных, для запуска обучения на связанном. Команды обычно получают лучшие результаты, когда заранее определяют пороговые значения качества, сохраняют путь человеческой эскалации для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.

Гипотеза о лотерейном билете на практике

Сокращение энергии вывода и памяти на периферийных устройствах за счет доставки сокращенного выигрышного билета вместо плотной модели.

Сокращение затрат энергии на вывод и объема памяти в периферийных устройствах за счет доставки сокращенного выигрышного билета вместо плотной модели. Команды обычно получают лучшие результаты, когда заранее определяют пороговые значения качества, сохраняют путь эскалации с участием человека для крайних случаев и отслеживают как рост производительности, так и затраты на ошибки с течением времени.

Риски и ограничения

!

Разные команды могут использовать один и тот же термин по-разному, поэтому заранее определите масштаб.

!

Тесты могут выглядеть сильными, в то время как реальная производительность неравномерна.

!

Игнорирование качества данных и планов оценки часто приводит к нестабильным результатам.

Дорожная карта реализации

1

Начните с простого определения желаемого результата.

Начните с простого определения желаемого результата. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.

2

Перед тестированием выберите один показатель успеха и одно условие отказа.

Перед тестированием выберите один показатель успеха и одно условие отказа. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.

3

Запустите небольшой пилотный проект с репрезентативными данными, а не отточенный демонстрационный набор.

Запустите небольшой пилотный проект с репрезентативными данными, а не отточенный демонстрационный набор. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.

4

Документ, в котором помогает гипотеза лотерейного билета и где более простые методы лучше.

Документ, в котором помогает гипотеза лотерейного билета и где более простые методы лучше. Относитесь к каждому шагу как к доказательству: если критерии не выполняются, приостановите внедрение, ликвидируйте пробел и только затем расширяйте использование.

Продолжайте исследовать