Grokking и Ръководство за забавено обобщение

Преглед

Grokking е изумителен феномен, при който невронната мрежа първо запаметява данните си за обучение, остава при почти нулева точност на валидиране за дълго време и след това внезапно генерализира дълго след като точността на обучение достигне 100%. Това преобръща интуицията, че ученето и обобщаването се случват заедно.

Grokking и Delayed Generalization се намират в основния набор от инструменти за изкуствен интелект. Когато го разберете, други теми за ИИ стават по-лесни за оценка и сравнение.

Дълбоко гмуркане

Открито от изследователи на OpenAI през 2021 г. при малки алгоритмични задачи като модулна аритметика, гроккингът показва остра двуфазова крива. В началото моделът се вписва идеално в комплекта за обучение, докато ефективността на валидиране остава случайна, изглеждайки безнадеждно прекалена. След това, след хиляди или дори милиони допълнителни стъпки без видим напредък, точността на валидиране рязко скача до почти перфектна. Водещото обяснение е, че разпадането на теглото (регуляризиране) бавно притиска мрежата да изостави крехко запаметено решение и да открие компактно, структурирано такова, което всъщност улавя основното правило, например представящо модулно добавяне като ротации в кръг. Grokking е най-видим на малки синтетични масиви от данни, но разбирането му хвърля светлина върху по-дълбоката механика на това кога и защо се появява генерализация.

Техническа информация

Механистичните проучвания са направили обратно инженерство на grokked мрежи и са открили, че те прилагат чисти алгоритми, като например използване на подобни на Фурие кръгови вграждания за извършване на модулна аритметика чрез тригонометрични идентичности. Преходът корелира с теглата на мрежата, които стават по-редки и с по-ниска норма при регулиране: запаметяването се нуждае от големи, нередовни тегла, докато обобщаващата верига е по-проста. По този начин Grokking илюстрира конкуренция между решение за бързо намиране на запаметяване и по-бавно формиращо се, по-ефективно обобщаващо решение.

Овладяване на Grokking и забавена генерализация

За да изградите дълбоко разбиране, третирайте Grokking и Delayed Generalization като оперативен модел, а не като отделна функция. Дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.

На практика силни екипи, използващи Grokking и Delayed Generalization, първо изграждат силни концептуални модели, след което картографират тези модели към реални производствени ограничения. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.

Помага ви да отделите ясните технически твърдения от маркетинговия език. В същото време различни екипи могат да използват един и същ термин по различен начин, така че дефинирайте обхвата рано. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.

Стратегическо въздействие

Помага ви да отделите ясните технически твърдения от маркетинговия език.

Помага ви да отделите ясните технически твърдения от маркетинговия език. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Можете да задавате въпроси за по-добро внедряване, преди да харчите пари или време.

You can ask better implementation questions before spending money or time. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Екипи със споделено разбиране вземат по-добри решения за продукти, политики и обучение.

Екипи със споделено разбиране вземат по-добри решения за продукти, политики и обучение. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Бъдещето на Grokking и забавеното обобщение

Grokking е прозорец към науката за обобщението, която изследователите се надяват да разширят. Отворените въпроси включват дали забавеното генерализиране се случва безшумно в големи модели, как да се открие или ускори преходът и какво означава да се знае кога моделът наистина е научил концепция спрямо запомнени примери. Прозренията могат да осигурят по-добро регулиране, графици за обучение и инструменти за интерпретация и могат да помогнат за прогнозиране на възникващи възможности в големи езикови модели.

Внедряване в реалния свят

Изучаване на модулни аритметични задачи за обратно проектиране на точните схеми, които мрежата научава

Демонстриране как намаляването на теглото води до преминаването от запомняне към истинско обобщение

Информиране на изследванията за интерпретируемост чрез предоставяне на чисти, напълно разбрани модели на поведение за анализ

Предупреждаваме практикуващите, че платата за ранно валидиране не винаги означават, че моделът не е успял да се научи

Модели на изпълнение

Grokking и забавена генерализация на практика

Изучаване на модулни аритметични задачи за обратно проектиране на точните схеми, които мрежата научава.

Екипите обикновено получават по-добри резултати, когато предварително определят праговете за качество, поддържат човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Grokking и забавена генерализация на практика

Демонстриране как намаляването на теглото води до преминаването от запомняне към истинско обобщение.

Екипите обикновено получават по-добри резултати, когато предварително определят праговете за качество, поддържат човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Grokking и забавена генерализация на практика

Информиране на изследванията за интерпретируемост чрез предоставяне на чисти, напълно разбрани модели на поведение за анализ.

Екипите обикновено получават по-добри резултати, когато предварително определят праговете за качество, поддържат човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Grokking и забавена генерализация на практика

Предупреждаваме практикуващите, че платата за ранно валидиране не винаги означават, че моделът не е успял да се научи.

Екипите обикновено получават по-добри резултати, когато предварително определят праговете за качество, поддържат човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Рискове и предпазни огради

!

Различните екипи могат да използват един и същи термин по различен начин, така че дефинирайте обхвата рано.

!

Бенчмарковете могат да изглеждат силни, докато производителността в реалния свят е неравномерна.

!

Пренебрегването на качеството на данните и плановете за оценка често създава крехки резултати.

Пътна карта за изпълнение

1

Започнете с дефиниция на обикновен език за резултата, от който се нуждаете.

Отнасяйте се към това като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

2

Изберете един показател за успех и едно условие за неуспех преди тестване.

Отнасяйте се към това като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

3

Изпълнете малък пилотен проект с представителни данни, а не изпипан демонстрационен набор.

Отнасяйте се към това като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

4

Документирайте къде Grokking и Delayed Generalization помагат и къде по-простите методи са по-добри.

Отнасяйте се към това като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Продължете да изследвате

Какво е AI?

Вземете основните понятия, преди да се гмурнете по-дълбоко.

Прочетете ръководството

Как AI учи

Разберете процеса на обучение зад съвременните системи.

Прочетете ръководството

Grokking и забавена генерализация

Преглед

Дълбоко гмуркане

Техническа информация

Овладяване на Grokking и забавена генерализация

Стратегическо въздействие

Бъдещето на Grokking и забавеното обобщение

Внедряване в реалния свят

Модели на изпълнение

Grokking и забавена генерализация на практика

Grokking и забавена генерализация на практика

Grokking и забавена генерализация на практика

Grokking и забавена генерализация на практика

Рискове и предпазни огради

Пътна карта за изпълнение

Продължете да изследвате

Какво е AI?

Как AI учи

Related guides