Преглед
Toolformer е 2023 Meta AI метод, който позволява на езиков модел да се обучава кога и как да извиква външни инструменти като калкулатори, търсачки и преводачи. Вместо хората да маркират извиквания на инструменти, моделът генерира и филтрира свои собствени примери за обучение, след което прецизира тези, които действително помагат.
Използването на инструменти за формиране на инструменти и самоучител е технически градивен елемент, който влияе върху качеството на модела, цената на инфраструктурата, латентността и надеждността в мащаб.
Дълбоко гмуркане
Toolformer, от Schick et al. на Meta AI се справя с парадокс: големите модели са страхотни в езика, но са лоши в аритметиката, свежите факти и прецизните търсения. Тренировъчният цикъл се самонаблюдава. На модела са дадени шепа написани от човека примери, показващи синтаксиса на API-извикване, след което е подканен да вмъкне кандидат-извиквания (опаковани в специални токени) на много позиции в голям текстов корпус. Всяко извикване на кандидат действително се изпълнява и резултатът се включва. Ключовата стъпка за филтриране запазва извикване на инструмент само ако наличието на резултат от API намалява объркването на модела относно предстоящия реален текст повече, отколкото да не се извиква или да се извиква по различен начин. След това моделът се настройва фино върху този филтриран, самостоятелно генериран набор от данни, като се научава да извиква пет инструмента: калкулатор, QA система, търсачка, преводач и календар.
Техническа информация
Решаващата идея е целта на самоконтролираното филтриране. За всяка кандидатска позиция Toolformer сравнява загубата на прогнозиране на следните токени с вмъкнат API резултат спрямо без него. Обажданията, които намаляват загубата с повече от праг, се запазват; безполезните или шумни повиквания се отхвърлят. Това означава, че не е необходима човешка анотация за „правилното“ използване на инструмента, моделът сам решава кои обаждания са били наистина информативни и научава разположението и аргументите съвместно.
Овладяване на инструмент за формиране на инструменти и самообучена работа с инструменти
Toolformer е 2023 Meta AI метод, който позволява на езиков модел да се обучава кога и как да извиква външни инструменти като калкулатори, търсачки и преводачи. Вместо хората да маркират извиквания на инструменти, моделът генерира и филтрира свои собствени примери за обучение, след което прецизира тези, които действително помагат. Използването на инструменти за формиране на инструменти и самоучител е технически градивен елемент, който влияе върху качеството на модела, цената на инфраструктурата, латентността и надеждността в мащаб. За да изградите дълбоко разбиране, третирайте Toolformer и Self-Taught Tool Use като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно от това, което все още изисква експертна преценка.
На практика силни екипи, използващи Toolformer и Self-Taught Tool Use, оптимизират избора на архитектура, данни и инфраструктура срещу надеждност и цена. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години. В същото време оптимизирането на един бенчмарк може да скрие по-широки системни слабости. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.
Стратегическо въздействие
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години.
Архитектурните решения стимулират производителността и оперативните разходи в продължение на години. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Техническото образование помага на екипите да изберат правилния стек, а не само най-новия.
Техническото образование помага на екипите да изберат правилния стек, а не само най-новия. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
По-добрият инженерен избор намалява инцидентите, свързани с надеждността в производството.
По-добрият инженерен избор намалява инцидентите, свързани с надеждността в производството. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.
Внедряване в реалния свят
Извикване на API на калкулатор по средата на изречението, за да получите точна аритметика, вместо да познаете цифров отговор.
Запитване към система за търсене или QA за извличане на актуална или рядко срещана фактическа информация.
Извикване на инструмент за машинен превод за изобразяване на фраза на друг език в генерирания текст.
Използване на инструмент за календар/дата за разрешаване на относителни препратки като „следващия петък“ към конкретна дата.
Модели на изпълнение
Инструмент за формиране на инструменти и самоук Използване на инструмента на практика
Извикване на API на калкулатор по средата на изречението, за да получите точна аритметика, вместо да познаете цифров отговор.
Извикване на API на калкулатор по средата на изречението, за да получите точна аритметика, вместо да познаете цифров отговор Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Инструмент за формиране на инструменти и самоук Използване на инструмента на практика
Запитване към система за търсене или QA за извличане на актуална или рядко срещана фактическа информация.
Запитване към система за търсене или QA за извличане на актуална или рядко срещана фактическа информация Екипите обикновено получават по-добри резултати, когато предварително определят прагове за качество, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Инструмент за формиране на инструменти и самоук Използване на инструмента на практика
Извикване на инструмент за машинен превод за изобразяване на фраза на друг език в генерирания текст.
Извикване на инструмент за машинен превод за рендиране на фраза на друг език в рамките на генерирания текст Екипите обикновено получават по-добри резултати, когато предварително определят прагове за качество, поддържат човешка пътека за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Инструмент за формиране на инструменти и самоук Използване на инструмента на практика
Използване на инструмент за календар/дата за разрешаване на относителни препратки като „следващия петък“ към конкретна дата.
Използване на инструмент за календар/дата за разрешаване на относителни препратки като „следващия петък“ към конкретна дата Екипите обикновено получават по-добри резултати, когато дефинират предварително прагове за качество, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.
Рискове и предпазни огради
Оптимизирането на един бенчмарк може да скрие по-широки системни слабости.
Разходите за инфраструктура и поддръжка често се подценяват.
Пропуските в сигурността и видимостта могат да нарастват, когато системите стават по-сложни.
Пътна карта за изпълнение
Определете целите за латентност, качество и разходи преди внедряването.
Определете целите за латентност, качество и разходи преди внедряването. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Бенчмарк при реалистични условия на натоварване и данни.
Бенчмарк при реалистични условия на натоварване и данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Мониторинг на инструмента за грешки, отклонение и въздействие върху потребителя.
Мониторинг на инструмента за грешки, отклонение и въздействие върху потребителя. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.
Подгответе пътеките за връщане назад и реакция на инцидент преди мащабиране.
Подгответе пътеките за връщане назад и реакция на инцидент преди мащабиране. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.