Фирми РЪКОВОДСТВО

EleutherAI

Преглед

EleutherAI се разбира най-добре в контекста на стратегия, достъп до модели, решения за платформа и партньорства в екосистеми.

Дълбоко гмуркане

EleutherAI започна през юли 2020 г. като общност на Discord, организирана от Connor Leahy, Sid Black и Leo Gao, първоначално целяща да възпроизведе GPT-3 на OpenAI. За да обучат такива модели, те първо създадоха и пуснаха The Pile, 825GB подбран текстов набор от данни, който се превърна в стандартен отворен корпус за обучение. След това пуснаха GPT-Neo, GPT-J-6B и GPT-NeoX-20B с 20 милиарда параметъра, сред най-големите свободно достъпни езикови модели на своето време. Техните инструменти, включително библиотеката за обучение GPT-NeoX и LM Evaluation Harness, използвани в цялата индустрия за сравнителен анализ, се превърнаха в инфраструктура, върху която други се градиха. През 2023 г. EleutherAI се официализира като изследователски институт с нестопанска цел, разширявайки се в интерпретируемостта, подравняването и науката за това как моделите се учат.

Техническа информация

EleutherAI's models use the transformer decoder architecture, but GPT-J and GPT-NeoX introduced practical engineering choices like Rotary Positional Embeddings (RoPE) for encoding token positions and parallelized attention-plus-feedforward layers to speed training. Crucially, they trained on TPUs and GPUs donated through partnerships like Google's TPU Research Cloud and CoreWeave, showing that distributed, sponsor-funded compute could substitute for a corporate datacenter when paired with open code.

Овладяване на EleutherAI

EleutherAI е обикновен изследователски колектив с нестопанска цел, който е пионер в големите езикови модели с отворен код, когато граничният AI беше заключен зад корпоративни стени. Доказа се, че общност от доброволци може да изгради и свободно да пусне модели, съперничещи на затворени системи, прекроявайки кой да участва в изследванията на ИИ. EleutherAI се разбира най-добре в контекста на стратегия, достъп до модели, решения за платформа и партньорства в екосистеми. За да изградите дълбоко разбиране, третирайте EleutherAI като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.

На практика силните екипи, използващи EleutherAI, оценяват стратегията на доставчика, надеждността на пътната карта и риска от блокиране, преди да се ангажират. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък. В същото време съобщенията за стартиране може да изпреварят стабилността в реалните производствени работни процеси. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.

Стратегическо въздействие

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък.

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Търговските условия и опциите за внедряване влияят върху дългосрочните разходи и риск.

Търговските условия и опциите за внедряване влияят върху дългосрочните разходи и риск. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Стимулите на компанията оформят продуктовите стандарти, безопасността и откритостта.

Стимулите на компанията оформят продуктовите стандарти, безопасността и откритостта. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Бъдещето на EleutherAI

EleutherAI преминава от чисто надпревара за мащабиране на модели към интерпретируемост, прозрачност на данните за обучение и строга оценка, области, където отворената наука е най-необходима. Очаквайте продължителна работа по разбирането на това, което моделите представляват вътрешно, пускане на добре документирани масиви от данни и подкрепа на независими изследвания на безопасността. Докато граничните лаборатории стават все по-потайни, ролята на EleutherAI като противотежест на обществения интерес, обучаващ следващото поколение изследователи, вероятно има повече значение от броя на параметрите на всеки отделен модел, който изпраща.

Внедряване в реалния свят

Наборът от данни Pile се използва от изследователи по целия свят за обучение и изучаване на възпроизводими модели на отворен език.

GPT-J-6B и GPT-NeoX-20B се внедряват от стартиращи компании и академици като безплатни алтернативи на комерсиалните API модели.

LM Evaluation Harness е стандартният инструмент, който много лаборатории използват за сравнение на производителността на модела в стотици задачи.

Независими изследователи по безопасност и интерпретируемост използват отворените тегла на EleutherAI, за да проучат вътрешните елементи на модела, които затворените API крият.

Модели на изпълнение

EleutherAI на практика

Наборът от данни Pile се използва от изследователи по целия свят за обучение и изучаване на възпроизводими модели на отворени езици Екипите обикновено получават по-добри резултати, когато дефинират предварително прагове за качество, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

EleutherAI на практика

GPT-J-6B и GPT-NeoX-20B се внедряват от стартиращи фирми и академици като безплатни алтернативи на комерсиалните API модели. Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

EleutherAI на практика

LM Evaluation Harness е стандартният инструмент, който много лаборатории използват за сравняване на производителността на модела в стотици задачи. Екипите обикновено получават по-добри резултати, когато предварително определят прагове за качество, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

EleutherAI на практика

Независимите изследователи на безопасността и интерпретируемостта използват отворените тегла на EleutherAI, за да проучат вътрешните елементи на модела, които затворените API крият. Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Рискове и предпазни огради

Съобщенията за стартиране може да изпреварят стабилността в реалните производствени работни процеси.

Ценообразуването на API или промените в политиката могат да разбият предположенията за една нощ.

Зависимостта от един доставчик увеличава разходите за заключване и миграция.

Пътна карта за изпълнение

Оценявайте доставчиците, като използвате вашите собствени задачи и набори от данни.

Оценявайте доставчиците, като използвате вашите собствени задачи и набори от данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Прегледайте поверителността, сигурността и правните условия преди интегриране.

Прегледайте поверителността, сигурността и правните условия преди интегриране. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Поддържайте резервен план за модели или доставчици.

Поддържайте резервен план за модели или доставчици. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Наблюдавайте бележките по изданието, така че промените в пътната карта да не изненадват екипите.

Наблюдавайте бележките по изданието, така че промените в пътната карта да не изненадват екипите. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Продължете да изследвате

OpenAI

Вижте как работят водещите доставчици на фундаментни модели.

Прочетете ръководството

AI с отворен код

Сравнете отворен и затворен модел на екосистеми.

Прочетете ръководството