PRŮVODCE společnostmi

BigScience a model BLOOM

BigScience byla roční otevřená výzkumná spolupráce více než 1000 výzkumníků, která vytvořila BLOOM, jeden z prvních skutečně vícejazyčných, otevřeně vydaných velkých jazykových modelů.

Přehled

BigScience byla roční otevřená výzkumná spolupráce více než 1000 výzkumníků, která vytvořila BLOOM, jeden z prvních skutečně vícejazyčných, otevřeně vydaných velkých jazykových modelů. Je důležitý jako mezník v transparentní, komunitou řízené umělé inteligenci postavené mimo Big Tech.

BigScience a model BLOOM lze nejlépe pochopit v kontextu strategie, přístupu k modelu, rozhodnutí o platformě a ekosystémových partnerství.

Hluboký ponor

BigScience byl jednoletý výzkumný workshop probíhající od roku 2021 do roku 2022, koordinovaný Hugging Face a sdružující více než 1 000 dobrovolných výzkumníků z více než 60 zemí a 250 institucí. Jeho hlavní výstup, vydaný v červenci 2022, byl BLOOM, autoregresivní jazykový model se 176 miliardami parametrů. BLOOM byl záměrně vícejazyčný, trénovaný na korpusu ROOTS pokrývajícím 46 přirozených jazyků a 13 programovacích jazyků, se silným zastoupením nedostatečně zastoupených jazyků, jako je několik afrických a jihoasijských jazyků. Školení probíhalo několik měsíců na veřejně financovaném superpočítači Jean Zay ve Francii s použitím přibližně 384 GPU. BLOOM byl vydán pod licencí Responsible AI License s plnou dokumentací svých dat, školení a zamýšleného použití, což ostře kontrastuje s uzavřeným vývojem srovnatelných modelů.

Technický přehled

BLOOM je pouze dekodérový transformátor podobného rozsahu jako GPT-3, který používá poziční vložení ALiBi místo naučených polohových vektorů, což mu pomáhá extrapolovat na delší sekvence, než je vidět při tréninku. Aplikuje také normalizaci vkládací vrstvy, která zlepšila stabilitu tréninku v měřítku. Vícejazyčný korpus ROOTS byl pečlivě sestaven a zdokumentován, takže jazykový mix a zdroje dat byly transparentní a auditovatelné, což je záměrný odklon od neprůhledných seškrabovaných datových sad.

Zvládnutí BigScience a modelu BLOOM

BigScience byla roční otevřená výzkumná spolupráce více než 1000 výzkumníků, která vytvořila BLOOM, jeden z prvních skutečně vícejazyčných, otevřeně vydaných velkých jazykových modelů. Je důležitý jako mezník v transparentní, komunitou řízené umělé inteligenci postavené mimo Big Tech. BigScience a model BLOOM lze nejlépe pochopit v kontextu strategie, přístupu k modelu, rozhodnutí o platformě a ekosystémových partnerství. Chcete-li vybudovat hluboké porozumění, zacházejte s BigScience a modelem BLOOM jako s provozním modelem, nikoli s jedinou funkcí: definujte požadované výsledky, vyjasněte předpoklady a oddělte to, co systém dokáže spolehlivě, od toho, co stále vyžaduje odborný úsudek.

V praxi silné týmy využívající BigScience a model BLOOM vyhodnocují strategii dodavatele, spolehlivost plánu a riziko zablokování, než se zavázaly. Dokumentují explicitní kritéria úspěšnosti, testují s realistickými daty a pracovními postupy a opakují se na základě pozorovaných vzorců selhání spíše než jednorázových výher v benchmarku. Zde se teoretické porozumění mění v trvalé schopnosti napříč produktem, politikou a provozem.

Plány dodavatelů ovlivňují, jaké funkce může váš tým dále vybudovat. Zároveň mohou oznámení o spuštění předstihnout stabilitu v reálných produkčních pracovních tocích. Nejodolnějším přístupem je kombinovat rychlost experimentování s disciplínou správy: spouštějte pilotní projekty, zachycujte důkazy, publikujte protokoly rozhodnutí a průběžně aktualizujte zabezpečení podle toho, jak se vyvíjí chování modelu, očekávání uživatelů a regulační požadavky.

Strategický dopad

Plány dodavatelů ovlivňují, jaké funkce může váš tým dále vybudovat.

Plány dodavatelů ovlivňují, jaké funkce může váš tým dále vybudovat. Ve vysoce kvalitních nasazeních se to promítá do měřitelných provozních pravidel, hranic vlastnictví a opakujících se rituálů kontroly, takže týmy mohou škálovat důvěru namísto škálování nejednoznačnosti.

Komerční podmínky a možnosti nasazení ovlivňují dlouhodobé náklady a rizika.

Komerční podmínky a možnosti nasazení ovlivňují dlouhodobé náklady a rizika. Ve vysoce kvalitních nasazeních se to promítá do měřitelných provozních pravidel, hranic vlastnictví a opakujících se rituálů kontroly, takže týmy mohou škálovat důvěru namísto škálování nejednoznačnosti.

Firemní pobídky utvářejí výchozí produkty, bezpečný postoj a otevřenost.

Firemní pobídky utvářejí výchozí produkty, bezpečný postoj a otevřenost. Ve vysoce kvalitních nasazeních se to promítá do měřitelných provozních pravidel, hranic vlastnictví a opakujících se rituálů kontroly, takže týmy mohou škálovat důvěru namísto škálování nejednoznačnosti.

Budoucnost BigScience a model BLOOM

BigScience prokázala, že je možná rozsáhlá, otevřeně řízená AI a její model ovlivnil pozdější otevřená vydání a širší tlak na transparentnost. Budoucí vícejazyčná práce bude pravděpodobně stavět na svých lekcích v dokumentaci dat a inkluzivním jazykovém pokrytí, zatímco novější, efektivnější modely předčily BLOOM v nezpracovaných schopnostech. Jeho trvalým dědictvím je norma zveřejňování modelových karet, datových výpisů a odpovědných licencí a navíc důkaz, že veřejné výpočty mohou trénovat modely v hraničním měřítku.

Real-World Implementace

Generování a dokončování textu v desítkách jazyků, včetně těch, které nejsou podporovány komerčními modely

Slouží jako otevřený výzkumný základ pro studium zkreslení, vícejazyčného přenosu a škálovacího chování

Jemné ladění do variant specifických pro úkol nebo podle pokynů, jako je BLOOMZ pro neanglické komunity

Poskytování plně zdokumentovaného modelu pro akademiky studující původ školicích dat a odpovědné licencování AI

Implementační vzory

BigScience a model BLOOM v praxi

Generování a dokončování textu v desítkách jazyků, včetně těch, které nejsou podporovány komerčními modely.

Generování a dokončování textu v desítkách jazyků, včetně těch, které nejsou podporovány komerčními modely Týmy obvykle dosahují lepších výsledků, když předem definují prahové hodnoty kvality, udržují cestu lidské eskalace pro okrajové případy a sledují jak zisky z produktivity, tak náklady na chyby v průběhu času.

BigScience a model BLOOM v praxi

Slouží jako otevřený výzkumný základ pro studium zkreslení, vícejazyčného přenosu a škálovacího chování.

Slouží jako otevřený výzkumný základ pro studium zkreslení, vícejazyčného přenosu a škálovacího chování Týmy obvykle dosahují lepších výsledků, když předem definují prahové hodnoty kvality, udržují cestu lidské eskalace pro okrajové případy a sledují jak zisky z produktivity, tak náklady na chyby v průběhu času.

BigScience a model BLOOM v praxi

Jemné ladění do variant specifických pro úkoly nebo podle pokynů, jako je BLOOMZ pro neanglické komunity.

Jemné vyladění variant specifických pro úkoly nebo podle pokynů, jako je BLOOMZ pro neanglické komunity Týmy obvykle dosahují lepších výsledků, když předem definují prahové hodnoty kvality, udržují cestu lidské eskalace pro okrajové případy a sledují jak zisky z produktivity, tak náklady na chyby v průběhu času.

BigScience a model BLOOM v praxi

Poskytování plně zdokumentovaného modelu pro akademiky studující původ školicích dat a odpovědné licencování AI.

Poskytování plně zdokumentovaného modelu pro akademiky studující původ školicích dat a odpovědné licencování AI Týmy obvykle dosahují lepších výsledků, když předem definují prahové hodnoty kvality, udržují cestu lidské eskalace pro okrajové případy a sledují jak zisky z produktivity, tak náklady na chyby v průběhu času.

Rizika a zábradlí

!

Oznámení o uvedení mohou předstihnout stabilitu v reálných výrobních pracovních postupech.

!

Změny cen API nebo politik mohou přes noc narušit předpoklady.

!

Závislost na jediném dodavateli zvyšuje náklady na uzamčení a migraci.

Plán implementace

1

Vyhodnoťte poskytovatele pomocí vlastních úkolů a datových sad.

Vyhodnoťte poskytovatele pomocí vlastních úkolů a datových sad. Považujte každý krok za důkazní bránu: pokud nejsou splněna kritéria, pozastavte zavádění, uzavřete mezeru a teprve poté rozšiřte využití.

2

Před integrací si přečtěte podmínky ochrany soukromí, zabezpečení a právní podmínky.

Před integrací si přečtěte podmínky ochrany soukromí, zabezpečení a právní podmínky. Považujte každý krok za důkazní bránu: pokud nejsou splněna kritéria, pozastavte zavádění, uzavřete mezeru a teprve poté rozšiřte využití.

3

Udržujte záložní plán napříč modely nebo dodavateli.

Udržujte záložní plán napříč modely nebo dodavateli. Považujte každý krok za důkazní bránu: pokud nejsou splněna kritéria, pozastavte zavádění, uzavřete mezeru a teprve poté rozšiřte využití.

4

Sledujte poznámky k vydání, aby změny plánu nepřekvapily týmy.

Sledujte poznámky k vydání, aby změny plánu nepřekvapily týmy. Považujte každý krok za důkazní bránu: pokud nejsou splněna kritéria, pozastavte zavádění, uzavřete mezeru a teprve poté rozšiřte využití.

Pokračujte v objevování