FöretagsGUIDE

BigScience och BLOOM-modellen

BigScience var ett år långt öppet forskningssamarbete mellan över 1 000 forskare som producerade BLOOM, en av de första riktigt flerspråkiga, öppet släppta stora språkmodellerna.

Översikt

BigScience och BLOOM-modellen förstås bäst i samband med strategi, modelltillgång, plattformsbeslut och ekosystempartnerskap.

Djupdykning

BigScience var en ettårig forskningsworkshop som pågick från 2021 till 2022, koordinerad av Hugging Face och samlade mer än 1 000 frivilliga forskare från över 60 länder och 250 institutioner. Dess rubrikproduktion, som släpptes i juli 2022, var BLOOM, en autoregressiv språkmodell med 176 miljarder parametrar. BLOOM var medvetet flerspråkig, utbildad på ROOTS-korpusen som täckte 46 naturliga språk och 13 programmeringsspråk, med stark representation av underrepresenterade språk som flera afrikanska och sydasiatiska språk. Utbildningen pågick i flera månader på den offentligt finansierade superdatorn Jean Zay i Frankrike med cirka 384 GPU:er. BLOOM släpptes under Responsible AI License med fullständig dokumentation av dess data, utbildning och avsedda användningsområden, i skarp kontrast till den slutna utvecklingen av jämförbara modeller.

Teknisk insikt

BLOOM är en transformator med endast avkodare av liknande skala som GPT-3, som använder ALiBi positionsinbäddningar istället för inlärda positionsvektorer, vilket hjälper den att extrapolera till längre sekvenser än vad man sett under träning. Den tillämpar också en normalisering av inbäddningslager som förbättrade träningsstabiliteten i skala. Den flerspråkiga ROOTS-korpusen sammanställdes noggrant och dokumenterades så att språkmixen och datakällorna var transparenta och granskningsbara, en avsiktlig avvikelse från ogenomskinliga skrapade datamängder.

Bemästra BigScience och BLOOM-modellen

BigScience var ett år långt öppet forskningssamarbete mellan över 1 000 forskare som producerade BLOOM, en av de första riktigt flerspråkiga, öppet släppta stora språkmodellerna. Det är viktigt som ett landmärke inom transparent, community-driven AI byggd utanför Big Tech. BigScience och BLOOM-modellen förstås bäst i samband med strategi, modelltillgång, plattformsbeslut och ekosystempartnerskap. För att bygga djup förståelse, behandla BigScience och BLOOM-modellen som en operativ modell, inte en enda funktion: definiera önskade resultat, förtydliga antaganden och separera vad systemet kan göra på ett tillförlitligt sätt från det som fortfarande kräver expertbedömning.

I praktiken utvärderar starka team som använder BigScience och BLOOM-modellen leverantörsstrategi, färdplanens tillförlitlighet och inlåsningsrisk innan de åtar sig. De dokumenterar explicita framgångskriterier, testar mot realistiska data och arbetsflöden och itererar baserat på observerade misslyckandemönster snarare än engångsvinster. Det är här teoretisk förståelse förvandlas till hållbar förmåga över produkt, policy och verksamhet.

Leverantörsfärdplaner påverkar vilka funktioner ditt team kan bygga härnäst. Samtidigt kan lanseringsmeddelanden överträffa stabiliteten i verkliga produktionsarbetsflöden. Det mest motståndskraftiga tillvägagångssättet är att kombinera experimenteringshastighet med styrningsdisciplin: köra piloter, fånga bevis, publicera beslutsloggar och kontinuerligt uppdatera säkerhetsåtgärder allteftersom modellens beteende, användarnas förväntningar och regulatoriska krav utvecklas.

Strategisk inverkan

Leverantörsfärdplaner påverkar vilka funktioner ditt team kan bygga härnäst.

Leverantörsfärdplaner påverkar vilka funktioner ditt team kan bygga härnäst. I högkvalitativa implementeringar översätts detta till mätbara driftregler, ägandegränser och återkommande granskningsritualer så att team kan skala förtroende istället för att skala tvetydigheter.

Kommersiella villkor och distributionsalternativ påverkar långsiktiga kostnader och risker.

Kommersiella villkor och distributionsalternativ påverkar långsiktiga kostnader och risker. I högkvalitativa implementeringar översätts detta till mätbara driftregler, ägandegränser och återkommande granskningsritualer så att team kan skala förtroende istället för att skala tvetydigheter.

Företagsincitament formar produktstandarder, säkerhetsställning och öppenhet.

Företagsincitament formar produktstandarder, säkerhetsställning och öppenhet. I högkvalitativa implementeringar översätts detta till mätbara driftregler, ägandegränser och återkommande granskningsritualer så att team kan skala förtroende istället för att skala tvetydigheter.

Framtiden för BigScience och BLOOM-modellen

BigScience visade att storskalig, öppet styrd AI är möjlig, och dess modell påverkade senare öppna releaser och den bredare strävan efter transparens. Framtida flerspråkigt arbete kommer sannolikt att bygga på sina lektioner i datadokumentation och inkluderande språktäckning, medan nyare, mer effektiva modeller har överträffat BLOOM när det gäller rå kapacitet. Dess bestående arv är normen för publicering av modellkort, datautlåtanden och ansvarsfulla licenser, plus bevis på att public compute kan träna gränsmodeller.

Real-World Implementation

Generera och komplettera text på dussintals språk, inklusive de som inte betjänas av kommersiella modeller

Fungerar som en öppen forskningsbaslinje för att studera partiskhet, flerspråkig överföring och skalningsbeteende

Finjustera till uppgiftsspecifika eller instruktionsföljande varianter som BLOOMZ för icke-engelska gemenskaper

Tillhandahåller en fullt dokumenterad modell för akademiker som studerar utbildningsdatas ursprung och ansvarsfull AI-licensering

Implementeringsmönster

BigScience och BLOOM-modellen i praktiken

Generera och komplettera text på dussintals språk, inklusive de som inte betjänas av kommersiella modeller.

Generera och fylla i text på dussintals språk, inklusive de som inte betjänas av kommersiella modeller. Team får vanligtvis bättre resultat när de definierar kvalitetströsklar i förväg, håller en mänsklig eskaleringsväg för kantfall och spårar både produktivitetsvinster och felkostnader över tid.

BigScience och BLOOM-modellen i praktiken

Fungerar som en öppen forskningsbaslinje för att studera partiskhet, flerspråkig överföring och skalningsbeteende.

Fungerar som en öppen forskningsbaslinje för att studera fördomar, flerspråkig överföring och skalningsbeteende Team får vanligtvis bättre resultat när de definierar kvalitetströsklar i förväg, håller en mänsklig eskaleringsväg för edge-fall och spårar både produktivitetsvinster och felkostnader över tid.

BigScience och BLOOM-modellen i praktiken

Finjustera till uppgiftsspecifika eller instruktionsföljande varianter som BLOOMZ för icke-engelska samhällen.

Finjustering till uppgiftsspecifika eller instruktionsföljande varianter som BLOOMZ för icke-engelska gemenskaper Team får vanligtvis bättre resultat när de definierar kvalitetströsklar i förväg, håller en mänsklig eskaleringsväg för edge-fall och spårar både produktivitetsvinster och felkostnader över tid.

BigScience och BLOOM-modellen i praktiken

Tillhandahåller en fullt dokumenterad modell för akademiker som studerar utbildningsdatas ursprung och ansvarsfull AI-licensering.

Att tillhandahålla en fullt dokumenterad modell för akademiker som studerar utbildningsdatas ursprung och ansvarsfull AI-licensering Team får vanligtvis bättre resultat när de definierar kvalitetströsklar i förväg, håller en mänsklig eskaleringsväg för edge-fall och spårar både produktivitetsvinster och felkostnader över tid.

Risker & skyddsräcken

Lanseringsmeddelanden kan överträffa stabiliteten i verkliga produktionsarbetsflöden.

API-prissättning eller policyförskjutningar kan bryta antaganden över en natt.

Beroende av en leverantör ökar inlåsnings- och migreringskostnaderna.

Färdplan för genomförande

Utvärdera leverantörer med dina egna uppgifter och datauppsättningar.

Utvärdera leverantörer med dina egna uppgifter och datauppsättningar. Behandla varje steg som en evidensgrind: om kriterierna inte uppfylls, pausa lanseringen, täpp till luckan och först därefter utöka användningen.

Granska sekretess, säkerhet och juridiska villkor innan integration.

Granska sekretess, säkerhet och juridiska villkor innan integration. Behandla varje steg som en evidensgrind: om kriterierna inte uppfylls, pausa lanseringen, täpp till luckan och först därefter utöka användningen.

Upprätthåll en reservplan över modeller eller leverantörer.

Upprätthåll en reservplan över modeller eller leverantörer. Behandla varje steg som en evidensgrind: om kriterierna inte uppfylls, pausa lanseringen, täpp till luckan och först därefter utöka användningen.

Övervaka release notes så att förändringar i färdplanen inte överraskar team.

Övervaka release notes så att förändringar i färdplanen inte överraskar team. Behandla varje steg som en evidensgrind: om kriterierna inte uppfylls, pausa lanseringen, täpp till luckan och först därefter utöka användningen.

Fortsätt utforska

OpenAI

Se hur ledande leverantörer av grundmodeller fungerar.

Läs guiden

AI med öppen källkod

Jämför öppna och slutna modellekosystem.

Läs guiden