GUIDA alle aziende

BigScience e il modello BLOOM

BigScience è stata una collaborazione di ricerca aperta durata un anno di oltre 1.000 ricercatori che ha prodotto BLOOM, uno dei primi modelli linguistici di grandi dimensioni veramente multilingue e rilasciati apertamente.

Panoramica

BigScience è stata una collaborazione di ricerca aperta durata un anno di oltre 1.000 ricercatori che ha prodotto BLOOM, uno dei primi modelli linguistici di grandi dimensioni veramente multilingue e rilasciati apertamente. È importante come punto di riferimento nell’intelligenza artificiale trasparente e guidata dalla comunità, costruita al di fuori delle Big Tech.

BigScience e il modello BLOOM possono essere compresi meglio nel contesto della strategia, dell’accesso al modello, delle decisioni sulla piattaforma e delle partnership dell’ecosistema.

Immersione profonda

BigScience è stato un seminario di ricerca della durata di un anno, dal 2021 al 2022, coordinato da Hugging Face e che ha riunito più di 1.000 ricercatori volontari provenienti da oltre 60 paesi e 250 istituzioni. Il suo risultato principale, pubblicato nel luglio 2022, è stato BLOOM, un modello linguistico autoregressivo da 176 miliardi di parametri. BLOOM è stato deliberatamente multilingue, formato sul corpus ROOTS che copre 46 lingue naturali e 13 linguaggi di programmazione, con una forte rappresentanza di lingue sottorappresentate come diverse lingue africane e dell'Asia meridionale. La formazione è durata diversi mesi sul supercomputer Jean Zay, finanziato con fondi pubblici in Francia, utilizzando circa 384 GPU. BLOOM è stato rilasciato sotto la licenza AI responsabile con la documentazione completa dei dati, della formazione e degli usi previsti, in netto contrasto con lo sviluppo chiuso di modelli comparabili.

Approfondimento tecnico

BLOOM è un trasformatore solo decodificatore di scala simile a GPT-3, che utilizza incorporamenti posizionali ALiBi invece di vettori di posizione appresi, il che lo aiuta a estrapolare sequenze più lunghe rispetto a quelle viste nell'addestramento. Applica inoltre una normalizzazione del livello di incorporamento che ha migliorato la stabilità dell'addestramento su larga scala. Il corpus multilingue ROOTS è stato attentamente assemblato e documentato in modo che il mix linguistico e le fonti dei dati fossero trasparenti e verificabili, un deliberato allontanamento dagli opachi set di dati raschiati.

Padroneggiare BigScience e il modello BLOOM

BigScience è stata una collaborazione di ricerca aperta durata un anno di oltre 1.000 ricercatori che ha prodotto BLOOM, uno dei primi modelli linguistici di grandi dimensioni veramente multilingue e rilasciati apertamente. È importante come punto di riferimento nell’intelligenza artificiale trasparente e guidata dalla comunità, costruita al di fuori delle Big Tech. BigScience e il modello BLOOM possono essere compresi meglio nel contesto della strategia, dell’accesso al modello, delle decisioni sulla piattaforma e delle partnership dell’ecosistema. Per creare una comprensione profonda, tratta BigScience e il modello BLOOM come un modello operativo, non come una singola caratteristica: definisci i risultati desiderati, chiarisci le ipotesi e separa ciò che il sistema può fare in modo affidabile da ciò che richiede ancora il giudizio di esperti.

In pratica, team forti che utilizzano BigScience e il modello BLOOM valutano la strategia del fornitore, l'affidabilità della roadmap e il rischio di vincolo prima di impegnarsi. Documentano criteri di successo espliciti, effettuano test rispetto a dati e flussi di lavoro realistici e ripetono in base a modelli di fallimento osservati piuttosto che a successi benchmark una tantum. È qui che la comprensione teorica si trasforma in capacità duratura in termini di prodotto, politica e operazioni.

Le roadmap dei fornitori influenzano le funzionalità che il tuo team può sviluppare successivamente. Allo stesso tempo, gli annunci di lancio potrebbero superare la stabilità dei flussi di lavoro di produzione reali. L’approccio più resiliente consiste nel combinare la velocità di sperimentazione con la disciplina della governance: eseguire progetti pilota, acquisire prove, pubblicare registri decisionali e aggiornare continuamente le misure di salvaguardia man mano che il comportamento del modello, le aspettative degli utenti e i requisiti normativi evolvono.

Impatto strategico

Le roadmap dei fornitori influenzano le funzionalità che il tuo team può sviluppare successivamente.

Le roadmap dei fornitori influenzano le funzionalità che il tuo team può sviluppare successivamente. Nelle implementazioni di alta qualità, ciò si traduce in regole operative misurabili, limiti di proprietà e rituali di revisione ricorrenti in modo che i team possano aumentare la fiducia invece di aumentare l’ambiguità.

I termini commerciali e le opzioni di implementazione influiscono sui costi e sui rischi a lungo termine.

I termini commerciali e le opzioni di implementazione influiscono sui costi e sui rischi a lungo termine. Nelle implementazioni di alta qualità, ciò si traduce in regole operative misurabili, limiti di proprietà e rituali di revisione ricorrenti in modo che i team possano aumentare la fiducia invece di aumentare l’ambiguità.

Gli incentivi aziendali modellano le impostazioni predefinite dei prodotti, la postura di sicurezza e l’apertura.

Gli incentivi aziendali modellano le impostazioni predefinite dei prodotti, la postura di sicurezza e l’apertura. Nelle implementazioni di alta qualità, ciò si traduce in regole operative misurabili, limiti di proprietà e rituali di revisione ricorrenti in modo che i team possano aumentare la fiducia invece di aumentare l’ambiguità.

Il futuro di BigScience e il modello BLOOM

BigScience ha dimostrato che un’intelligenza artificiale governata apertamente e su larga scala è possibile, e il suo modello ha influenzato i successivi rilasci aperti e la più ampia spinta alla trasparenza. Il futuro lavoro multilingue probabilmente si baserà sulle lezioni apprese nella documentazione dei dati e nella copertura linguistica inclusiva, mentre modelli più nuovi e più efficienti hanno superato BLOOM in termini di capacità grezze. La sua eredità duratura è la norma di pubblicare schede modello, dichiarazioni di dati e licenze responsabili, oltre alla prova che il calcolo pubblico può addestrare modelli su scala di frontiera.

Implementazione nel mondo reale

Generazione e completamento di testi in decine di lingue, comprese quelle scarsamente servite dai modelli commerciali

Fungere da base di ricerca aperta per studiare pregiudizi, trasferimento multilingue e comportamento di ridimensionamento

Perfezionamento in varianti specifiche per attività o che seguono istruzioni come BLOOMZ per le comunità non inglesi

Fornire un modello completamente documentato per gli accademici che studiano la provenienza dei dati di formazione e le licenze di intelligenza artificiale responsabile

Modelli di implementazione

BigScience e il modello BLOOM in pratica

Generazione e completamento di testi in decine di lingue, comprese quelle scarsamente servite dai modelli commerciali.

Generazione e completamento di testi in dozzine di lingue, comprese quelle non servite dai modelli commerciali. I team di solito ottengono risultati migliori quando definiscono in anticipo le soglie di qualità, mantengono un percorso di escalation umano per i casi limite e monitorano sia i guadagni di produttività che i costi di errore nel tempo.

BigScience e il modello BLOOM in pratica

Fungere da base di ricerca aperta per studiare pregiudizi, trasferimento multilingue e comportamento di ridimensionamento.

Fungendo da base di ricerca aperta per studiare bias, trasferimento multilingue e comportamento in scala. I team di solito ottengono risultati migliori quando definiscono in anticipo le soglie di qualità, mantengono un percorso di escalation umano per i casi limite e monitorano sia i guadagni di produttività che i costi di errore nel tempo.

BigScience e il modello BLOOM in pratica

Perfezionamento in varianti specifiche per attività o che seguono istruzioni come BLOOMZ per le comunità non inglesi.

Perfezionamento in varianti specifiche per attività o che seguono istruzioni come BLOOMZ per le comunità non inglesi I team di solito ottengono risultati migliori quando definiscono in anticipo le soglie di qualità, mantengono un percorso di escalation umano per i casi limite e monitorano sia i guadagni di produttività che i costi di errore nel tempo.

BigScience e il modello BLOOM in pratica

Fornire un modello completamente documentato per gli accademici che studiano la provenienza dei dati di formazione e le licenze di intelligenza artificiale responsabile.

Fornire un modello completamente documentato per gli accademici che studiano la provenienza dei dati di formazione e le licenze di intelligenza artificiale responsabile I team di solito ottengono risultati migliori quando definiscono in anticipo le soglie di qualità, mantengono un percorso di escalation umana per i casi limite e monitorano sia i guadagni di produttività che i costi di errore nel tempo.

Rischi e guardrail

!

Gli annunci di lancio potrebbero superare la stabilità nei flussi di lavoro di produzione reali.

!

I prezzi delle API o i cambiamenti politici possono infrangere le ipotesi da un giorno all’altro.

!

La dipendenza da un unico fornitore aumenta i costi di lock-in e di migrazione.

Tabella di marcia per l'implementazione

1

Valuta i fornitori utilizzando le tue attività e i tuoi set di dati.

Valuta i fornitori utilizzando le tue attività e i tuoi set di dati. Tratta ogni passaggio come una prova: se i criteri non vengono soddisfatti, metti in pausa l'implementazione, colma il divario e solo allora espandi l'utilizzo.

2

Esamina la privacy, la sicurezza e i termini legali prima dell'integrazione.

Esamina la privacy, la sicurezza e i termini legali prima dell'integrazione. Tratta ogni passaggio come una prova: se i criteri non vengono soddisfatti, metti in pausa l'implementazione, colma il divario e solo allora espandi l'utilizzo.

3

Mantenere un piano di riserva tra modelli o fornitori.

Mantenere un piano di riserva tra modelli o fornitori. Tratta ogni passaggio come una prova: se i criteri non vengono soddisfatti, metti in pausa l'implementazione, colma il divario e solo allora espandi l'utilizzo.

4

Monitora le note di rilascio in modo che le modifiche alla roadmap non sorprendano i team.

Monitora le note di rilascio in modo che le modifiche alla roadmap non sorprendano i team. Tratta ogni passaggio come una prova: se i criteri non vengono soddisfatti, metti in pausa l'implementazione, colma il divario e solo allora espandi l'utilizzo.

Continua a esplorare