PRZEWODNIK FIRM

BigScience i model BLOOM

Przegląd

BigScience i model BLOOM najlepiej zrozumieć w kontekście strategii, dostępu do modelu, decyzji dotyczących platform i partnerstw ekosystemowych.

Głębokie nurkowanie

BigScience to roczne warsztaty badawcze prowadzone w latach 2021–2022, koordynowane przez Hugging Face i gromadzące ponad 1000 badaczy-wolontariuszy z ponad 60 krajów i 250 instytucji. Jego głównym produktem, opublikowanym w lipcu 2022 r., był BLOOM, model języka autoregresyjnego zawierający 176 miliardów parametrów. BLOOM był celowo wielojęzyczny, przeszkolony w oparciu o korpus ROOTS obejmujący 46 języków naturalnych i 13 języków programowania, z silną reprezentacją niedostatecznie reprezentowanych języków, takich jak kilka języków afrykańskich i południowoazjatyckich. Szkolenie trwało kilka miesięcy na finansowanym ze środków publicznych superkomputerze Jean Zay we Francji i korzystało z około 384 procesorów graficznych. BLOOM został wydany na licencji Odpowiedzialnej AI z pełną dokumentacją dotyczącą danych, szkoleń i zamierzonych zastosowań, co ostro kontrastuje z zamkniętym rozwojem porównywalnych modeli.

Wgląd techniczny

BLOOM to transformator przeznaczony wyłącznie do dekodera, o podobnej skali do GPT-3, wykorzystujący osadzanie pozycyjne ALiBi zamiast wyuczonych wektorów położenia, co pomaga mu ekstrapolować na dłuższe sekwencje niż w przypadku uczenia. Stosuje również normalizację warstwy osadzania, która poprawia stabilność treningu na dużą skalę. Wielojęzyczny korpus ROOTS został starannie zebrany i udokumentowany, tak aby mieszanka językowa i źródła danych były przejrzyste i możliwe do skontrolowania, co stanowi celowe odejście od nieprzejrzystych, zeskrobanych zbiorów danych.

Opanowanie BigScience i modelu BLOOM

BigScience to całoroczna, otwarta współpraca badawcza ponad 1000 badaczy, w wyniku której powstał BLOOM, jeden z pierwszych prawdziwie wielojęzycznych, publicznie udostępnianych modeli dużych języków. Ma znaczenie jako punkt orientacyjny w przejrzystej sztucznej inteligencji kierowanej przez społeczność zbudowanej poza Big Tech. BigScience i model BLOOM najlepiej zrozumieć w kontekście strategii, dostępu do modelu, decyzji dotyczących platform i partnerstw ekosystemowych. Aby zbudować głębokie zrozumienie, traktuj BigScience i model BLOOM jako model operacyjny, a nie pojedynczą funkcję: zdefiniuj pożądane wyniki, wyjaśnij założenia i oddziel to, co system może niezawodnie zrobić, od tego, co wciąż wymaga fachowej oceny.

W praktyce silne zespoły korzystające z BigScience i modelu BLOOM oceniają strategię dostawcy, niezawodność planu działania i ryzyko uzależnienia przed podjęciem decyzji. Dokumentują wyraźne kryteria sukcesu, testują realistyczne dane i przepływy pracy oraz wykonują iteracje w oparciu o zaobserwowane wzorce niepowodzeń, a nie jednorazowe zwycięstwa w testach porównawczych. W tym miejscu teoretyczne zrozumienie zamienia się w trwałe możliwości w zakresie produktu, polityki i operacji.

Plany dostawców wpływają na to, jakie funkcje Twój zespół będzie mógł dalej tworzyć. Jednocześnie ogłoszenia o uruchomieniu mogą przewyższyć stabilność rzeczywistych procesów produkcyjnych. Najbardziej odporne podejście polega na połączeniu szybkości eksperymentowania z dyscypliną zarządzania: przeprowadzanie programów pilotażowych, gromadzenie dowodów, publikowanie dzienników decyzji i ciągłe aktualizowanie zabezpieczeń w miarę ewolucji zachowań modelu, oczekiwań użytkowników i wymagań prawnych.

Wpływ strategiczny

Plany dostawców wpływają na to, jakie funkcje Twój zespół będzie mógł dalej tworzyć.

Plany dostawców wpływają na to, jakie funkcje Twój zespół będzie mógł dalej tworzyć. W przypadku wdrożeń wysokiej jakości przekłada się to na mierzalne zasady działania, granice własności i rytuały cyklicznych przeglądów, dzięki czemu zespoły mogą zwiększać pewność siebie zamiast skalować niejednoznaczność.

Warunki handlowe i opcje wdrożenia wpływają na długoterminowe koszty i ryzyko.

Warunki handlowe i opcje wdrożenia wpływają na długoterminowe koszty i ryzyko. W przypadku wdrożeń wysokiej jakości przekłada się to na mierzalne zasady działania, granice własności i rytuały cyklicznych przeglądów, dzięki czemu zespoły mogą zwiększać pewność siebie zamiast skalować niejednoznaczność.

Zachęty firmowe kształtują wady produktów, postawę bezpieczeństwa i otwartość.

Zachęty firmowe kształtują wady produktów, postawę bezpieczeństwa i otwartość. W przypadku wdrożeń wysokiej jakości przekłada się to na mierzalne zasady działania, granice własności i rytuały cyklicznych przeglądów, dzięki czemu zespoły mogą zwiększać pewność siebie zamiast skalować niejednoznaczność.

Przyszłość BigScience i Model BLOOM

BigScience pokazała, że możliwa jest sztuczna inteligencja na dużą skalę, zarządzana w sposób otwarty, a jej model wpłynął na późniejsze otwarte wersje oprogramowania i szersze dążenie do przejrzystości. Przyszłe prace wielojęzyczne będą prawdopodobnie opierać się na wnioskach z dokumentacji danych i włączającego zakresu języków, podczas gdy nowsze, bardziej wydajne modele przewyższają BLOOM pod względem surowych możliwości. Jego trwałym dziedzictwem jest norma publikowania kart modeli, zestawień danych i odpowiedzialnych licencji, a także dowód, że publiczne obliczenia mogą szkolić modele w pionierskiej skali.

Implementacja w świecie rzeczywistym

Generowanie i uzupełnianie tekstów w kilkudziesięciu językach, także tych nieobsługiwanych przez komercyjne modele

Służy jako otwarta baza badawcza do badania uprzedzeń, transferu wielojęzycznego i skalowania zachowań

Dostosowanie do wariantów specyficznych dla zadania lub instrukcji, takich jak BLOOMZ dla społeczności innych niż angielski

Udostępnienie w pełni udokumentowanego modelu pracownikom naukowym badającym pochodzenie danych szkoleniowych i odpowiedzialne licencjonowanie sztucznej inteligencji

Wzorce implementacyjne

BigScience i Model BLOOM w praktyce

Generowanie i uzupełnianie tekstów w kilkudziesięciu językach, także tych nieobsługiwanych przez komercyjne modele.

Generowanie i uzupełnianie tekstu w kilkudziesięciu językach, w tym w językach niedostatecznie obsługiwanych przez modele komercyjne Zespoły zwykle uzyskują lepsze wyniki, gdy z góry zdefiniują progi jakości, utrzymują ludzką ścieżkę eskalacji w przypadku przypadków brzegowych oraz śledzą zarówno wzrost produktywności, jak i koszty błędów w czasie.

BigScience i Model BLOOM w praktyce

Służy jako otwarta baza badawcza do badania uprzedzeń, transferu wielojęzycznego i skalowania zachowań.

Służy jako otwarta baza badawcza do badania uprzedzeń, transferu wielojęzycznego i zachowań skalowalnych. Zespoły zwykle uzyskują lepsze wyniki, gdy z góry zdefiniują progi jakości, utrzymują ludzką ścieżkę eskalacji w przypadku przypadków brzegowych i śledzą zarówno wzrost produktywności, jak i koszty błędów w czasie.

BigScience i Model BLOOM w praktyce

Dostosowanie do wariantów specyficznych dla zadania lub instrukcji, takich jak BLOOMZ dla społeczności innych niż angielski.

Dostosowywanie do wariantów dostosowanych do konkretnego zadania lub instrukcji, takich jak BLOOMZ dla społeczności innych niż angielski. Zespoły zwykle uzyskują lepsze wyniki, gdy z góry zdefiniują progi jakości, utrzymują ludzką ścieżkę eskalacji w przypadku przypadków brzegowych i śledzą zarówno wzrost produktywności, jak i koszty błędów w czasie.

BigScience i Model BLOOM w praktyce

Udostępnienie w pełni udokumentowanego modelu pracownikom naukowym badającym pochodzenie danych szkoleniowych i odpowiedzialne licencjonowanie sztucznej inteligencji.

Zapewnienie w pełni udokumentowanego modelu pracownikom naukowym badającym pochodzenie danych szkoleniowych i odpowiedzialne licencjonowanie sztucznej inteligencji. Zespoły zazwyczaj uzyskują lepsze wyniki, gdy z góry zdefiniują progi jakości, utrzymują ludzką ścieżkę eskalacji w przypadku przypadków brzegowych oraz śledzą zarówno wzrost produktywności, jak i koszty błędów w czasie.

Zagrożenia i poręcze

Ogłoszenia o wprowadzeniu na rynek mogą przekroczyć stabilność w rzeczywistych przepływach pracy.

Ceny interfejsów API lub zmiany zasad mogą z dnia na dzień złamać założenia.

Zależność od jednego dostawcy zwiększa koszty uzależnienia i migracji.

Plan wdrożenia

Oceniaj dostawców, korzystając z własnych zadań i zbiorów danych.

Oceniaj dostawców, korzystając z własnych zadań i zbiorów danych. Traktuj każdy krok jako bramkę dowodową: jeśli kryteria nie są spełnione, wstrzymaj wdrażanie, uzupełnij lukę i dopiero wtedy zwiększ wykorzystanie.

Przed integracją przejrzyj warunki dotyczące prywatności, bezpieczeństwa i prawa.

Przed integracją przejrzyj warunki dotyczące prywatności, bezpieczeństwa i prawa. Traktuj każdy krok jako bramkę dowodową: jeśli kryteria nie są spełnione, wstrzymaj wdrażanie, uzupełnij lukę i dopiero wtedy zwiększ wykorzystanie.

Utrzymuj plan awaryjny dla różnych modeli i dostawców.

Utrzymuj plan awaryjny dla różnych modeli i dostawców. Traktuj każdy krok jako bramkę dowodową: jeśli kryteria nie są spełnione, wstrzymaj wdrażanie, uzupełnij lukę i dopiero wtedy zwiększ wykorzystanie.

Monitoruj informacje o wersji, aby zmiany w planie działania nie zaskoczyły zespołów.

Monitoruj informacje o wersji, aby zmiany w planie działania nie zaskoczyły zespołów. Traktuj każdy krok jako bramkę dowodową: jeśli kryteria nie są spełnione, wstrzymaj wdrażanie, uzupełnij lukę i dopiero wtedy zwiększ wykorzystanie.

Odkrywaj dalej

OpenAI

Zobacz, jak działają czołowi dostawcy modeli podstawowych.

Przeczytaj Przewodnik

Otwarta sztuczna inteligencja

Porównaj ekosystemy modelu otwartego i zamkniętego.

Przeczytaj Przewodnik