AGI (sztuczna inteligencja ogólna)
Hipotetyczny system sztucznej inteligencji, który może wykonywać większość zadań intelektualnych na poziomie człowieka w wielu dziedzinach.
Niezbędna terminologia techniczna wyjaśniona na najwyższym poziomie przejrzystości. Przeznaczony dla badaczy, studentów i edukacji skupionej na człowieku.
Pokaz 213 pasujące warunki.
Hipotetyczny system sztucznej inteligencji, który może wykonywać większość zadań intelektualnych na poziomie człowieka w wielu dziedzinach.
System oprogramowania, który potrafi obserwować, rozumować i podejmować działania, aby osiągnąć cel, często przy użyciu narzędzi i pamięci.
Praca nad zapewnieniem, aby systemy AI zachowywały się zgodnie z ludzkimi intencjami, wartościami i ograniczeniami bezpieczeństwa.
Polityki, standardy i mechanizmy nadzoru, które kierują rozwojem i wykorzystaniem sztucznej inteligencji w społeczeństwie.
Dziedzina skupiająca się na ograniczaniu szkodliwych zachowań, awarii i ryzyka niewłaściwego użycia w systemach AI.
Zdefiniowany zestaw reguł lub kroków, które wykonuje komputer, aby rozwiązać problem lub wykonać zadanie.
Systematyczna niesprawiedliwość wyników modelu spowodowana wypaczonymi danymi, założeniami lub wyborami dotyczącymi modelowania.
Jak jasno logika, źródła danych i ograniczenia systemu AI są udokumentowane i zrozumiałe.
Etykiety lub metadane dodane przez człowieka używane do uczenia lub oceniania modeli uczenia maszynowego.
Ustrukturyzowany sposób wysyłania żądań przez jeden system oprogramowania i otrzymywania odpowiedzi z innego systemu.
Szeroka dziedzina budowania systemów wykonujących zadania wymagające rozpoznawania wzorców, rozumowania, języka lub podejmowania decyzji.
Komponent modelu, który podczas tworzenia wyniku dynamicznie koncentruje się na odpowiednich częściach danych wejściowych.
System, który może podejmować decyzje i działać w czasie rzeczywistym przy ograniczonej bezpośredniej kontroli człowieka lub bez niej.
Podstawowy algorytm szkoleniowy, który aktualizuje wagi modeli poprzez propagację błędów przewidywań wstecz w sieci.
Prosty model referencyjny używany do porównania, czy bardziej złożone podejścia faktycznie poprawiają wyniki.
Standaryzowany test lub zbiór danych używany do pomiaru i porównania wydajności modelu.
Spójny wzorzec błędów lub nieuczciwości w danych lub zachowaniu modelu.
Bardzo duże i złożone zbiory danych, które wymagają skalowalnych technik przechowywania i przetwarzania.
Model, którego wewnętrzne rozumowanie jest trudne do bezpośredniej interpretacji przez człowieka.
Jak dobrze wyniki pewności modelu odpowiadają rzeczywistym prawdopodobieństwom poprawności.
Styl rozumowania, w którym model sztucznej inteligencji rozkłada problem na etapy pośrednie.
Zadanie, w którym model przypisuje dane wejściowe do jednej lub większej liczby predefiniowanych kategorii.
Model zaprojektowany specjalnie do zadań klasyfikacyjnych.
Architektura modelu multimodalnego, która uczy się wspólnych reprezentacji tekstu i obrazów.
Zasoby przetwarzania wymagane do uczenia i uruchamiania modeli, często mierzone w FLOPS lub godzinach GPU.
Gałąź sztucznej inteligencji, która wydobywa znaczenie z obrazów i wideo.
Maksymalna ilość tokenów wejściowych, które model języka może przetworzyć jednocześnie.
Podejścia szkoleniowe, które pozwalają modelowi uczyć się na nowych danych, nie zapominając o wcześniejszej wiedzy.
Architektura neuronowa zoptymalizowana pod kątem przetwarzania danych przypominających siatkę, takich jak obrazy.
Powszechna funkcja celu używana do uczenia modeli klasyfikacyjnych poprzez karanie nieprawidłowych prawdopodobieństw.
Techniki tworzenia zmodyfikowanych przykładów szkoleniowych w celu poprawy generalizacji modelu.
Zmiana rzeczywistych danych wejściowych w czasie, która może obniżyć wydajność modelu.
Proces przypisywania znaczników lub docelowych wyników do surowych danych w celu uczenia się pod nadzorem.
Zbiór ustrukturyzowanych i nieustrukturyzowanych przykładów używanych do szkolenia, walidacji lub testowania.
Powierzchnia w przestrzeni cech oddzielająca klasy przewidywane przez klasyfikator.
Model, który dokonuje prognoz na podstawie sekwencji podziałów funkcji „jeśli-to”.
Podzbiór uczenia maszynowego wykorzystujący wielowarstwowe sieci neuronowe do uczenia się poprzez reprezentację.
Architektura generatywna, która uczy się odwracać szum w celu syntezy obrazów, dźwięku lub innej treści.
Kompresja wiedzy z modelu dużego nauczyciela do modelu mniejszego ucznia.
Metody, które przenoszą model wyszkolony w jednej domenie, aby działał lepiej w innej domenie.
Numeryczna reprezentacja wektorowa, która oddaje semantyczne znaczenie tekstu, obrazów i innych danych.
Składnik modelu, który przekształca dane wejściowe w ukryte reprezentacje.
Łączenie prognoz z wielu modeli w celu poprawy niezawodności i dokładności.
Przetrzymywany zbiór danych używany do pomiaru jakości modelu po szkoleniu.
Stopień, w jakim zachowanie modelu można zinterpretować i wyjaśnić ludziom.
Nieprawidłowa prognoza, w przypadku której model pomija prawdziwie pozytywny przypadek.
Nieprawidłowa prognoza, gdy model błędnie oznacza przypadek negatywny jako pozytywny.
Zmienna wejściowa używana przez model do tworzenia prognoz.
Projektowanie lub przekształcanie zmiennych wejściowych, aby nauka była łatwiejsza i skuteczniejsza.
Konwertowanie surowych danych na funkcje informacyjne, z których może korzystać model.
Uczenie się lub dostosowywanie zachowań na podstawie niewielkiej liczby przykładów.
Kontynuowanie szkolenia na danych specyficznych dla domeny w celu dostosowania wstępnie wyszkolonego modelu do konkretnego zadania.
Duży, wstępnie przeszkolony model, który można dostosować do wielu dalszych zadań.
Możliwość modelu generowania wywołań strukturalnych, które uruchamiają zewnętrzne narzędzia lub interfejsy API.
Układ generatywny, w którym generator i dyskryminator trenują przeciwko sobie.
Jak dobrze model radzi sobie z nowymi, niewidocznymi danymi spoza zbioru szkoleniowego.
Systemy sztucznej inteligencji, które tworzą nową treść, taką jak tekst, obrazy, dźwięk, wideo lub kod.
Wektor pokazujący, jak bardzo powinien zmienić się każdy parametr, aby zmniejszyć straty.
Metoda optymalizacji, która aktualizuje parametry w kierunku zmniejszającym błąd.
Zaufane etykiety referencyjne używane do uczenia lub oceniania wyników modelu.
Reguły, kontrole i kontrole ograniczające niebezpieczne lub niepożądane zachowanie modelu.
Kiedy model generuje płynne, ale fałszywe lub nieobsługiwane informacje.
Przepływ pracy, w którym ludzie przeglądają, kierują lub zastępują wyniki AI.
Wartość konfiguracji ustawiona przed szkoleniem, taka jak szybkość uczenia się, rozmiar partii lub głębokość.
Zdolność modelu do podążania za wzorcami z przykładów podanych bezpośrednio w monicie.
Faza środowiska uruchomieniowego, w której przeszkolony model generuje prognozy lub dane wyjściowe.
Ilość mocy obliczeniowej zużywanej podczas generowania każdej odpowiedzi.
Dostrajanie modelu par instrukcja-odpowiedź w celu poprawy wykonywania zadań.
Przewidywanie celu użytkownika na podstawie zapytania tekstowego w celu prawidłowego skierowania go.
Szybka technika mająca na celu ominięcie ograniczeń bezpieczeństwa modelu.
Ostatni punkt w czasie odzwierciedlony w danych szkoleniowych modelu.
Trenowanie mniejszego modelu w celu imitowania wyników większego modelu.
Struktura wykresu jednostek i relacji używana do wnioskowania lub wyszukiwania.
Metoda regularyzacji, która łagodzi twarde etykiety, aby poprawić generalizację.
Czas między wysłaniem żądania a otrzymaniem danych wyjściowych modelu.
Model językowy wytrenowany na ogromnych korpusach tekstowych w celu generowania i analizowania tekstu.
Hiperparametr szkoleniowy kontrolujący stopień zmiany parametrów w każdym kroku aktualizacji.
Efektywna pod względem parametrów metoda dostrajania, która dodaje macierze adapterów niskiego rzędu.
Cel matematyczny, który określa ilościowo błąd przewidywania podczas uczenia.
Metody umożliwiające systemom uczenie się wzorców na podstawie danych i ulepszanie ich w miarę upływu czasu.
Przechowywany kontekst, którego agent AI używa na różnych etapach lub sesjach, aby poprawić ciągłość.
Architektura z wyspecjalizowanymi podsieciami, w której na wejściu działają tylko wybrani eksperci.
Dokumentacja opisująca zamierzone zastosowanie modelu, metryki, ograniczenia i ryzyko.
Spadek wydajności z biegiem czasu, gdy warunki rzeczywiste odbiegają od założeń szkoleniowych.
Zmniejszenie precyzji numerycznej wag modeli w celu zmniejszenia kosztów pamięci i wnioskowania.
Model, który może przetwarzać lub generować wiele typów danych, takich jak tekst, obraz i dźwięk.
Zadanie NLP, które identyfikuje jednostki, takie jak ludzie, miejsca, daty lub organizacje.
Gałąź sztucznej inteligencji skupiała się na rozumieniu i generowaniu ludzkiego języka.
Warstwowy model obliczeniowy inspirowany neuronami biologicznymi i synapsami.
Przekształcanie wartości do spójnej skali w celu poprawy stabilności optymalizacji.
Technologia konwertująca tekst na obrazach lub skanach na tekst do odczytu maszynowego.
Model wydany z publicznymi wagami lub kodem do kontroli, adaptacji i ponownego użycia.
Kiedy model zapamiętuje dane szkoleniowe i słabo radzi sobie z niewidocznymi danymi wejściowymi.
Wyuczona waga wewnątrz modelu, która wpływa na jego wyniki.
Metody dostosowujące modele poprzez uczenie małego podzbioru dodanych parametrów.
Metryka modelu językowego mierząca stopień zaskoczenia modelu prawdziwymi następnymi tokenami.
Uporządkowany przepływ pracy obejmujący przetwarzanie wstępne, etapy modelu i etapy przetwarzania końcowego.
Odsetek przewidywanych pozytywów, które są faktycznie prawidłowe.
Wstępne szkolenie w zakresie modeli na dużą skalę na szerokich danych przed adaptacją na późniejszym etapie.
Instrukcje wejściowe i kontekst dostarczony do modelu generatywnego.
Projektowanie podpowiedzi poprawiających jakość wydruku, niezawodność i sterowalność.
Wzór ataku polegający na wstawianiu złośliwych instrukcji do danych wejściowych modelu lub pobranej treści.
Usuwanie mniej ważnych wag modelu lub neuronów w celu zmniejszenia rozmiaru i obliczeń.
Konwertowanie wag modeli na formaty o niższej precyzji, takie jak 8-bitowe lub 4-bitowe.
Metoda, która pobiera wiedzę zewnętrzną i przekazuje ją do generowania w momencie wnioskowania.
Proporcja rzeczywistych pozytywów, które model poprawnie identyfikuje.
Potok modelowy, który przewiduje preferencje użytkownika dotyczące rankingu treści lub produktów.
Testowanie warunków skrajnych systemu sztucznej inteligencji za pomocą przeciwstawnych monitów w celu wykrycia błędów i zagrożeń.
Szkolenie za pomocą sygnałów nagrody, podczas którego agent uczy się działań maksymalizujących długoterminowy zwrot.
Metoda szkoleniowa wykorzystująca sygnały preferencji ludzkich do kształtowania zachowań modelu.
Znalezienie odpowiednich dokumentów lub zapisów ze źródła wiedzy dla zapytania.
Model oceniający wyniki na podstawie sygnałów preferencji, często używany w potokach RLHF.
Zdolność modelu do utrzymania wydajności w warunkach hałasu, przesunięć lub bodźców kontradyktoryjnych.
Warstwa moderacji, która blokuje lub przepisuje niebezpieczne dane wejściowe lub wyjściowe modelu.
Zależność empiryczna pokazująca, jak wydajność poprawia się wraz z rozmiarem modelu, danymi lub obliczeniami.
Szukaj, które pasuje do znaczenia, a nie do dokładnego nakładania się słów kluczowych, często przy użyciu osadzania.
Uczenie się reprezentacji na podstawie nieoznaczonych danych poprzez przewidywanie zamaskowanych lub przekształconych części.
Zadanie NLP, które klasyfikuje ton emocjonalny lub opinię w tekście.
Kompaktowy model języka zoptymalizowany pod kątem niższych opóźnień, kosztów i wykorzystania na urządzeniu.
Model, w którym wiele parametrów ma wartość zerową lub jest nieaktywnych, aby ograniczyć obliczenia.
Trenowanie modelu za pomocą oznaczonych przykładów, które mapują dane wejściowe na znane dane wyjściowe.
Sztucznie wygenerowane dane wykorzystywane do wzmacniania, symulowania lub ochrony wrażliwych danych szkoleniowych.
Instrukcja o wysokim priorytecie, która ustawia zachowanie, zasady i styl odpowiedzi dla modelu.
Ustawienie próbkowania kontrolujące losowość generowanych wyników.
Fragment tekstu przetwarzany przez modele językowe, taki jak fragment słowa lub symbol.
Proces dzielenia tekstu na tokeny na potrzeby wprowadzania danych modelu.
Zdolność modelu do wywoływania narzędzi zewnętrznych, takich jak wyszukiwanie, kalkulatory lub interfejsy API.
Strategia dekodowania, która pobiera próbki tylko z k najprawdopodobniej kolejnych tokenów.
Strategia dekodowania polegająca na próbkowaniu z najmniejszego zestawu tokenów, którego prawdopodobieństwa sumują się do p.
Stosowanie wiedzy zdobytej w jednym zadaniu lub domenie w celu ulepszenia innego zadania.
Architektura neuronowa, która skupia uwagę na równoległym modelowaniu relacji między sekwencjami.
Wartość błędu modelu obliczona podczas uczenia i optymalizowana w dół w czasie.
Wzorce uczenia się na podstawie nieoznaczonych danych bez wyraźnych docelowych wyników.
Zbiór danych używany podczas programowania w celu dostrojenia modeli i zapobiegania nadmiernemu dopasowaniu.
Baza danych zoptymalizowana do przechowywania i wykonywania zapytań o wielowymiarowe wektory osadzania.
Model multimodalny, który wspólnie przetwarza informację wizualną i tekstową.
Używanie hałaśliwych, heurystycznych lub częściowych etykiet do uczenia modeli, gdy brakuje czystych etykiet.
Wyuczona wartość liczbowa skalująca sygnały przechodzące przez sieć neuronową.
Gęsta reprezentacja wektorowa słów odzwierciedlająca relacje semantyczne.
Techniki i praktyki zwiększające przejrzystość i zrozumienie przewidywań AI.
Rozwiązywanie zadań bez konkretnych przykładów w oparciu o wcześniejszą wiedzę ogólną.
Wieloetapowy proces, podczas którego system sztucznej inteligencji planuje, wykonuje, sprawdza wyniki i iteruje w stronę celu.
Ramy regulacyjne Unii Europejskiej oparte na ryzyku dotyczące systemów i dostawców sztucznej inteligencji.
Dodatkowy koszt czasu, obliczeń lub szybkości produktu wymagany do zwiększenia bezpieczeństwa i kontroli systemów.
Gdy w danych szkoleniowych znajdują się przykłady testów porównawczych lub zbliżone warianty, co zawyża raportowaną wydajność.
Metody szacowania związków przyczynowo-skutkowych zamiast prostych korelacji.
Zakres statystyczny, który prawdopodobnie zawiera prawdziwą wartość mierzonej metryki modelu.
Podejście polegające na szkoleniu i kształtowaniu zachowań, w którym wyniki modelu opierają się na ustalonym zestawie pisemnych zasad.
Rejestr tego, skąd pochodzą dane, w jaki sposób zostały przekształcone i gdzie są wykorzystywane.
Udokumentowane pochodzenie, własność i historia zbioru danych lub artefaktu modelu.
Technika prywatności, która dodaje szum statystyczny, uniemożliwiając wiarygodne wywnioskowanie poszczególnych zapisów z wyników.
Mniejszy model wyszkolony do naśladowania zachowania większego modelu przy mniejszym wykorzystaniu mocy obliczeniowej przy wnioskowaniu.
Model specjalizujący się w konwertowaniu danych na wektory używane do wyszukiwania semantycznego, grupowania i wyszukiwania.
Powtarzalna struktura oceny, która uruchamia podpowiedzi, zbiory danych i logikę oceniania w różnych wersjach modelu.
Zarządzany system do przechowywania i udostępniania zweryfikowanych funkcji ML w sposób spójny na potrzeby uczenia i wnioskowania.
Stopień, w jakim reakcja sztucznej inteligencji jest poparta danymi źródłowymi lub uzyskanymi dowodami.
Strategia generowania, która ogranicza tokeny wyjściowe do prawidłowych struktur lub wyborów zgodnych z zasadami.
Model wyszkolony na podstawie rankingów ludzkich w celu przewidywania, które odpowiedzi będą prawdopodobnie preferowane przez użytkowników.
Wdrożony interfejs API, który odbiera żądania modelu i zwraca prognozy w środowisku produkcyjnym.
Wyselekcjonowany zbiór dokumentów lub zapisów używanych do wyszukiwania, automatyzacji wsparcia lub odpowiedzi uziemiających.
Skompresowana przestrzeń reprezentacyjna, w której podobne pojęcia są umieszczone blisko siebie jako wektory.
Centralny katalog do wersjonowania, zatwierdzania i śledzenia modeli w różnych środowiskach.
Wnioskowanie AI odbywa się lokalnie na sprzęcie użytkownika, a nie w zdalnej usłudze w chmurze.
Logika, która sprawdza i konwertuje dane wyjściowe modelu na struktury o silnym typie, nadające się do użytku maszynowego.
Wzór podpowiedzi wielokrotnego użytku ze zmiennymi, regułami formatowania i instrukcjami specyficznymi dla zadania.
Proporcja pobranych elementów, które są istotne dla zapytania użytkownika.
Ustrukturyzowany argument poparty dowodami, że system sztucznej inteligencji jest bezpieczny w określonym kontekście użycia.
Uruchamianie modelu równolegle z ruchem produkcyjnym bez wpływu na decyzje podejmowane przez użytkownika.
Dane wyjściowe modelu ograniczone do zdefiniowanego schematu, takiego jak JSON, argumenty narzędzia lub pola wpisane.
Dodatkowe obliczenia wnioskowania wykorzystywane podczas generowania odpowiedzi w celu poprawy jakości lub rozumowania.
Dostosowanie zaufania użytkowników do wyników AI do rzeczywistej niezawodności systemu w każdym zadaniu.
Ceny, w których koszty skalują się w zależności od wywołań API, tokenów, czasu wnioskowania lub zużytych mocy obliczeniowych.
Zasada, zgodnie z którą ładunki żądań/odpowiedzi nie są przechowywane po przetworzeniu poza krótkotrwałe okna operacyjne.
Metoda przyspieszania wnioskowania, w której model o małej wersji roboczej proponuje tokeny, które większy model weryfikuje równolegle.
Przechowywane tensory klucza i wartości z poprzednich tokenów, które pozwalają transformatorom generować nowe tokeny bez ponownego obliczania uwagi z przeszłości.
Otwarty protokół, który umożliwia aplikacjom AI łączenie się z zewnętrznymi narzędziami, źródłami danych i dostawcami kontekstu w standardowy sposób.
Cykl iteracyjny, w którym agent AI obserwuje, planuje, działa i zastanawia się, dopóki nie osiągnie celu lub nie osiągnie warunku zatrzymania.
Wzorzec podpowiedzi, który przeplata etapy rozumowania z działaniami związanymi z użyciem narzędzi w celu bardziej niezawodnego rozwiązywania zadań.
Podejście oparte na wnioskowaniu, w którym model bada wiele rozgałęzionych ścieżek rozwiązań i wybiera te najbardziej obiecujące.
Metoda uczenia, która dostraja modele bezpośrednio na parach preferencji, bez konieczności stosowania osobnego modelu nagrody.
Technika dostrajania, która łączy 4-bitową kwantyzację wagi z adapterami LoRA w celu zmniejszenia zapotrzebowania na pamięć.
Zoptymalizowany algorytm uwagi, który zmniejsza zużycie pamięci i przyspiesza uczenie i wnioskowanie transformatora.
Mechanizm transformatorowy, który uruchamia kilka operacji uwagi równolegle, aby uchwycić różne typy relacji.
Informacje dodane do osadzania tokenów, aby transformatory mogły rozróżnić kolejność sekwencji.
Metoda kodowania pozycyjnego, która obraca wektory zapytań i kluczy w celu zakodowania względnych pozycji tokenów.
Metoda błędu pozycyjnego, która penalizuje wyniki uwagi na podstawie odległości symbolicznej, pomagając modelom ekstrapolować na dłuższe konteksty.
Wzorzec uwagi, w którym każdy token obsługuje tylko okno pobliskich tokenów o stałym rozmiarze, aby zmniejszyć obliczenia.
Algorytm tokenizacji podsłów, który łączy najczęstsze pary znaków w tokeny wielokrotnego użytku.
Tokenizator niezależny od języka, który uczy się jednostek podsłów bezpośrednio z nieprzetworzonego tekstu bez wstępnego dzielenia na białe znaki.
Algorytmy, które znajdują wektory blisko zapytania bez wyczerpującego porównania, zamieniając dokładność na szybkość.
Struktura indeksu oparta na grafach do szybkiego przybliżonego wyszukiwania najbliższego sąsiada na wektorach wielowymiarowych.
Model, który zmienia kolejność początkowego zestawu pobranych wyników, tak aby najbardziej odpowiednie elementy były umieszczane na górze.
Metoda wyszukiwania, która łączy wyszukiwanie według słów kluczowych (leksykalne) z wyszukiwaniem wektorowym (semantycznym) w celu lepszego zapamiętywania i precyzji.
Model, który ocenia zapytanie i dokument jednocześnie w jednym przebiegu, co pozwala na bardzo dokładną ocenę trafności.
Model, który koduje zapytania i dokumenty w osobne wektory, dzięki czemu można je szybko porównywać na dużą skalę.
Używanie modelu językowego do oceniania lub porównywania wyników innych modeli podczas ewaluacji.
Metryka oceny kodu mierząca szansę, że co najmniej jedna z k wygenerowanych próbek przejdzie testy.
Test porównawczy testujący modele językowe z 57 przedmiotów akademickich i zawodowych za pomocą pytań wielokrotnego wyboru.
Test porównawczy problemów programistycznych w języku Python używany do pomiaru poprawności generowania kodu za pomocą testów jednostkowych.
Test porównawczy problemów tekstowych z matematyki w szkole podstawowej, używany do oceny rozumowania krok po kroku w modelach językowych.
Jak dokładnie twierdzenia modelu odpowiadają możliwym do zweryfikowania informacjom ze świata rzeczywistego.
Odniesienia do fragmentów źródłowych lub dokumentów zawartych w odpowiedzi modelki na poparcie jej twierdzeń.
Osadzanie wykrywalnego sygnału w tekście lub mediach wygenerowanych przez sztuczną inteligencję, aby można było go później zidentyfikować jako wyprodukowany maszynowo.
Pośrednia faza szkolenia pomiędzy szkoleniem przedtreningowym a szkoleniem poszkoleniowym, często wykorzystywana w celu dostosowania zdolności lub domeny.
Etapy treningu stosowane po treningu wstępnym, takie jak dostrajanie instrukcji, optymalizacja preferencji i dostrajanie bezpieczeństwa.
Konfiguracja szkoleniowa, w której model jest ulepszany poprzez generowanie danych w drodze interakcji lub konkursów z jego kopiami.
Metoda wyszukiwania, która generuje wiele wariantów zapytań, pobiera wyniki dla każdego z nich i łączy rankingi.
Technika wyszukiwania polegająca na przepisaniu zapytania użytkownika na kilka wariantów w celu lepszego zapamiętywania.
Wzorzec wyszukiwania, który przeszukuje małe fragmenty, ale zwraca większe dokumenty nadrzędne w celu uzyskania bogatszego kontekstu.
Algorytm dekodowania, który utrzymuje kilka najlepszych sekwencji kandydujących na każdym kroku, aby znaleźć wyniki o większym prawdopodobieństwie.
Ustawienie dekodowania, które zmniejsza prawdopodobieństwo żetonów już wyprodukowanych przez model w celu ograniczenia pętli.
Ustawienie dekodowania, które zmniejsza prawdopodobieństwo pojawienia się tokenów proporcjonalnie do tego, jak często pojawiały się one do tej pory.
Ustawienie dekodowania, które zmniejsza prawdopodobieństwo pojawienia się tokenów, zachęcając do nowych tematów.