AGI (obecná umělá inteligence)
Hypotetický systém umělé inteligence, který může provádět většinu intelektuálních úkolů na lidské úrovni v mnoha oblastech.
Základní technická terminologie vysvětlená na nejvyšší úrovni srozumitelnosti. Navrženo pro výzkumníky, studenty a vzdělávání zaměřené na člověka.
Zobrazení 213 odpovídající termíny.
Hypotetický systém umělé inteligence, který může provádět většinu intelektuálních úkolů na lidské úrovni v mnoha oblastech.
Softwarový systém, který dokáže pozorovat, uvažovat a podnikat kroky k dosažení cíle, často pomocí nástrojů a paměti.
Práce na tom, aby se systémy AI chovaly podle lidských záměrů, hodnot a bezpečnostních omezení.
Zásady, standardy a mechanismy dohledu, které řídí vývoj a používání umělé inteligence ve společnosti.
Oblast zaměřená na snižování škodlivého chování, selhání a rizik zneužití v systémech umělé inteligence.
Definovaná sada pravidel nebo kroků, kterými se počítač řídí, aby vyřešil problém nebo dokončil úkol.
Systematická nespravedlnost ve výstupech modelu způsobená zkreslenými daty, předpoklady nebo volbami modelování.
Jak jasně jsou zdokumentovány a srozumitelné logika systému AI, zdroje dat a omezení.
Štítky nebo metadata přidaná člověkem k trénování nebo vyhodnocování modelů strojového učení.
Strukturovaný způsob, jak jeden softwarový systém posílat požadavky a přijímat odpovědi z jiného systému.
Široká oblast budování systémů, které provádějí úkoly vyžadující rozpoznávání vzorů, uvažování, jazyk nebo rozhodování.
Komponenta modelu, která se při vytváření výstupu dynamicky zaměřuje na relevantní části vstupu.
Systém, který může činit rozhodnutí a jednat s omezenou nebo žádnou přímou lidskou kontrolou v reálném čase.
Základní trénovací algoritmus, který aktualizuje váhy modelu šířením chyb predikce zpět po síti.
Jednoduchý referenční model používaný k porovnání, zda složitější přístupy skutečně zlepšují výsledky.
Standardizovaný test nebo soubor dat používaný k měření a porovnávání výkonu modelu.
Konzistentní vzorec chyb nebo nespravedlivosti v chování dat nebo modelu.
Velmi velké a složité datové sady, které vyžadují škálovatelné techniky ukládání a zpracování.
Model, jehož vnitřní uvažování je pro člověka obtížné přímo interpretovat.
Jak dobře skóre spolehlivosti modelu odpovídá skutečným pravděpodobnostem správnosti.
Styl uvažování, kdy model AI rozkládá problém na mezikroky.
Úloha, kde model přiřadí vstup jedné nebo více předdefinovaným kategoriím.
Model navržený speciálně pro klasifikační úlohy.
Architektura multimodálního modelu, která se učí sdílené reprezentace mezi textem a obrázky.
Zdroje zpracování potřebné k trénování a spuštění modelů, často měřené v hodinách FLOPS nebo GPU.
Větev umělé inteligence, která získává význam z obrázků a videa.
Maximální množství vstupních tokenů, které jazykový model dokáže zpracovat najednou.
Tréninkové přístupy, které umožňují modelu neustále se učit z nových dat, aniž by zapomínal na předchozí znalosti.
Neuronová architektura optimalizovaná pro zpracování dat podobných mřížce, jako jsou obrázky.
Běžná objektivní funkce používaná k trénování klasifikačních modelů penalizací nesprávných pravděpodobností.
Techniky, které vytvářejí upravené tréninkové příklady pro zlepšení zobecnění modelu.
Časový posun ve vstupních datech reálného světa, který může snížit výkon modelu.
Proces přiřazování značek nebo cílových výstupů k nezpracovaným datům pro učení pod dohledem.
Sbírka strukturovaných nebo nestrukturovaných příkladů používaných pro školení, ověřování nebo testování.
Povrch v prostoru prvků, který odděluje třídy předpovězené klasifikátorem.
Model, který vytváří předpovědi prostřednictvím sekvence rozdělení prvků if-then.
Podmnožina strojového učení, která používá vícevrstvé neuronové sítě pro učení reprezentace.
Generativní architektura, která se učí zvrátit šum za účelem syntézy obrázků, zvuku nebo jiného obsahu.
Komprese znalostí z velkého modelu učitele do menšího modelu studenta.
Metody, které přenášejí model trénovaný v jedné doméně k lepšímu výkonu v jiné doméně.
Číselná vektorová reprezentace, která zachycuje sémantický význam textu, obrázků nebo jiných dat.
Komponenta modelu, která transformuje vstup na latentní reprezentace.
Kombinace předpovědí z více modelů pro zlepšení robustnosti nebo přesnosti.
Zadržená datová sada používaná k měření kvality modelu po školení.
Míra, do jaké lze chování modelu interpretovat a vysvětlit lidem.
Nesprávná předpověď, kdy modelu chybí skutečný pozitivní případ.
Nesprávná předpověď, kdy model nesprávně označí negativní případ jako pozitivní.
Vstupní proměnná používaná modelem k vytváření předpovědí.
Navrhování nebo transformace vstupních proměnných, aby bylo učení jednodušší a efektivnější.
Převádění nezpracovaných dat na informativní funkce, které může model používat.
Naučit se nebo přizpůsobit chování pouze z malého počtu příkladů.
Pokračující školení o datech specifických pro doménu, aby bylo možné předem trénovaný model přizpůsobit konkrétnímu úkolu.
Velký předtrénovaný model, který lze přizpůsobit mnoha následným úkolům.
Schopnost modelu generovat strukturovaná volání, která spouštějí externí nástroje nebo rozhraní API.
Generativní nastavení, kde generátor a diskriminátor trénují proti sobě.
Jak dobře si model vede na nových, neviditelných datech mimo trénovací sadu.
Systémy umělé inteligence, které vytvářejí nový obsah, jako je text, obrázky, zvuk, video nebo kód.
Vektor ukazující, jak moc by se měl každý parametr změnit, aby se snížila ztráta.
Optimalizační metoda, která aktualizuje parametry ve směru, který snižuje chyby.
Důvěryhodné referenční štítky používané k trénování nebo hodnocení výstupů modelu.
Pravidla, kontroly a ovládací prvky, které omezují nebezpečné nebo nežádoucí chování modelu.
Když model generuje plynulé, ale nepravdivé nebo nepodporované informace.
Pracovní postup, kde lidé kontrolují, vedou nebo přepisují výstupy AI.
Hodnota konfigurace nastavená před školením, jako je rychlost učení, velikost dávky nebo hloubka.
Schopnost modelu sledovat vzory z příkladů uvedených přímo ve výzvě.
Fáze běhu, kdy trénovaný model generuje předpovědi nebo výstupy.
Množství výpočetního výkonu spotřebovaného při vytváření každé odpovědi.
Jemné doladění modelu na párech instrukce-odpověď pro zlepšení plnění úkolů.
Předpovídání účelu uživatele z textového dotazu k jeho správnému směrování.
Rychlá technika určená k obcházení bezpečnostních omezení modelu.
Poslední bod v čase, který se odráží v tréninkových datech modelu.
Trénink menšího modelu, aby napodobil výstupy většího modelu.
Grafová struktura entit a vztahů používaných k uvažování nebo vyhledávání.
Metoda regularizace, která změkčuje tvrdé štítky pro zlepšení zobecnění.
Doba mezi odesláním požadavku a přijetím výstupu modelu.
Jazykový model trénovaný na masivních textových korpusech pro generování a analýzu textu.
Tréninkový hyperparametr, který řídí, jak moc se parametry mění v každém kroku aktualizace.
Parametrově efektivní metoda jemného ladění, která přidává matice adaptérů nízké úrovně.
Matematický cíl, který kvantifikuje chybu predikce během tréninku.
Metody, které umožňují systémům učit se vzory z dat a zlepšovat se v průběhu času.
Uložený kontext, který agent AI používá v krocích nebo relacích ke zlepšení kontinuity.
Architektura se specializovanými podsítěmi, kde na jeden vstup běží pouze vybraní experti.
Dokumentace popisující zamýšlené použití modelu, metriky, omezení a rizika.
Snižování výkonu v průběhu času s tím, jak se podmínky v reálném světě liší od tréninkových předpokladů.
Snížení numerické přesnosti modelových vah za účelem snížení nákladů na paměť a odvození.
Model, který dokáže zpracovat nebo generovat více typů dat, jako je text, obrázek a zvuk.
Úloha NLP, která identifikuje entity, jako jsou lidé, místa, data nebo organizace.
Obor umělé inteligence se zaměřil na porozumění a generování lidského jazyka.
Vrstvený výpočtový model inspirovaný biologickými neurony a synapsemi.
Transformace hodnot na konzistentní měřítko pro zlepšení stability optimalizace.
Technologie, která převádí text v obrázcích nebo skenech na strojově čitelný text.
Model uvolněný s veřejnými váhami nebo kódem pro kontrolu, přizpůsobení a opětovné použití.
Když si model zapamatuje trénovací data a na neviditelných vstupech funguje špatně.
Naučená váha uvnitř modelu, která ovlivňuje jeho výstupy.
Metody, které přizpůsobují modely trénováním malé podmnožiny přidaných parametrů.
Metrika jazykového modelu měřící, jak překvapený je model skutečnými dalšími tokeny.
Uspořádaný pracovní postup předzpracování, kroky modelu a fáze následného zpracování.
Podíl předpokládaných pozitiv, které jsou skutečně správné.
Počáteční školení modelů ve velkém měřítku na širokých datech před následnou adaptací.
Vstupní instrukce a kontext poskytnuté generativnímu modelu.
Návrh vybízí ke zlepšení kvality výstupu, spolehlivosti a ovladatelnosti.
Vzor útoku, kdy jsou škodlivé instrukce vkládány do modelových vstupů nebo načteného obsahu.
Odstranění méně důležitých závaží modelu nebo neuronů pro snížení velikosti a výpočtu.
Konverze modelových vah do formátů s nižší přesností, jako je 8bitový nebo 4bitový.
Metoda, která získává externí znalosti a dodává je do generace v době odvození.
Podíl skutečných pozitiv, které model správně identifikuje.
Modelový kanál, který předpovídá preference uživatelů pro hodnocení obsahu nebo produktů.
Zátěžové testování systému AI s nepřátelskými výzvami k odhalení selhání a rizik.
Trénink pomocí signálů odměn, kdy se agent učí akce, které maximalizují dlouhodobou návratnost.
Tréninková metoda, která využívá signály lidských preferencí k formování chování modelu.
Vyhledání relevantních dokumentů nebo záznamů ze zdroje znalostí pro dotaz.
Model, který hodnotí výstupy na základě preferenčních signálů, často používaný v potrubích RLHF.
Schopnost modelu udržovat výkon pod hlukem, posuny nebo nepříznivými vstupy.
Vrstva moderování, která blokuje nebo přepisuje nebezpečné vstupy nebo výstupy modelu.
Empirický vztah ukazující, jak se výkon zlepšuje s velikostí modelu, daty nebo výpočtem.
Vyhledávání, které odpovídá významu spíše než přesnému překrývání klíčových slov, často pomocí vkládání.
Učení reprezentací z neoznačených dat předpovídáním maskovaných nebo transformovaných částí.
Úkol NLP, který klasifikuje emocionální tón nebo názor v textu.
Kompaktní jazykový model optimalizovaný pro nižší latenci, náklady nebo použití na zařízení.
Model, kde je mnoho parametrů nulových nebo neaktivních, aby se omezil výpočet.
Trénink modelu s označenými příklady, které mapují vstupy na známé výstupy.
Uměle generovaná data používaná k rozšíření, simulaci nebo ochraně citlivých tréninkových dat.
Instrukce s vysokou prioritou, která nastavuje chování, politiku a styl odezvy pro model.
Nastavení vzorkování kontrolující náhodnost generovaných výstupů.
Část textu zpracovaná jazykovými modely, jako je slovo nebo symbol.
Proces rozdělení textu na tokeny pro zadání modelu.
Schopnost modelu volat externí nástroje, jako je vyhledávání, kalkulačky nebo rozhraní API.
Strategie dekódování, která vzorkuje pouze z k nejpravděpodobnějších dalších tokenů.
Strategie dekódování, která vzorkuje z nejmenší sady tokenů, jejíž pravděpodobnosti jsou součtem p.
Aplikace znalostí získaných v jednom úkolu nebo doméně ke zlepšení jiného úkolu.
Neuronová architektura, která využívá pozornost k paralelnímu modelování vztahů napříč sekvencemi.
Hodnota chyby modelu vypočítaná během tréninku a optimalizována směrem dolů v průběhu času.
Učení vzorů z neoznačených dat bez explicitních cílových výstupů.
Datový soubor používaný během vývoje k vyladění modelů a zabránění nadměrnému přizpůsobení.
Databáze optimalizovaná pro ukládání a dotazování vysokorozměrných vektorů pro vkládání.
Multimodální model, který společně zpracovává vizuální a textové informace.
Použití hlučných, heuristických nebo částečných štítků k trénování modelů, když jsou čisté štítky vzácné.
Naučená číselná hodnota, která škáluje signály procházející neuronovou sítí.
Hustá vektorová reprezentace slov zachycující sémantické vztahy.
Techniky a postupy pro zprůhlednění a srozumitelnost předpovědí umělé inteligence.
Řešení úkolů bez konkrétních příkladů na základě předchozích obecných znalostí.
Vícestupňový proces, kdy systém umělé inteligence plánuje, provádí, kontroluje výsledky a iteruje směrem k cíli.
Regulační rámec Evropské unie pro systémy a poskytovatele umělé inteligence založený na rizicích.
Dodatečné náklady na čas, výpočet nebo rychlost produktu potřebné k tomu, aby byly systémy bezpečnější a lépe ovladatelné.
Jsou-li v tréninkových datech přítomny příklady srovnávacích testů nebo blízké varianty, dochází ke zvýšení vykazovaného výkonu.
Metody pro odhadování vztahů příčina-následek spíše než jednoduché korelace.
Statistický rozsah, který pravděpodobně obsahuje skutečnou hodnotu měřené metriky modelu.
Tréninkový a behaviorální přístup, kde se výstupy modelu řídí pevně daným souborem písemných principů.
Záznam o tom, odkud data pocházejí, jak byla transformována a kde se používají.
Dokumentovaný původ, vlastnictví a historie datové sady nebo artefaktu modelu.
Technika ochrany soukromí, která přidává statistický šum, takže jednotlivé záznamy nelze z výstupů spolehlivě odvodit.
Menší model trénovaný tak, aby napodoboval chování většího modelu při použití méně výpočtů při odvození.
Model specializovaný na konverzi dat na vektory používané pro sémantické vyhledávání, shlukování a načítání.
Opakovatelný hodnotící rámec, který spouští výzvy, datové sady a logiku bodování napříč verzemi modelu.
Spravovaný systém pro konzistentní ukládání a poskytování ověřených funkcí ML pro školení a vyvozování.
Míra, do jaké je odpověď AI podporována zdrojovými daty nebo získanými důkazy.
Strategie generování, která omezuje výstupní tokeny na platné struktury nebo volby vyhovující zásadám.
Model trénovaný na hodnocení lidí, aby mohl předvídat, jaké reakce budou uživatelé pravděpodobně preferovat.
Nasazené rozhraní API, které přijímá požadavky na model a vrací předpovědi v produkci.
Spravovaná sbírka dokumentů nebo záznamů používaných pro vyhledávání, podporu automatizace nebo uzemňovací reakce.
Komprimovaný reprezentační prostor, kde jsou podobné koncepty umístěny blízko sebe jako vektory.
Centrální katalog pro verzování, schvalování a sledování modelů napříč prostředími.
Odvozování AI se provádí lokálně na uživatelském hardwaru, nikoli ve vzdálené cloudové službě.
Logika, která ověřuje a převádí výstup modelu do silně typovaných, strojově použitelných struktur.
Opakovaně použitelný vzor výzvy s proměnnými, pravidly formátování a pokyny pro konkrétní úkoly.
Podíl načtených položek, které jsou relevantní pro dotaz uživatele.
Strukturovaný argument podpořený důkazy, že systém umělé inteligence je bezpečný pro definovaný kontext použití.
Spuštění modelu souběžně s produkčním provozem bez ovlivnění rozhodování uživatele.
Výstup modelu omezený na definované schéma, jako je JSON, argumenty nástroje nebo typovaná pole.
Další inferenční výpočet používaný během generování odezvy ke zlepšení kvality nebo uvažování.
Sladění uživatelské důvěry ve výstupy AI se skutečnou spolehlivostí systému v každém úkolu.
Ceny, kde se náklady škálují pomocí volání API, tokenů, doby odvození nebo spotřebovaného výpočtu.
Zásada, kdy datové části požadavku/odpovědi nejsou ukládány po zpracování mimo krátkodobá provozní okna.
Metoda zrychlení inference, kdy malý koncept modelu navrhuje tokeny, které větší model ověřuje paralelně.
Uložené tenzory klíčů a hodnot z předchozích tokenů, které umožňují transformátorům generovat nové tokeny bez přepočítávání minulé pozornosti.
Otevřený protokol, který umožňuje aplikacím umělé inteligence připojit se k externím nástrojům, zdrojům dat a poskytovatelům kontextu standardním způsobem.
Iterativní cyklus, kdy agent umělé inteligence pozoruje, plánuje, jedná a reflektuje, dokud nesplní cíl nebo nedosáhne podmínky zastavení.
Vzor výzvy, který prokládá kroky uvažování s akcemi pomocí nástroje, aby se úkoly vyřešily spolehlivěji.
Uvažovací přístup, kdy model zkoumá více cest větvení řešení a vybírá ty nejslibnější.
Tréninková metoda, která dolaďuje modely přímo na preferenčních párech bez nutnosti samostatného modelu odměn.
Technika jemného ladění, která kombinuje 4bitovou kvantizaci hmotnosti s adaptéry LoRA pro snížení potřeby paměti.
Optimalizovaný algoritmus pozornosti, který snižuje využití paměti a urychluje trénování a vyvozování transformátorů.
Mechanismus transformátoru, který paralelně spouští několik operací pozornosti k zachycení různých typů vztahů.
Informace přidané do vložení tokenů, aby transformátory mohly rozlišit pořadí sekvencí.
Metoda pozičního kódování, která otáčí dotazovací a klíčové vektory za účelem kódování relativních pozic tokenů.
Metoda pozičního zkreslení, která penalizuje skóre pozornosti na základě tokenové vzdálenosti a pomáhá modelům extrapolovat na delší kontexty.
Vzor pozornosti, kde se každý token věnuje pouze oknu blízkých tokenů s pevnou velikostí, aby se snížil počet výpočtů.
Algoritmus tokenizace podslov, který spojuje nejčastější dvojice znaků do znovu použitelných tokenů.
Jazykově agnostický tokenizér, který se učí jednotky podslov přímo z nezpracovaného textu bez předběžného dělení na mezery.
Algoritmy, které najdou vektory blízko dotazu bez vyčerpávajícího porovnávání, střídající přesnost za rychlost.
Struktura indexu založená na grafu pro rychlé přibližné vyhledávání nejbližšího souseda přes vysokorozměrné vektory.
Model, který změní pořadí počáteční sady načtených výsledků tak, aby byly nejrelevantnější položky umístěny nahoře.
Přístup k vyhledávání, který kombinuje klíčové (lexikální) vyhledávání s vektorovým (sémantickým) vyhledáváním pro lepší zapamatování a přesnost.
Model, který hodnotí dotaz a dokument společně v jednom průchodu pro vysoce přesné posouzení relevance.
Model, který kóduje dotazy a dokumenty do samostatných vektorů, takže je lze rychle porovnávat v měřítku.
Použití jazykového modelu k hodnocení nebo porovnání výstupů z jiných modelů během hodnocení.
Metrika kódového hodnocení měřící šanci, že alespoň jeden z k generovaných vzorků projde testy.
Srovnávací testování jazykových modelů napříč 57 akademickými a odbornými předměty pomocí otázek s výběrem z více možností.
Srovnávací test problémů programování v Pythonu používaný k měření správnosti generování kódu pomocí jednotkových testů.
Srovnávací test slovních úloh z matematiky pro základní školy používaný k vyhodnocení postupného uvažování v jazykových modelech.
Jak přesně se tvrzení modelu shodují s ověřitelnými informacemi ze skutečného světa.
Odkazy na zdrojové pasáže nebo dokumenty zahrnuté v odpovědi modelu na podporu jeho tvrzení.
Vložení detekovatelného signálu do textu nebo média generovaného umělou inteligencí, aby jej bylo možné později identifikovat jako strojově vyrobený.
Střední tréninková fáze mezi předtréninkem a po tréninku, často používaná pro úpravy schopností nebo domény.
Školicí kroky aplikované po předběžném školení, jako je ladění instrukcí, optimalizace preferencí a ladění bezpečnosti.
Tréninkové nastavení, kde se model zlepšuje generováním dat prostřednictvím interakcí nebo soutěží se svými kopiemi.
Metoda vyhledávání, která generuje více variant dotazů, načítá výsledky pro každou z nich a spojuje hodnocení.
Technika vyhledávání, která přepisuje uživatelský dotaz do několika variant, aby se zlepšilo vyvolání.
Vzor načítání, který prohledává malé části, ale vrací jejich větší nadřazené dokumenty pro bohatší kontext.
Algoritmus dekódování, který v každém kroku udržuje několik nejlepších kandidátských sekvencí, aby nalezl výstupy s vyšší pravděpodobností.
Nastavení dekódování, které snižuje pravděpodobnost tokenů, které již model vytvořil, aby se omezily smyčky.
Nastavení dekódování, které snižuje pravděpodobnost tokenů úměrně tomu, jak často se dosud objevovaly.
Nastavení dekódování, které snižuje pravděpodobnost, že se tokeny vůbec objevily, a podněcují nová témata.