AGI (Inteligenta Generala Artificiala)
Un sistem AI ipotetic care poate îndeplini majoritatea sarcinilor intelectuale la nivel uman în multe domenii.
Terminologie tehnică esențială explicată la cel mai înalt nivel de claritate. Proiectat pentru cercetători, studenți și educație centrată pe om.
Se arată 213 termeni de potrivire.
Un sistem AI ipotetic care poate îndeplini majoritatea sarcinilor intelectuale la nivel uman în multe domenii.
Un sistem software care poate observa, raționa și întreprinde acțiuni pentru a atinge un obiectiv, folosind adesea instrumente și memorie.
Lucrarea de a face sistemele AI să se comporte conform intențiilor umane, valorilor și constrângerilor de siguranță.
Politici, standarde și mecanisme de supraveghere care ghidează modul în care AI este dezvoltată și utilizată în societate.
Un domeniu axat pe reducerea comportamentului dăunător, a eșecurilor și a riscurilor de utilizare greșită în sistemele AI.
Un set definit de reguli sau pași pe care îi urmează un computer pentru a rezolva o problemă sau a finaliza o sarcină.
Nedreptate sistematică în rezultatele modelului cauzată de date, ipoteze sau opțiuni de modelare distorsionate.
Cât de clar sunt documentate și de înțeles logica, sursele de date și limitările unui sistem AI.
Etichete sau metadate adăugate de oameni utilizate pentru a instrui sau evalua modele de învățare automată.
O modalitate structurată pentru ca un sistem software să trimită cereri și să primească răspunsuri de la un alt sistem.
Domeniul larg al sistemelor de construcție care îndeplinesc sarcini care necesită recunoaștere a modelelor, raționament, limbaj sau luare a deciziilor.
O componentă de model care se concentrează dinamic asupra părților relevante ale unei intrări atunci când produce o ieșire.
Un sistem care poate lua decizii și acționa cu control uman limitat sau fără control uman direct în timp real.
Algoritmul de antrenament de bază care actualizează ponderile modelului prin propagarea erorilor de predicție înapoi prin rețea.
Un model de referință simplu folosit pentru a compara dacă abordările mai complexe îmbunătățesc efectiv rezultatele.
Un test standardizat sau un set de date utilizat pentru a măsura și compara performanța modelului.
Un model consistent de eroare sau incorectitudine în comportamentul datelor sau modelului.
Seturi de date foarte mari și complexe care necesită tehnici de stocare și procesare scalabile.
Un model al cărui raționament intern este greu de interpretat direct de oameni.
Cât de bine se potrivesc scorurile de încredere ale unui model cu probabilitățile reale de corectitudine.
Un stil de raționament în care un model AI descompune o problemă în pași intermediari.
O sarcină în care un model atribuie o intrare uneia sau mai multor categorii predefinite.
Un model conceput special pentru sarcini de clasificare.
O arhitectură model multimodală care învață reprezentări partajate între text și imagini.
Resursele de procesare necesare pentru antrenarea și rularea modelelor, adesea măsurate în ore FLOPS sau GPU.
Ramura AI care extrage sens din imagini și videoclipuri.
Cantitatea maximă de jetoane de intrare pe care un model de limbă poate procesa simultan.
Abordări de formare care permit unui model să continue să învețe din date noi, fără a uita cunoștințele anterioare.
O arhitectură neuronală optimizată pentru procesarea datelor asemănătoare grilei, cum ar fi imaginile.
O funcție obiectiv comună utilizată pentru a antrena modele de clasificare prin penalizarea probabilităților incorecte.
Tehnici care creează exemple de antrenament modificate pentru a îmbunătăți generalizarea modelului.
O schimbare a datelor de intrare din lumea reală în timp, care poate degrada performanța modelului.
Procesul de atribuire a etichetelor sau a rezultatelor țintă datelor brute pentru învățarea supravegheată.
O colecție de exemple structurate sau nestructurate utilizate pentru instruire, validare sau testare.
Suprafața din spațiul caracteristic care separă clasele prezise de un clasificator.
Un model care face predicții printr-o secvență de împărțiri de caracteristici dacă-atunci.
Un subset de învățare automată care utilizează rețele neuronale cu mai multe straturi pentru învățarea reprezentării.
O arhitectură generativă care învață să inverseze zgomotul pentru a sintetiza imagini, sunet sau alt conținut.
Comprimarea cunoștințelor de la un model de profesor mare într-un model de elev mai mic.
Metode care transferă un model antrenat într-un domeniu pentru a performa mai bine în alt domeniu.
O reprezentare vectorială numerică care surprinde semnificația semantică a textului, imaginilor sau a altor date.
Componenta unui model care transformă intrarea în reprezentări latente.
Combinarea predicțiilor din mai multe modele pentru a îmbunătăți robustețea sau acuratețea.
Un set de date păstrat folosit pentru a măsura calitatea modelului după antrenament.
Gradul în care comportamentul unui model poate fi interpretat și explicat oamenilor.
O predicție incorectă în care un model ratează un caz pozitiv adevărat.
O predicție incorectă în care un model semnalează incorect un caz negativ ca pozitiv.
O variabilă de intrare utilizată de un model pentru a face predicții.
Proiectarea sau transformarea variabilelor de intrare pentru a face învățarea mai ușoară și mai eficientă.
Conversia datelor brute în caracteristici informative pe care un model le poate folosi.
Învățarea sau adaptarea comportamentului dintr-un număr mic de exemple.
Formarea continuă cu privire la datele specifice domeniului pentru a adapta un model pre-antrenat la o anumită sarcină.
Un model mare pre-antrenat care poate fi adaptat la multe sarcini din aval.
O capacitate model de a genera apeluri structurate care declanșează instrumente externe sau API-uri.
O configurație generativă în care un generator și un discriminator se antrenează unul împotriva celuilalt.
Cât de bine funcționează un model pe date noi, nevăzute în afara setului de antrenament.
Sisteme AI care produc conținut nou, cum ar fi text, imagini, audio, video sau cod.
Un vector care arată cât de mult ar trebui să se schimbe fiecare parametru pentru a reduce pierderea.
O metodă de optimizare care actualizează parametrii în direcția care reduce eroarea.
Etichete de referință de încredere utilizate pentru instruirea sau evaluarea rezultatelor modelului.
Reguli, verificări și controale care limitează comportamentul nesigur sau nedorit al modelului.
Când un model generează informații fluente, dar false sau neacceptate.
Un flux de lucru în care oamenii revizuiesc, ghidează sau suprascriu ieșirile AI.
O valoare de configurare setată înainte de antrenament, cum ar fi rata de învățare, dimensiunea lotului sau adâncimea.
Capacitatea unui model de a urma tipare din exemplele furnizate direct în prompt.
Faza de rulare în care un model antrenat generează predicții sau rezultate.
Cantitatea de putere de procesare consumată în timpul producerii fiecărui răspuns.
Ajustarea fină a unui model de perechi instrucțiune-răspuns pentru a îmbunătăți urmărirea sarcinilor.
Prezicerea scopului utilizatorului dintr-o interogare text pentru a o ruta corect.
O tehnică promptă menită să ocolească constrângerile de siguranță ale unui model.
Cel mai recent moment din timp reflectat în datele de antrenament ale unui model.
Antrenarea unui model mai mic pentru a imita rezultatele unui model mai mare.
O structură grafică a entităților și relațiilor utilizate pentru raționament sau regăsire.
O metodă de regularizare care înmoaie etichetele dure pentru a îmbunătăți generalizarea.
Timpul dintre trimiterea unei cereri și primirea rezultatului modelului.
Un model de limbaj instruit pe corpuri de text masive pentru a genera și analiza text.
Un hiperparametru de antrenament care controlează cât de mult parametrii modifică fiecare pas de actualizare.
O metodă de reglare fină eficientă din punct de vedere al parametrilor care adaugă matrice adaptoare de rang scăzut.
Un obiectiv matematic care cuantifică eroarea de predicție în timpul antrenamentului.
Metode care permit sistemelor să învețe tipare din date și să se îmbunătățească în timp.
Context stocat pe care un agent AI îl folosește în pași sau sesiuni pentru a îmbunătăți continuitatea.
O arhitectură cu subrețele specializate în care doar experții selectați rulează per intrare.
Documentație care descrie utilizarea intenționată a unui model, valorile, limitările și riscurile.
Degradarea performanței în timp, deoarece condițiile din lumea reală diferă de ipotezele de antrenament.
Reducerea preciziei numerice a greutăților modelului pentru a reduce costurile de memorie și de inferență.
Un model care poate procesa sau genera mai multe tipuri de date, cum ar fi text, imagine și audio.
O sarcină NLP care identifică entități precum persoane, locuri, date sau organizații.
Ramura AI sa concentrat pe înțelegerea și generarea limbajului uman.
Un model de calcul stratificat inspirat de neuroni biologici și sinapse.
Transformarea valorilor la o scară consistentă pentru a îmbunătăți stabilitatea optimizării.
Tehnologie care convertește textul în imagini sau scanează în text care poate fi citit de mașină.
Un model lansat cu greutăți publice sau cod pentru inspecție, adaptare și reutilizare.
Când un model memorează datele de antrenament și are performanțe slabe la intrări nevăzute.
O greutate învățată în interiorul unui model care îi influențează rezultatele.
Metode care adaptează modelele prin antrenarea unui mic subset de parametri adăugați.
O metrică a modelului de limbă care măsoară cât de surprins este modelul de adevăratele simboluri următoare.
Un flux de lucru ordonat de preprocesare, pași de model și etape de postprocesare.
Proporția de pozitive prezise care sunt de fapt corecte.
Instruire inițială pe modele la scară largă pe date ample înainte de adaptarea în aval.
Instrucțiunile de intrare și contextul furnizate unui model generativ.
Proiectarea prompturilor pentru a îmbunătăți calitatea, fiabilitatea și controlabilitatea rezultatelor.
Un model de atac în care instrucțiuni rău intenționate sunt inserate în intrările modelului sau conținutul preluat.
Eliminarea greutăților modelului sau a neuronilor mai puțin importanți pentru a reduce dimensiunea și a calcula.
Conversia greutăților modelului în formate de precizie mai scăzută, cum ar fi 8 biți sau 4 biți.
O metodă care preia cunoștințe externe și le alimentează în generare la momentul deducerii.
Proporția de pozitive reale pe care un model le identifică corect.
O conductă de model care prezice preferințele utilizatorilor pentru clasarea conținutului sau a produselor.
Testarea la stres a unui sistem AI cu solicitări adverse pentru a dezvălui eșecurile și riscurile.
Antrenamentul prin recompensă semnalează în cazul în care un agent învață acțiuni care maximizează rentabilitatea pe termen lung.
O metodă de antrenament care utilizează semnale de preferințe umane pentru a modela comportamentul modelului.
Găsirea documentelor sau înregistrărilor relevante dintr-o sursă de cunoștințe pentru o interogare.
Un model care punctează ieșirile pe baza semnalelor de preferință, adesea folosit în conductele RLHF.
Capacitatea unui model de a menține performanța în condiții de zgomot, schimbări sau intrări adverse.
Un strat de moderare care blochează sau rescrie intrările sau ieșirile nesigure ale modelului.
O relație empirică care arată cum se îmbunătățește performanța cu dimensiunea modelului, datele sau calculul.
Căutare care se potrivește cu sensul mai degrabă decât cu suprapunerea exactă a cuvintelor cheie, folosind adesea înglobări.
Învățarea reprezentărilor din date neetichetate prin predicția părților mascate sau transformate.
O sarcină NLP care clasifică tonul emoțional sau opinia în text.
Un model de limbaj compact, optimizat pentru o latență, costuri sau o utilizare mai redusă pe dispozitiv.
Un model în care mulți parametri sunt zero sau inactivi pentru a reduce calculul.
Antrenarea unui model cu exemple etichetate care mapează intrările la ieșiri cunoscute.
Date generate artificial utilizate pentru a mări, simula sau proteja datele sensibile de antrenament.
O instrucțiune de înaltă prioritate care stabilește comportamentul, politica și stilul de răspuns pentru un model.
O setare de eșantionare care controlează aleatoritatea în ieșirile generate.
O bucată de text procesată de modele de limbaj, cum ar fi un cuvânt sau un simbol.
Procesul de împărțire a textului în jetoane pentru introducerea modelului.
Capacitatea unui model de a apela instrumente externe, cum ar fi căutarea, calculatoarele sau API-urile.
O strategie de decodare care prelevează numai din cele k cele mai probabile simboluri următoare.
O strategie de decodare care prelevează din cel mai mic set de jetoane ale cărui probabilități se însumează la p.
Aplicarea cunoștințelor învățate într-o sarcină sau domeniu pentru a îmbunătăți o altă sarcină.
O arhitectură neuronală care folosește atenția pentru a modela relațiile între secvențe în paralel.
Valoarea erorii modelului calculată în timpul antrenamentului și optimizată în scădere în timp.
Modele de învățare din date neetichetate fără rezultate țintă explicite.
Un set de date folosit în timpul dezvoltării pentru a regla modelele și pentru a preveni supraadaptarea.
O bază de date optimizată pentru stocarea și interogarea vectorilor de încorporare cu dimensiuni mari.
Un model multimodal care procesează împreună informațiile vizuale și textuale.
Utilizarea etichetelor zgomotoase, euristice sau parțiale pentru a antrena modele atunci când etichetele curate sunt rare.
O valoare numerică învățată care scalează semnalele care trec printr-o rețea neuronală.
O reprezentare vectorială densă a cuvintelor care captează relații semantice.
Tehnici și practici pentru a face predicțiile AI mai transparente și mai ușor de înțeles.
Rezolvarea sarcinilor fără exemple specifice sarcinii, bazându-se pe cunoștințele generale anterioare.
Un proces în mai mulți pași în care un sistem AI planifică, execută, verifică rezultatele și iterează către un obiectiv.
Cadrul de reglementare al Uniunii Europene bazat pe risc pentru sistemele și furnizorii de IA.
Costul suplimentar în timp, calcul sau viteza produsului necesar pentru a face sistemele mai sigure și mai controlabile.
Atunci când exemplele de teste de referință sau variante apropiate sunt prezente în datele de antrenament, umflarea performanței raportate.
Metode de estimare a relațiilor cauză-efect mai degrabă decât a corelațiilor simple.
Un interval statistic care conține probabil valoarea reală a unei valori ale modelului măsurat.
O abordare de formare și formare a comportamentului în care rezultatele modelului sunt ghidate de un set fix de principii scrise.
O înregistrare a de unde provin datele, cum au fost transformate și unde sunt utilizate.
Originea documentată, proprietatea și istoricul unui set de date sau al artefactului model.
O tehnică de confidențialitate care adaugă zgomot statistic, astfel încât înregistrările individuale să nu poată fi deduse în mod fiabil din rezultate.
Un model mai mic antrenat să imite comportamentul unui model mai mare, folosind mai puține calcule la inferență.
Un model specializat pentru conversia datelor în vectori utilizați pentru căutare semantică, grupare și regăsire.
Un cadru de evaluare repetabil care rulează solicitări, seturi de date și logica de punctare în toate versiunile de model.
Un sistem gestionat pentru stocarea și difuzarea caracteristicilor ML validate în mod consecvent pentru instruire și inferență.
Gradul în care un răspuns AI este susținut de date sursă sau de dovezi extrase.
O strategie de generare care constrânge jetoanele de ieșire la structuri valide sau la alegeri conforme cu politicile.
Un model antrenat pe clasamentele umane pentru a prezice ce răspunsuri vor prefera utilizatorii.
O interfață API implementată care primește cereri de model și returnează predicții în producție.
O colecție organizată de documente sau înregistrări utilizate pentru preluare, automatizare de sprijin sau răspunsuri de împământare.
Un spațiu de reprezentare comprimat în care concepte similare sunt poziționate unul lângă celălalt ca vectori.
Un catalog central pentru versiunea, aprobarea și urmărirea modelelor în medii.
Inferența AI efectuată local pe hardware-ul utilizatorului, mai degrabă decât într-un serviciu cloud la distanță.
Logica care validează și convertește rezultatele modelului în structuri puternic tipizate, utilizabile de mașină.
Un model de prompt reutilizabil cu variabile, reguli de formatare și instrucțiuni specifice sarcinii.
Proporția elementelor recuperate care sunt relevante pentru interogarea utilizatorului.
Un argument structurat, susținut de dovezi, că un sistem AI este sigur pentru un context definit de utilizare.
Rularea unui model în paralel cu traficul de producție, fără a afecta deciziile cu care se confruntă utilizatorii.
Ieșirea modelului este constrânsă la o schemă definită, cum ar fi JSON, argumente pentru instrumente sau câmpuri tipizate.
Calcul de inferență suplimentar utilizat în timpul generării răspunsului pentru a îmbunătăți calitatea sau raționamentul.
Alinierea încrederii utilizatorilor în ieșirile AI cu fiabilitatea reală a sistemului în fiecare sarcină.
Prețuri la care costurile cresc cu apeluri API, token-uri, timp de inferență sau calcul consumat.
O politică în care sarcinile utile de solicitare/răspuns nu sunt stocate după procesare dincolo de ferestrele operaționale de scurtă durată.
O metodă de accelerare a inferenței în care un model nefinalizat propune simboluri pe care un model mai mare le verifică în paralel.
Tensorii chei și valorii stocați din jetoanele anterioare care permit transformatorilor să genereze noi jetoane fără a recalcula atenția din trecut.
Un protocol deschis care permite aplicațiilor AI să se conecteze la instrumente externe, surse de date și furnizori de context într-un mod standard.
Un ciclu iterativ în care un agent AI observă, planifică, acționează și reflectă până când atinge un obiectiv sau atinge o condiție de oprire.
Un model de îndemnare care intercalează pașii de raționament cu acțiuni de utilizare a instrumentelor pentru a rezolva sarcinile mai fiabil.
O abordare de raționament în care un model explorează mai multe căi de soluție de ramificare și le selectează pe cele mai promițătoare.
O metodă de antrenament care ajustează modelele direct pe perechile de preferințe, fără a avea nevoie de un model de recompensă separat.
O tehnică de reglare fină care combină cuantificarea greutății pe 4 biți cu adaptoare LoRA pentru a reduce nevoile de memorie.
Un algoritm de atenție optimizat care reduce utilizarea memoriei și accelerează antrenamentul și inferența transformatorului.
Un mecanism transformator care rulează mai multe operațiuni de atenție în paralel pentru a capta diferite tipuri de relații.
Informații adăugate la înglobarea jetonelor, astfel încât transformatoarele să poată distinge ordinea secvenței.
O metodă de codificare pozițională care rotește vectorii de interogare și cheie pentru a codifica pozițiile relative ale simbolurilor.
O metodă de părtinire pozițională care penalizează scorurile de atenție pe baza distanței simbol, ajutând modelele să extrapoleze în contexte mai lungi.
Un model de atenție în care fiecare jeton se ocupă doar de o fereastră de dimensiune fixă a jetonelor din apropiere pentru a reduce calculul.
Un algoritm de tokenizare a subcuvintelor care îmbină cele mai frecvente perechi de caractere în simboluri reutilizabile.
Un tokenizer agnostic de limbă care învață unitățile de subcuvinte direct din textul brut fără a împărți în prealabil spațiile albe.
Algoritmi care găsesc vectori aproape de o interogare fără o comparație exhaustivă, schimbând exactitatea cu viteza.
O structură de index bazată pe grafic pentru căutarea rapidă aproximativă a celui mai apropiat vecin pe vectori cu dimensiuni mari.
Un model care reordonează un set inițial de rezultate preluate pentru a pune cele mai relevante elemente în partea de sus.
O abordare de recuperare care combină căutarea prin cuvinte cheie (lexicale) cu căutarea vectorială (semantică) pentru o mai bună reamintire și precizie.
Un model care punctează o interogare și un document împreună într-o singură trecere pentru judecăți de relevanță de mare precizie.
Un model care codifică interogările și documentele în vectori separați, astfel încât acestea să poată fi comparate rapid la scară.
Utilizarea unui model lingvistic pentru a nota sau a compara rezultate de la alte modele în timpul evaluării.
O metrică de evaluare a codului care măsoară șansa ca cel puțin unul dintre k eșantioane generate să treacă testele.
Un etalon de testare a modelelor lingvistice pe 57 de materii academice și profesionale folosind întrebări cu răspunsuri multiple.
Un punct de referință al problemelor de programare Python utilizat pentru a măsura corectitudinea generării codului prin teste unitare.
Un punct de referință al problemelor de cuvinte de matematică din școală, folosit pentru a evalua raționamentul pas cu pas în modelele lingvistice.
Cât de precis se potrivesc afirmațiile unui model cu informațiile verificabile din lumea reală.
Referințe la pasaje sau documente sursă incluse în răspunsul unui model pentru a susține afirmațiile acestuia.
Încorporarea unui semnal detectabil în text sau media generat de AI, astfel încât să poată fi identificat ulterior ca produs de mașină.
O fază intermediară de antrenament între pretraining și post-training, adesea folosită pentru ajustări de capacitate sau de domeniu.
Pași de antrenament aplicați după antrenament preliminar, cum ar fi reglarea instrucțiunilor, optimizarea preferințelor și reglarea siguranței.
O configurație de antrenament în care un model se îmbunătățește prin generarea de date prin interacțiuni sau competiții cu copii ale lui însuși.
O metodă de recuperare care generează mai multe variante de interogare, preia rezultatele pentru fiecare și contopește clasamentele.
O tehnică de recuperare care rescrie interogarea utilizatorului în mai multe variante pentru a îmbunătăți rememorarea.
Un model de recuperare care caută bucăți mici, dar returnează documentele părinte mai mari pentru un context mai bogat.
Un algoritm de decodare care păstrează primele câteva secvențe candidate la fiecare pas pentru a găsi rezultate cu probabilitate mai mare.
O setare de decodare care scade probabilitatea de jetoane pe care modelul le-a produs deja pentru a reduce buclele.
O setare de decodare care reduce probabilitatea de jetoane proporțional cu cât de des au apărut până acum.
O setare de decodare care reduce probabilitatea de apariție a jetoanelor, încurajând subiecte noi.