AGI (Intelligenza Generale Artificiale)
Un ipotetico sistema di intelligenza artificiale in grado di eseguire la maggior parte dei compiti intellettuali a livello umano in molti domini.
Terminologia tecnica essenziale spiegata al massimo livello di chiarezza. Progettato per ricercatori, studenti e formazione incentrata sull'uomo.
Mostrare 213 termini corrispondenti.
Un ipotetico sistema di intelligenza artificiale in grado di eseguire la maggior parte dei compiti intellettuali a livello umano in molti domini.
Un sistema software in grado di osservare, ragionare e intraprendere azioni per raggiungere un obiettivo, spesso utilizzando strumenti e memoria.
Il lavoro volto a far sì che i sistemi di intelligenza artificiale si comportino secondo le intenzioni, i valori e i vincoli di sicurezza umani.
Politiche, standard e meccanismi di supervisione che guidano il modo in cui l’intelligenza artificiale viene sviluppata e utilizzata nella società.
Un campo incentrato sulla riduzione di comportamenti dannosi, guasti e rischi di uso improprio nei sistemi di intelligenza artificiale.
Un insieme definito di regole o passaggi che un computer segue per risolvere un problema o completare un'attività.
Ingiustizia sistematica nei risultati del modello causata da dati, ipotesi o scelte di modellazione distorte.
Con quanta chiarezza la logica, le origini dati e le limitazioni di un sistema di intelligenza artificiale sono documentate e comprensibili.
Etichette o metadati aggiunti dall'uomo utilizzati per addestrare o valutare modelli di machine learning.
Un modo strutturato con cui un sistema software invia richieste e riceve risposte da un altro sistema.
L’ampio campo dei sistemi di costruzione che svolgono compiti che richiedono il riconoscimento di modelli, il ragionamento, il linguaggio o il processo decisionale.
Un componente del modello che si concentra dinamicamente sulle parti rilevanti di un input quando si produce un output.
Un sistema in grado di prendere decisioni e agire con un controllo umano diretto limitato o assente in tempo reale.
L'algoritmo di training principale che aggiorna i pesi del modello propagando gli errori di previsione all'indietro attraverso la rete.
Un semplice modello di riferimento utilizzato per confrontare se approcci più complessi migliorano effettivamente i risultati.
Un test o un set di dati standardizzato utilizzato per misurare e confrontare le prestazioni del modello.
Un modello coerente di errore o ingiustizia nei dati o nel comportamento del modello.
Set di dati molto grandi e complessi che richiedono tecniche di archiviazione ed elaborazione scalabili.
Un modello il cui ragionamento interno è difficilmente interpretabile direttamente dagli esseri umani.
Quanto bene i punteggi di confidenza di un modello corrispondono alle probabilità di correttezza effettive.
Uno stile di ragionamento in cui un modello di intelligenza artificiale scompone un problema in passaggi intermedi.
Un'attività in cui un modello assegna un input a una o più categorie predefinite.
Un modello progettato specificamente per compiti di classificazione.
Un'architettura del modello multimodale che apprende rappresentazioni condivise tra testo e immagini.
Le risorse di elaborazione necessarie per addestrare ed eseguire modelli, spesso misurate in FLOPS o ore GPU.
Il ramo dell'intelligenza artificiale che estrae significato da immagini e video.
La quantità massima di token di input che un modello linguistico può elaborare contemporaneamente.
Approcci di formazione che consentono a un modello di continuare ad apprendere dai nuovi dati senza dimenticare le conoscenze precedenti.
Un'architettura neurale ottimizzata per l'elaborazione di dati simili a griglia come le immagini.
Una funzione obiettivo comune utilizzata per addestrare modelli di classificazione penalizzando le probabilità errate.
Tecniche che creano esempi di training modificati per migliorare la generalizzazione del modello.
Uno spostamento nel tempo dei dati di input del mondo reale che può ridurre le prestazioni del modello.
Il processo di assegnazione di tag o output target ai dati grezzi per l'apprendimento supervisionato.
Una raccolta di esempi strutturati o non strutturati utilizzati per la formazione, la convalida o il test.
La superficie nello spazio delle caratteristiche che separa le classi previste da un classificatore.
Un modello che effettua previsioni attraverso una sequenza di suddivisioni delle funzionalità if-then.
Un sottoinsieme dell'apprendimento automatico che utilizza reti neurali a più livelli per l'apprendimento delle rappresentazioni.
Un'architettura generativa che impara a invertire il rumore per sintetizzare immagini, audio o altri contenuti.
Compressione della conoscenza da un modello di insegnante di grandi dimensioni in un modello di studente più piccolo.
Metodi che trasferiscono un modello addestrato in un dominio per ottenere prestazioni migliori in un altro dominio.
Una rappresentazione vettoriale numerica che cattura il significato semantico di testo, immagini o altri dati.
La componente di un modello che trasforma gli input in rappresentazioni latenti.
Combinazione di previsioni da più modelli per migliorare la robustezza o l'accuratezza.
Un set di dati conservato utilizzato per misurare la qualità del modello dopo l'addestramento.
Il grado in cui il comportamento di un modello può essere interpretato e spiegato agli esseri umani.
Una previsione errata in cui un modello perde un vero caso positivo.
Una previsione errata in cui un modello contrassegna erroneamente un caso negativo come positivo.
Una variabile di input utilizzata da un modello per effettuare previsioni.
Progettare o trasformare le variabili di input per rendere l'apprendimento più semplice ed efficace.
Conversione dei dati grezzi in funzionalità informative che un modello può utilizzare.
Apprendere o adattare il comportamento solo da un numero limitato di esempi.
Formazione continua su dati specifici del dominio per adattare un modello pre-addestrato a un compito specifico.
Un modello pre-addestrato di grandi dimensioni che può essere adattato a molte attività a valle.
Una capacità del modello per generare chiamate strutturate che attivano strumenti o API esterni.
Una configurazione generativa in cui un generatore e un discriminatore si addestrano l'uno contro l'altro.
Quanto bene un modello si comporta su dati nuovi e invisibili al di fuori del set di training.
Sistemi di intelligenza artificiale che producono nuovi contenuti come testo, immagini, audio, video o codice.
Un vettore che mostra quanto ciascun parametro dovrebbe cambiare per ridurre la perdita.
Un metodo di ottimizzazione che aggiorna i parametri nella direzione che riduce l'errore.
Etichette di riferimento affidabili utilizzate per addestrare o valutare gli output del modello.
Regole, verifiche e controlli che limitano il comportamento non sicuro o indesiderato del modello.
Quando un modello genera informazioni fluenti ma false o non supportate.
Un flusso di lavoro in cui gli esseri umani esaminano, guidano o sovrascrivono gli output dell'intelligenza artificiale.
Un valore di configurazione impostato prima dell'addestramento, ad esempio velocità di apprendimento, dimensione batch o profondità.
La capacità di un modello di seguire modelli tratti da esempi forniti direttamente nel prompt.
La fase di runtime in cui un modello addestrato genera previsioni o output.
La quantità di potenza di elaborazione consumata durante la produzione di ciascuna risposta.
Messa a punto di un modello sulle coppie istruzione-risposta per migliorare il follow-up del compito.
Prevedere lo scopo dell'utente da una query di testo per instradarla correttamente.
Una tecnica rapida intesa a bypassare i vincoli di sicurezza di un modello.
L'ultimo momento riflesso nei dati di training di un modello.
Addestrare un modello più piccolo per imitare i risultati di un modello più grande.
Una struttura grafica di entità e relazioni utilizzata per il ragionamento o il recupero.
Un metodo di regolarizzazione che ammorbidisce le etichette rigide per migliorare la generalizzazione.
Il tempo che intercorre tra l'invio di una richiesta e la ricezione dell'output del modello.
Un modello linguistico addestrato su enormi corpora di testo per generare e analizzare testo.
Un iperparametro di training che controlla la quantità di parametri che cambiano in ogni fase di aggiornamento.
Un metodo di regolazione fine efficiente in termini di parametri che aggiunge matrici di adattatori di basso rango.
Un obiettivo matematico che quantifica l'errore di previsione durante l'addestramento.
Metodi che consentono ai sistemi di apprendere modelli dai dati e migliorarli nel tempo.
Contesto archiviato che un agente AI utilizza attraverso passaggi o sessioni per migliorare la continuità.
Un'architettura con sottoreti specializzate in cui funzionano solo esperti selezionati per input.
Documentazione che descrive l'uso previsto, le metriche, le limitazioni e i rischi di un modello.
Degrado delle prestazioni nel tempo poiché le condizioni del mondo reale divergono dalle ipotesi di addestramento.
Riduzione della precisione numerica dei pesi del modello per ridurre i costi di memoria e inferenza.
Un modello in grado di elaborare o generare più tipi di dati come testo, immagine e audio.
Un'attività di PNL che identifica entità come persone, luoghi, date o organizzazioni.
Il ramo dell’intelligenza artificiale si concentra sulla comprensione e sulla generazione del linguaggio umano.
Un modello computazionale a strati ispirato ai neuroni e alle sinapsi biologici.
Trasformare i valori in una scala coerente per migliorare la stabilità dell'ottimizzazione.
Tecnologia che converte il testo in immagini o esegue la scansione in testo leggibile dalla macchina.
Un modello rilasciato con pesi o codici pubblici per l'ispezione, l'adattamento e il riutilizzo.
Quando un modello memorizza i dati di addestramento e funziona male con input invisibili.
Un peso appreso all'interno di un modello che ne influenza i risultati.
Metodi che adattano i modelli addestrando un piccolo sottoinsieme di parametri aggiunti.
Una metrica del modello linguistico che misura quanto il modello è sorpreso dai veri token successivi.
Un flusso di lavoro ordinato di pre-elaborazione, passaggi del modello e fasi di post-elaborazione.
La percentuale di positivi previsti che sono effettivamente corretti.
Formazione iniziale del modello su larga scala su dati ampi prima dell'adattamento a valle.
Le istruzioni di input e il contesto forniti a un modello generativo.
Progettazione di istruzioni per migliorare la qualità, l'affidabilità e la controllabilità dell'output.
Un modello di attacco in cui istruzioni dannose vengono inserite negli input del modello o nel contenuto recuperato.
Rimozione di pesi o neuroni del modello meno importanti per ridurre le dimensioni e il calcolo.
Conversione dei pesi del modello in formati con precisione inferiore come 8 bit o 4 bit.
Un metodo che recupera la conoscenza esterna e la alimenta nella generazione al momento dell'inferenza.
La percentuale di effettivi positivi che un modello identifica correttamente.
Una pipeline del modello che prevede le preferenze dell'utente per il posizionamento di contenuti o prodotti.
Sottoporre a stress test un sistema di intelligenza artificiale con suggerimenti contraddittori per rivelare fallimenti e rischi.
Formazione tramite segnali di ricompensa in cui un agente apprende azioni che massimizzano il rendimento a lungo termine.
Un metodo di training che utilizza segnali di preferenza umana per modellare il comportamento del modello.
Ricerca di documenti o record rilevanti da una fonte di conoscenza per una query.
Un modello che assegna un punteggio agli output in base ai segnali di preferenza, spesso utilizzato nelle pipeline RLHF.
La capacità di un modello di mantenere le prestazioni in condizioni di rumore, cambiamenti o input contrastanti.
Un livello di moderazione che blocca o riscrive gli input o gli output del modello non sicuri.
Una relazione empirica che mostra come le prestazioni migliorano con le dimensioni, i dati o il calcolo del modello.
Ricerca che corrisponde al significato anziché all'esatta sovrapposizione delle parole chiave, spesso utilizzando gli incorporamenti.
Apprendimento delle rappresentazioni da dati senza etichetta prevedendo parti mascherate o trasformate.
Un compito di PNL che classifica il tono emotivo o l'opinione nel testo.
Un modello linguistico compatto ottimizzato per latenza, costi o utilizzo sul dispositivo inferiori.
Un modello in cui molti parametri sono pari a zero o inattivi per ridurre il calcolo.
Addestramento di un modello con esempi etichettati che associano gli input agli output noti.
Dati generati artificialmente utilizzati per aumentare, simulare o proteggere dati di addestramento sensibili.
Un'istruzione ad alta priorità che imposta il comportamento, la policy e lo stile di risposta per un modello.
Un'impostazione di campionamento che controlla la casualità negli output generati.
Una porzione di testo elaborata da modelli linguistici, ad esempio una parola o un simbolo.
Il processo di suddivisione del testo in token per l'input del modello.
La capacità di un modello di chiamare strumenti esterni come ricerca, calcolatrici o API.
Una strategia di decodifica che campiona solo dai k token successivi più probabili.
Una strategia di decodifica che campiona dal set di token più piccolo la cui somma delle probabilità è p.
Applicare le conoscenze apprese in un compito o dominio per migliorare un altro compito.
Un'architettura neurale che utilizza l'attenzione per modellare le relazioni tra sequenze in parallelo.
Il valore dell'errore del modello calcolato durante l'addestramento e ottimizzato verso il basso nel tempo.
Modelli di apprendimento da dati non etichettati senza risultati target espliciti.
Un set di dati utilizzato durante lo sviluppo per ottimizzare i modelli e prevenire l'overfitting.
Un database ottimizzato per l'archiviazione e l'interrogazione di vettori di incorporamento ad alta dimensione.
Un modello multimodale che elabora congiuntamente informazioni visive e testuali.
Utilizzo di etichette rumorose, euristiche o parziali per addestrare i modelli quando le etichette pulite sono scarse.
Un valore numerico appreso che ridimensiona i segnali che passano attraverso una rete neurale.
Una rappresentazione vettoriale densa di parole che cattura le relazioni semantiche.
Tecniche e pratiche per rendere le previsioni dell'IA più trasparenti e comprensibili.
Risolvere compiti senza esempi specifici del compito basandosi su conoscenze generali pregresse.
Un processo in più fasi in cui un sistema di intelligenza artificiale pianifica, esegue, controlla i risultati e itera verso un obiettivo.
Il quadro normativo basato sul rischio dell’Unione Europea per i sistemi e i fornitori di IA.
Il costo aggiuntivo in termini di tempo, elaborazione o velocità del prodotto richiesto per rendere i sistemi più sicuri e controllabili.
Quando nei dati di addestramento sono presenti esempi di test di benchmark o varianti simili, le prestazioni riportate aumentano.
Metodi per stimare le relazioni di causa-effetto piuttosto che semplici correlazioni.
Un intervallo statistico che probabilmente contiene il valore reale di una metrica del modello misurato.
Un approccio di formazione e modellamento del comportamento in cui i risultati del modello sono guidati da un insieme fisso di principi scritti.
Un record della provenienza dei dati, di come sono stati trasformati e di dove vengono utilizzati.
L'origine, la proprietà e la storia documentate di un set di dati o di un artefatto del modello.
Una tecnica di privacy che aggiunge rumore statistico in modo che i singoli record non possano essere dedotti in modo affidabile dagli output.
Un modello più piccolo addestrato per imitare il comportamento di un modello più grande utilizzando meno calcolo durante l'inferenza.
Un modello specializzato per la conversione dei dati in vettori utilizzati per la ricerca semantica, il clustering e il recupero.
Un framework di valutazione ripetibile che esegue prompt, set di dati e logica di punteggio tra le versioni del modello.
Un sistema gestito per archiviare e fornire in modo coerente funzionalità ML convalidate per l'addestramento e l'inferenza.
Il grado in cui una risposta dell’IA è supportata dai dati di origine o dalle prove recuperate.
Una strategia di generazione che vincola i token di output a strutture valide o scelte conformi alle politiche.
Un modello addestrato sulle classifiche umane per prevedere quali risposte gli utenti probabilmente preferiranno.
Un'interfaccia API distribuita che riceve richieste di modello e restituisce previsioni in produzione.
Una raccolta curata di documenti o record utilizzati per il recupero, l'automazione del supporto o le risposte di base.
Uno spazio rappresentazionale compresso in cui concetti simili sono posizionati uno vicino all'altro come vettori.
Un catalogo centrale per il controllo delle versioni, l'approvazione e il monitoraggio dei modelli nei diversi ambienti.
Inferenza AI eseguita localmente sull'hardware dell'utente anziché in un servizio cloud remoto.
Logica che convalida e converte l'output del modello in strutture fortemente tipizzate e utilizzabili dalla macchina.
Un modello di prompt riutilizzabile con variabili, regole di formattazione e istruzioni specifiche per l'attività.
La percentuale di elementi recuperati pertinenti alla query dell'utente.
Un’argomentazione strutturata, supportata da prove, secondo cui un sistema di intelligenza artificiale è sicuro per un contesto d’uso definito.
Esecuzione di un modello in parallelo con il traffico di produzione senza influenzare le decisioni rivolte agli utenti.
Output del modello vincolato a uno schema definito come JSON, argomenti dello strumento o campi tipizzati.
Calcolo di inferenza aggiuntivo utilizzato durante la generazione della risposta per migliorare la qualità o il ragionamento.
Allineare la fiducia degli utenti negli output dell'intelligenza artificiale con l'effettiva affidabilità del sistema in ciascuna attività.
Prezzi in cui i costi aumentano in base alle chiamate API, ai token, al tempo di inferenza o al calcolo consumato.
Una policy in cui i payload di richiesta/risposta non vengono archiviati dopo l'elaborazione oltre le finestre operative di breve durata.
Un metodo di accelerazione dell'inferenza in cui una piccola bozza di modello propone token che un modello più grande verifica in parallelo.
Tensori di chiave e valore memorizzati da token precedenti che consentono ai trasformatori di generare nuovi token senza ricalcolare l'attenzione passata.
Un protocollo aperto che consente alle applicazioni di intelligenza artificiale di connettersi a strumenti esterni, origini dati e fornitori di contesto in modo standard.
Un ciclo iterativo in cui un agente AI osserva, pianifica, agisce e riflette finché non completa un obiettivo o raggiunge una condizione di arresto.
Uno schema di suggerimenti che alterna i passaggi del ragionamento con azioni di utilizzo degli strumenti per risolvere i compiti in modo più affidabile.
Un approccio di ragionamento in cui un modello esplora molteplici percorsi di soluzioni ramificate e seleziona quelli più promettenti.
Un metodo di formazione che ottimizza i modelli direttamente sulle coppie di preferenze senza bisogno di un modello di ricompensa separato.
Una tecnica di messa a punto che combina la quantizzazione del peso a 4 bit con gli adattatori LoRA per ridurre le esigenze di memoria.
Un algoritmo di attenzione ottimizzato che riduce l'utilizzo della memoria e accelera l'addestramento e l'inferenza del trasformatore.
Un meccanismo trasformatore che esegue diverse operazioni di attenzione in parallelo per catturare diversi tipi di relazioni.
Informazioni aggiunte agli incorporamenti di token in modo che i trasformatori possano distinguere l'ordine della sequenza.
Un metodo di codifica posizionale che ruota la query e i vettori chiave per codificare le posizioni relative dei token.
Un metodo di bias posizionale che penalizza i punteggi di attenzione in base alla distanza del token, aiutando i modelli a estrapolare contesti più lunghi.
Un modello di attenzione in cui ogni token si occupa solo di una finestra di dimensione fissa di token vicini per ridurre il calcolo.
Un algoritmo di tokenizzazione delle sottoparole che unisce le coppie di caratteri più frequenti in token riutilizzabili.
Un tokenizzatore indipendente dalla lingua che apprende le unità delle sottoparole direttamente dal testo non elaborato senza pre-divisione negli spazi bianchi.
Algoritmi che trovano vettori vicini a una query senza un confronto esaustivo, barattando l'esattezza con la velocità.
Una struttura di indice basata su grafici per la ricerca rapida e approssimativa del vicino più vicino su vettori ad alta dimensione.
Un modello che riordina un set iniziale di risultati recuperati per mettere in alto gli elementi più rilevanti.
Un approccio di recupero che combina la ricerca per parole chiave (lessicale) con la ricerca vettoriale (semantica) per un migliore richiamo e precisione.
Un modello che assegna un punteggio a una query e a un documento insieme in un unico passaggio per giudizi di pertinenza ad alta precisione.
Un modello che codifica query e documenti in vettori separati in modo che possano essere confrontati rapidamente su larga scala.
Utilizzare un modello linguistico per valutare o confrontare i risultati di altri modelli durante la valutazione.
Una metrica di valutazione del codice che misura la possibilità che almeno uno dei k campioni generati superi i test.
Un benchmark che testa modelli linguistici in 57 materie accademiche e professionali utilizzando domande a scelta multipla.
Un benchmark dei problemi di programmazione Python utilizzato per misurare la correttezza della generazione del codice tramite test unitari.
Un punto di riferimento per i problemi di parole matematiche delle scuole elementari utilizzato per valutare il ragionamento passo dopo passo nei modelli linguistici.
Quanto accuratamente le affermazioni di un modello corrispondono a informazioni verificabili nel mondo reale.
Riferimenti a passaggi o documenti originali inclusi nella risposta di un modello per supportare le sue affermazioni.
Incorporamento di un segnale rilevabile nel testo o nei media generati dall'intelligenza artificiale in modo che possa essere successivamente identificato come prodotto dalla macchina.
Una fase di formazione intermedia tra pre-formazione e post-formazione, spesso utilizzata per adattamenti di capacità o domini.
Passaggi di formazione applicati dopo la formazione preliminare, come l'ottimizzazione delle istruzioni, l'ottimizzazione delle preferenze e la messa a punto della sicurezza.
Una configurazione di formazione in cui un modello migliora generando dati attraverso interazioni o competizioni con copie di se stesso.
Un metodo di recupero che genera più varianti di query, recupera i risultati per ciascuna e fonde le classifiche.
Una tecnica di recupero che riscrive la query dell'utente in diverse varianti per migliorare il ricordo.
Un modello di recupero che ricerca piccole parti ma restituisce i documenti principali più grandi per un contesto più ricco.
Un algoritmo di decodifica che mantiene le prime sequenze candidate in ogni passaggio per trovare output con maggiore probabilità.
Un'impostazione di decodifica che riduce la probabilità dei token già prodotti dal modello per ridurre i loop.
Un'impostazione di decodifica che riduce la probabilità dei token proporzionalmente alla frequenza con cui sono apparsi finora.
Un'impostazione di decodifica che riduce la probabilità che i token siano apparsi, incoraggiando nuovi argomenti.