AGI (Intelligence Générale Artificielle)
Un système d’IA hypothétique capable d’effectuer la plupart des tâches intellectuelles au niveau humain dans de nombreux domaines.
Terminologie technique essentielle expliquée avec le plus haut niveau de clarté. Conçu pour les chercheurs, les étudiants et l’éducation centrée sur l’humain.
Affichage 213 termes correspondants.
Un système d’IA hypothétique capable d’effectuer la plupart des tâches intellectuelles au niveau humain dans de nombreux domaines.
Un système logiciel capable d'observer, de raisonner et de prendre des mesures pour atteindre un objectif, souvent en utilisant des outils et de la mémoire.
Le travail consistant à faire en sorte que les systèmes d’IA se comportent conformément aux intentions, aux valeurs et aux contraintes de sécurité humaines.
Politiques, normes et mécanismes de surveillance qui guident la manière dont l’IA est développée et utilisée dans la société.
Un domaine axé sur la réduction des comportements nuisibles, des pannes et des risques d’utilisation abusive des systèmes d’IA.
Ensemble défini de règles ou d'étapes qu'un ordinateur suit pour résoudre un problème ou accomplir une tâche.
Iniquité systématique dans les résultats du modèle causée par des données, des hypothèses ou des choix de modélisation biaisés.
Dans quelle mesure la logique, les sources de données et les limites d'un système d'IA sont documentées et compréhensibles.
Étiquettes ou métadonnées ajoutées par l’homme utilisées pour entraîner ou évaluer des modèles d’apprentissage automatique.
Une manière structurée permettant à un système logiciel d'envoyer des requêtes et de recevoir des réponses d'un autre système.
Le vaste domaine de la construction de systèmes qui exécutent des tâches nécessitant une reconnaissance de formes, un raisonnement, un langage ou une prise de décision.
Un composant de modèle qui se concentre dynamiquement sur les parties pertinentes d'une entrée lors de la production d'une sortie.
Un système capable de prendre des décisions et d’agir en temps réel avec un contrôle humain direct limité ou inexistant.
L'algorithme de formation de base qui met à jour les pondérations du modèle en propageant les erreurs de prédiction vers l'arrière à travers le réseau.
Un modèle de référence simple utilisé pour comparer si des approches plus complexes améliorent réellement les résultats.
Un test ou un ensemble de données standardisé utilisé pour mesurer et comparer les performances du modèle.
Un modèle cohérent d'erreur ou d'injustice dans le comportement des données ou du modèle.
Ensembles de données très volumineux et complexes qui nécessitent des techniques de stockage et de traitement évolutives.
Un modèle dont le raisonnement interne est difficile à interpréter directement par les humains.
Dans quelle mesure les scores de confiance d'un modèle correspondent aux probabilités d'exactitude réelles.
Un style de raisonnement dans lequel un modèle d'IA décompose un problème en étapes intermédiaires.
Tâche dans laquelle un modèle attribue une entrée à une ou plusieurs catégories prédéfinies.
Un modèle conçu spécifiquement pour les tâches de classification.
Une architecture de modèle multimodale qui apprend les représentations partagées entre le texte et les images.
Les ressources de traitement nécessaires pour entraîner et exécuter des modèles, souvent mesurées en heures FLOPS ou GPU.
La branche de l'IA qui extrait le sens des images et des vidéos.
Nombre maximum de jetons d'entrée qu'un modèle de langage peut traiter simultanément.
Des approches de formation qui permettent à un modèle de continuer à apprendre de nouvelles données sans oublier les connaissances antérieures.
Une architecture neuronale optimisée pour traiter des données de type grille telles que des images.
Une fonction objective commune utilisée pour entraîner des modèles de classification en pénalisant les probabilités incorrectes.
Techniques qui créent des exemples de formation modifiés pour améliorer la généralisation du modèle.
Un changement dans les données d'entrée du monde réel au fil du temps qui peut dégrader les performances du modèle.
Processus d'attribution de balises ou de sorties cibles à des données brutes pour un apprentissage supervisé.
Une collection d'exemples structurés ou non structurés utilisés pour la formation, la validation ou les tests.
Surface dans l'espace des fonctionnalités qui sépare les classes prédites par un classificateur.
Un modèle qui effectue des prédictions à travers une séquence de divisions de fonctionnalités si-alors.
Un sous-ensemble d'apprentissage automatique qui utilise des réseaux neuronaux à plusieurs couches pour l'apprentissage des représentations.
Une architecture générative qui apprend à inverser le bruit pour synthétiser des images, de l'audio ou d'autres contenus.
Compression des connaissances d'un grand modèle d'enseignant dans un modèle d'étudiant plus petit.
Méthodes qui transfèrent un modèle formé dans un domaine pour mieux fonctionner dans un autre domaine.
Représentation vectorielle numérique qui capture la signification sémantique du texte, des images ou d'autres données.
Le composant d'un modèle qui transforme les entrées en représentations latentes.
Combiner les prédictions de plusieurs modèles pour améliorer la robustesse ou la précision.
Un ensemble de données conservé utilisé pour mesurer la qualité du modèle après la formation.
Le degré auquel le comportement d'un modèle peut être interprété et expliqué aux humains.
Une prédiction incorrecte où un modèle manque un vrai cas positif.
Une prédiction incorrecte dans laquelle un modèle marque à tort un cas négatif comme positif.
Variable d'entrée utilisée par un modèle pour faire des prédictions.
Concevoir ou transformer des variables d'entrée pour rendre l'apprentissage plus facile et plus efficace.
Conversion des données brutes en fonctionnalités informatives qu'un modèle peut utiliser.
Apprendre ou adapter un comportement à partir d’un petit nombre d’exemples seulement.
Formation continue sur des données spécifiques au domaine pour adapter un modèle pré-entraîné à une tâche spécifique.
Un grand modèle pré-entraîné qui peut être adapté à de nombreuses tâches en aval.
Une capacité de modèle permettant de générer des appels structurés qui déclenchent des outils ou des API externes.
Une configuration générative où un générateur et un discriminateur s'entraînent l'un contre l'autre.
Dans quelle mesure un modèle fonctionne-t-il sur de nouvelles données invisibles en dehors de l'ensemble d'entraînement.
Systèmes d'IA qui produisent de nouveaux contenus tels que du texte, des images, de l'audio, de la vidéo ou du code.
Un vecteur montrant dans quelle mesure chaque paramètre doit changer pour réduire les pertes.
Une méthode d'optimisation qui met à jour les paramètres dans le sens qui réduit les erreurs.
Étiquettes de référence fiables utilisées pour entraîner ou évaluer les sorties du modèle.
Règles, vérifications et contrôles qui limitent les comportements dangereux ou indésirables du modèle.
Lorsqu'un modèle génère des informations fluides mais fausses ou non prises en charge.
Un flux de travail dans lequel les humains examinent, guident ou remplacent les sorties de l'IA.
Une valeur de configuration définie avant la formation, telle que le taux d'apprentissage, la taille du lot ou la profondeur.
Capacité d'un modèle à suivre des modèles à partir d'exemples fournis directement dans l'invite.
Phase d'exécution au cours de laquelle un modèle entraîné génère des prédictions ou des sorties.
Quantité de puissance de traitement consommée lors de la production de chaque réponse.
Affiner un modèle sur les paires instruction-réponse pour améliorer le suivi des tâches.
Prédire l'objectif de l'utilisateur à partir d'une requête texte pour l'acheminer correctement.
Une technique rapide destinée à contourner les contraintes de sécurité d'un modèle.
Le dernier moment reflété dans les données d’entraînement d’un modèle.
Entraîner un modèle plus petit pour imiter les résultats d'un modèle plus grand.
Une structure graphique d'entités et de relations utilisée pour le raisonnement ou la récupération.
Une méthode de régularisation qui adoucit les étiquettes dures pour améliorer la généralisation.
Le temps entre l'envoi d'une requête et la réception de la sortie du modèle.
Un modèle de langage formé sur des corpus de textes massifs pour générer et analyser du texte.
Un hyperparamètre de formation contrôlant la quantité de paramètres modifiés à chaque étape de mise à jour.
Une méthode de réglage fin efficace en termes de paramètres qui ajoute des matrices d'adaptateurs de bas rang.
Un objectif mathématique qui quantifie l'erreur de prédiction lors de l'entraînement.
Méthodes qui permettent aux systèmes d’apprendre des modèles à partir des données et de s’améliorer au fil du temps.
Contexte stocké qu'un agent IA utilise au fil des étapes ou des sessions pour améliorer la continuité.
Une architecture avec des sous-réseaux spécialisés où seuls des experts sélectionnés s'exécutent par entrée.
Documentation décrivant l'utilisation prévue d'un modèle, les mesures, les limites et les risques.
Dégradation des performances au fil du temps, à mesure que les conditions réelles s'écartent des hypothèses de formation.
Réduire la précision numérique des poids du modèle pour réduire les coûts de mémoire et d'inférence.
Un modèle capable de traiter ou de générer plusieurs types de données tels que du texte, des images et de l'audio.
Une tâche NLP qui identifie des entités telles que des personnes, des lieux, des dates ou des organisations.
La branche de l’IA axée sur la compréhension et la génération du langage humain.
Un modèle informatique en couches inspiré des neurones et des synapses biologiques.
Transformer les valeurs à une échelle cohérente pour améliorer la stabilité de l'optimisation.
Technologie qui convertit le texte des images ou le numérise en texte lisible par machine.
Un modèle publié avec des poids ou un code public pour l'inspection, l'adaptation et la réutilisation.
Lorsqu'un modèle mémorise les données d'entraînement et fonctionne mal sur des entrées invisibles.
Un poids appris à l'intérieur d'un modèle qui influence ses résultats.
Méthodes qui adaptent les modèles en entraînant un petit sous-ensemble de paramètres ajoutés.
Une métrique de modèle de langage mesurant à quel point le modèle est surpris par les vrais prochains jetons.
Un flux de travail ordonné de prétraitement, d'étapes de modèle et d'étapes de post-traitement.
La proportion de résultats positifs prédits qui sont réellement corrects.
Formation initiale de modèles à grande échelle sur des données larges avant adaptation en aval.
Les instructions d'entrée et le contexte fournis à un modèle génératif.
Concevoir des invites pour améliorer la qualité, la fiabilité et la contrôlabilité de la sortie.
Un modèle d'attaque dans lequel des instructions malveillantes sont insérées dans les entrées du modèle ou dans le contenu récupéré.
Suppression des poids de modèle ou des neurones moins importants pour réduire la taille et le calcul.
Conversion des poids de modèle en formats de précision inférieure tels que 8 bits ou 4 bits.
Une méthode qui récupère des connaissances externes et les intègre à la génération au moment de l'inférence.
La proportion de positifs réels qu’un modèle identifie correctement.
Un pipeline de modèle qui prédit les préférences des utilisateurs en matière de classement du contenu ou des produits.
Testez sous contrainte un système d’IA avec des invites contradictoires pour révéler les échecs et les risques.
La formation par récompense signale qu'un agent apprend des actions qui maximisent le rendement à long terme.
Une méthode de formation qui utilise les signaux de préférence humaine pour façonner le comportement du modèle.
Recherche de documents ou d'enregistrements pertinents à partir d'une source de connaissances pour une requête.
Un modèle qui évalue les sorties en fonction des signaux de préférence, souvent utilisé dans les pipelines RLHF.
Capacité d'un modèle à maintenir ses performances malgré le bruit, les changements ou les entrées contradictoires.
Une couche de modération qui bloque ou réécrit les entrées ou sorties dangereuses du modèle.
Relation empirique montrant comment les performances s'améliorent avec la taille du modèle, les données ou le calcul.
Recherche qui correspond au sens plutôt qu'au chevauchement exact des mots clés, souvent en utilisant des intégrations.
Apprendre des représentations à partir de données non étiquetées en prédisant les pièces masquées ou transformées.
Une tâche PNL qui classe le ton émotionnel ou l’opinion dans un texte.
Un modèle de langage compact optimisé pour une latence, un coût ou une utilisation sur l'appareil réduits.
Un modèle où de nombreux paramètres sont nuls ou inactifs pour réduire les calculs.
Entraîner un modèle avec des exemples étiquetés qui mappent les entrées aux sorties connues.
Données générées artificiellement utilisées pour augmenter, simuler ou protéger les données de formation sensibles.
Instruction hautement prioritaire qui définit le comportement, la politique et le style de réponse d'un modèle.
Un paramètre d'échantillonnage contrôlant le caractère aléatoire des sorties générées.
Morceau de texte traité par des modèles de langage, tel qu'un mot ou un symbole.
Le processus de division du texte en jetons pour la saisie du modèle.
Capacité d'un modèle à appeler des outils externes tels que la recherche, des calculatrices ou des API.
Une stratégie de décodage qui échantillonne uniquement à partir des k prochains jetons les plus probables.
Une stratégie de décodage qui échantillonne à partir du plus petit ensemble de jetons dont la somme des probabilités est p.
Appliquer les connaissances acquises dans une tâche ou un domaine pour améliorer une autre tâche.
Une architecture neuronale qui utilise l'attention pour modéliser les relations entre les séquences en parallèle.
La valeur d'erreur du modèle calculée pendant la formation et optimisée à la baisse au fil du temps.
Modèles d'apprentissage à partir de données non étiquetées sans résultats cibles explicites.
Un ensemble de données utilisé pendant le développement pour affiner les modèles et éviter le surajustement.
Une base de données optimisée pour stocker et interroger des vecteurs d'intégration de grande dimension.
Un modèle multimodal qui traite conjointement les informations visuelles et textuelles.
Utiliser des étiquettes bruyantes, heuristiques ou partielles pour former des modèles lorsque les étiquettes propres sont rares.
Une valeur numérique apprise qui met à l'échelle les signaux transitant par un réseau neuronal.
Une représentation vectorielle dense de mots capturant les relations sémantiques.
Techniques et pratiques pour rendre les prédictions de l’IA plus transparentes et compréhensibles.
Résoudre des tâches sans exemples spécifiques en s'appuyant sur des connaissances générales préalables.
Un processus en plusieurs étapes dans lequel un système d'IA planifie, exécute, vérifie les résultats et itère vers un objectif.
Le cadre réglementaire de l'Union européenne basé sur les risques pour les systèmes et les fournisseurs d'IA.
Le coût supplémentaire en temps, en calcul ou en vitesse du produit nécessaire pour rendre les systèmes plus sûrs et plus contrôlables.
Lorsque des exemples de tests de référence ou des variantes proches sont présents dans les données d'entraînement, cela gonfle les performances déclarées.
Méthodes d’estimation des relations de cause à effet plutôt que de simples corrélations.
Plage statistique qui contient probablement la vraie valeur d'une métrique de modèle mesurée.
Une approche de formation et de formation des comportements où les résultats du modèle sont guidés par un ensemble fixe de principes écrits.
Un enregistrement indiquant d'où proviennent les données, comment elles ont été transformées et où elles sont utilisées.
L'origine, la propriété et l'historique documentés d'un ensemble de données ou d'un artefact de modèle.
Une technique de confidentialité qui ajoute du bruit statistique afin que les enregistrements individuels ne puissent pas être déduits de manière fiable des résultats.
Un modèle plus petit entraîné pour imiter le comportement d'un modèle plus grand tout en utilisant moins de calcul lors de l'inférence.
Un modèle spécialisé dans la conversion de données en vecteurs utilisés pour la recherche sémantique, le regroupement et la récupération.
Un cadre d'évaluation reproductible qui exécute des invites, des ensembles de données et une logique de notation dans toutes les versions du modèle.
Un système géré pour stocker et servir des fonctionnalités ML validées de manière cohérente pour la formation et l'inférence.
La mesure dans laquelle une réponse de l’IA est étayée par les données sources ou les preuves récupérées.
Une stratégie de génération qui limite les jetons de sortie à des structures valides ou à des choix conformes aux politiques.
Un modèle formé sur les classements humains pour prédire quelles réponses les utilisateurs sont susceptibles de préférer.
Une interface API déployée qui reçoit les requêtes de modèle et renvoie des prédictions en production.
Une collection organisée de documents ou d'enregistrements utilisés pour la récupération, l'automatisation du support ou la mise à la terre des réponses.
Un espace de représentation compressé où des concepts similaires sont positionnés les uns à côté des autres en tant que vecteurs.
Un catalogue central pour la gestion des versions, l'approbation et le suivi des modèles dans tous les environnements.
L'inférence d'IA est effectuée localement sur le matériel de l'utilisateur plutôt que dans un service cloud distant.
Logique qui valide et convertit la sortie du modèle en structures fortement typées et utilisables par la machine.
Un modèle d'invite réutilisable avec des variables, des règles de formatage et des instructions spécifiques à une tâche.
Proportion d'éléments récupérés pertinents pour la requête de l'utilisateur.
Un argument structuré, étayé par des preuves, selon lequel un système d’IA est sûr pour un contexte d’utilisation défini.
Exécuter un modèle en parallèle avec le trafic de production sans affecter les décisions des utilisateurs.
Sortie du modèle limitée à un schéma défini tel que JSON, des arguments d'outil ou des champs saisis.
Calcul d'inférence supplémentaire utilisé lors de la génération de réponses pour améliorer la qualité ou le raisonnement.
Aligner la confiance des utilisateurs dans les résultats de l'IA avec la fiabilité réelle du système dans chaque tâche.
Tarification où les coûts évoluent en fonction des appels d'API, des jetons, du temps d'inférence ou du calcul consommé.
Une politique selon laquelle les charges utiles de requête/réponse ne sont pas stockées après traitement au-delà des fenêtres opérationnelles de courte durée.
Une méthode d'accélération d'inférence dans laquelle un petit projet de modèle propose des jetons qu'un modèle plus grand vérifie en parallèle.
Tenseurs de clé et de valeur stockés des jetons précédents qui permettent aux transformateurs de générer de nouveaux jetons sans recalculer l'attention passée.
Un protocole ouvert qui permet aux applications d'IA de se connecter de manière standard à des outils externes, des sources de données et des fournisseurs de contexte.
Un cycle itératif dans lequel un agent d'IA observe, planifie, agit et réfléchit jusqu'à ce qu'il atteigne un objectif ou atteigne une condition d'arrêt.
Un modèle d'incitation qui entrelace les étapes de raisonnement avec les actions d'utilisation d'outils pour résoudre les tâches de manière plus fiable.
Une approche de raisonnement dans laquelle un modèle explore plusieurs chemins de solutions de branchement et sélectionne les plus prometteurs.
Une méthode de formation qui affine les modèles directement sur les paires de préférences sans avoir besoin d'un modèle de récompense distinct.
Une technique de réglage fin qui combine une quantification de poids sur 4 bits avec des adaptateurs LoRA pour réduire les besoins en mémoire.
Un algorithme d'attention optimisé qui réduit l'utilisation de la mémoire et accélère la formation et l'inférence des transformateurs.
Un mécanisme de transformation qui exécute plusieurs opérations d'attention en parallèle pour capturer différents types de relations.
Informations ajoutées aux intégrations de jetons afin que les transformateurs puissent distinguer l'ordre des séquences.
Une méthode de codage positionnel qui fait pivoter les vecteurs de requête et de clé pour coder les positions relatives des jetons.
Une méthode de biais de position qui pénalise les scores d'attention en fonction de la distance symbolique, aidant ainsi les modèles à extrapoler à des contextes plus longs.
Un modèle d'attention dans lequel chaque jeton s'occupe uniquement d'une fenêtre de taille fixe de jetons à proximité pour réduire le calcul.
Un algorithme de tokenisation de sous-mots qui fusionne les paires de caractères les plus fréquentes en jetons réutilisables.
Un tokenizer indépendant de la langue qui apprend les unités de sous-mots directement à partir du texte brut sans pré-diviser sur les espaces.
Des algorithmes qui trouvent des vecteurs proches d'une requête sans comparaison exhaustive, troquant l'exactitude contre la vitesse.
Une structure d'index basée sur un graphique pour une recherche rapide et approximative du voisin le plus proche sur des vecteurs de grande dimension.
Un modèle qui réorganise un ensemble initial de résultats récupérés pour placer les éléments les plus pertinents en haut.
Une approche de récupération qui combine la recherche par mot-clé (lexicale) avec la recherche vectorielle (sémantique) pour un meilleur rappel et une meilleure précision.
Un modèle qui évalue une requête et un document ensemble en une seule passe pour des jugements de pertinence de haute précision.
Un modèle qui code les requêtes et les documents dans des vecteurs distincts afin qu'ils puissent être comparés rapidement à grande échelle.
Utiliser un modèle de langage pour noter ou comparer les résultats d'autres modèles lors de l'évaluation.
Une métrique d'évaluation de code mesurant la chance qu'au moins un des k échantillons générés réussisse les tests.
Une référence testant des modèles linguistiques dans 57 matières académiques et professionnelles à l'aide de questions à choix multiples.
Un benchmark des problèmes de programmation Python utilisé pour mesurer l'exactitude de la génération de code via des tests unitaires.
Une référence de problèmes de mots mathématiques à l'école primaire utilisée pour évaluer le raisonnement étape par étape dans les modèles de langage.
Dans quelle mesure les affirmations d'un modèle correspondent-elles aux informations vérifiables du monde réel.
Références à des passages sources ou à des documents inclus dans la réponse d'un modèle pour étayer ses affirmations.
Intégrer un signal détectable dans un texte ou un média généré par l'IA afin qu'il puisse ensuite être identifié comme étant produit par une machine.
Une phase de formation intermédiaire entre la pré-formation et la post-formation, souvent utilisée pour des ajustements de capacités ou de domaines.
Étapes de formation appliquées après la pré-formation, telles que le réglage des instructions, l'optimisation des préférences et le réglage de la sécurité.
Une configuration de formation dans laquelle un modèle s'améliore en générant des données via des interactions ou des compétitions avec des copies de lui-même.
Une méthode de récupération qui génère plusieurs variantes de requête, récupère les résultats pour chacune et fusionne les classements.
Une technique de récupération qui réécrit la requête de l'utilisateur en plusieurs variantes pour améliorer le rappel.
Un modèle de récupération qui recherche de petits morceaux mais renvoie leurs documents parents plus volumineux pour un contexte plus riche.
Un algorithme de décodage qui conserve les premières séquences candidates à chaque étape pour trouver des sorties à plus forte probabilité.
Un paramètre de décodage qui réduit la probabilité que le modèle ait déjà produit des jetons pour réduire les boucles.
Un paramètre de décodage qui réduit la probabilité d'apparition de jetons proportionnellement à la fréquence à laquelle ils sont apparus jusqu'à présent.
Un paramètre de décodage qui réduit la probabilité que des jetons apparaissent, encourageant ainsi de nouveaux sujets.