AGI (kunstmatige algemene intelligentie)
Een hypothetisch AI-systeem dat de meeste intellectuele taken op menselijk niveau in vele domeinen kan uitvoeren.
Essentiële technische terminologie uitgelegd op het hoogste niveau van duidelijkheid. Ontworpen voor onderzoekers, studenten en mensgericht onderwijs.
Tonen 213 overeenkomende termen.
Een hypothetisch AI-systeem dat de meeste intellectuele taken op menselijk niveau in vele domeinen kan uitvoeren.
Een softwaresysteem dat kan observeren, redeneren en actie kan ondernemen om een doel te bereiken, vaak met behulp van tools en geheugen.
Het werk om ervoor te zorgen dat AI-systemen zich gedragen in overeenstemming met menselijke bedoelingen, waarden en veiligheidsbeperkingen.
Beleid, normen en toezichtsmechanismen die bepalen hoe AI wordt ontwikkeld en gebruikt in de samenleving.
Een vakgebied dat zich richt op het verminderen van schadelijk gedrag, mislukkingen en misbruikrisico's in AI-systemen.
Een gedefinieerde reeks regels of stappen die een computer volgt om een probleem op te lossen of een taak te voltooien.
Systematische oneerlijkheid in modelresultaten veroorzaakt door scheve gegevens, aannames of modelleringskeuzes.
Hoe duidelijk de logica, gegevensbronnen en beperkingen van een AI-systeem zijn gedocumenteerd en begrijpelijk.
Door mensen toegevoegde labels of metagegevens die worden gebruikt om machine learning-modellen te trainen of evalueren.
Een gestructureerde manier waarop het ene softwaresysteem verzoeken kan verzenden naar en antwoorden kan ontvangen van een ander systeem.
Het brede veld van het bouwen van systemen die taken uitvoeren die patroonherkenning, redenering, taal of besluitvorming vereisen.
Een modelcomponent die zich dynamisch richt op relevante delen van een input bij het produceren van een output.
Een systeem dat in realtime beslissingen kan nemen en kan handelen met beperkte of geen directe menselijke controle.
Het kerntrainingsalgoritme dat modelgewichten bijwerkt door voorspellingsfouten achterwaarts door het netwerk te verspreiden.
Een eenvoudig referentiemodel dat wordt gebruikt om te vergelijken of complexere benaderingen daadwerkelijk de resultaten verbeteren.
Een gestandaardiseerde test of dataset die wordt gebruikt om de prestaties van modellen te meten en te vergelijken.
Een consistent patroon van fouten of oneerlijkheid in gegevens of modelgedrag.
Zeer grote en complexe datasets die schaalbare opslag- en verwerkingstechnieken vereisen.
Een model waarvan de interne redenering moeilijk rechtstreeks door mensen kan worden geïnterpreteerd.
Hoe goed de betrouwbaarheidsscores van een model overeenkomen met de werkelijke correctheidskansen.
Een redeneerstijl waarbij een AI-model een probleem opsplitst in tussenstappen.
Een taak waarbij een model een invoer toewijst aan een of meer vooraf gedefinieerde categorieën.
Een model dat speciaal is ontworpen voor classificatietaken.
Een multimodale modelarchitectuur die gedeelde representaties tussen tekst en afbeeldingen leert.
De verwerkingsbronnen die nodig zijn om modellen te trainen en uit te voeren, vaak gemeten in FLOPS- of GPU-uren.
De tak van AI die betekenis uit afbeeldingen en video haalt.
Het maximale aantal invoertokens dat een taalmodel tegelijk kan verwerken.
Trainingsbenaderingen waarmee een model kan blijven leren van nieuwe gegevens zonder voorafgaande kennis te vergeten.
Een neurale architectuur die is geoptimaliseerd voor het verwerken van rasterachtige gegevens zoals afbeeldingen.
Een gemeenschappelijke objectieve functie die wordt gebruikt om classificatiemodellen te trainen door onjuiste waarschijnlijkheden te bestraffen.
Technieken die aangepaste trainingsvoorbeelden creëren om de modelgeneralisatie te verbeteren.
Een verschuiving in reële invoergegevens in de loop van de tijd die de modelprestaties kan verslechteren.
Het proces van het toewijzen van tags of doelresultaten aan ruwe gegevens voor begeleid leren.
Een verzameling gestructureerde of ongestructureerde voorbeelden die worden gebruikt voor training, validatie of testen.
Het oppervlak in de kenmerkruimte dat klassen scheidt die door een classificator worden voorspeld.
Een model dat voorspellingen doet via een reeks als-dan-functiesplitsingen.
Een subset van machinaal leren die gebruik maakt van neurale netwerken met meerdere lagen voor representatieleren.
Een generatieve architectuur die leert ruis om te keren om afbeeldingen, audio of andere inhoud te synthetiseren.
Het comprimeren van kennis van een groot lerarenmodel naar een kleiner studentenmodel.
Methoden die een model dat in het ene domein is getraind, overdragen om beter te presteren in een ander domein.
Een numerieke vectorrepresentatie die de semantische betekenis van tekst, afbeeldingen of andere gegevens vastlegt.
Het onderdeel van een model dat input omzet in latente representaties.
Het combineren van voorspellingen uit meerdere modellen om de robuustheid of nauwkeurigheid te verbeteren.
Een vastgehouden dataset die wordt gebruikt om de modelkwaliteit na training te meten.
De mate waarin het gedrag van een model kan worden geïnterpreteerd en verklaard aan mensen.
Een onjuiste voorspelling waarbij een model een echt positief geval mist.
Een onjuiste voorspelling waarbij een model een negatief geval ten onrechte als positief markeert.
Een invoervariabele die door een model wordt gebruikt om voorspellingen te doen.
Het ontwerpen of transformeren van invoervariabelen om het leren eenvoudiger en effectiever te maken.
Het omzetten van ruwe gegevens in informatieve functies die een model kan gebruiken.
Gedrag leren of aanpassen vanuit slechts een klein aantal voorbeelden.
Voortdurende training over domeinspecifieke gegevens om een vooraf getraind model aan te passen aan een specifieke taak.
Een groot, vooraf getraind model dat kan worden aangepast aan veel downstream-taken.
Een modelmogelijkheid om gestructureerde oproepen te genereren die externe tools of API's activeren.
Een generatieve opstelling waarbij een generator en discriminator tegen elkaar trainen.
Hoe goed een model presteert op nieuwe, onzichtbare gegevens buiten de trainingsset.
AI-systemen die nieuwe inhoud produceren, zoals tekst, afbeeldingen, audio, video of code.
Een vector die aangeeft hoeveel elke parameter moet veranderen om het verlies te verminderen.
Een optimalisatiemethode die parameters bijwerkt in de richting waarin fouten worden verminderd.
Betrouwbare referentielabels die worden gebruikt om modeluitvoer te trainen of evalueren.
Regels, controles en controles die onveilig of ongewenst modelgedrag beperken.
Wanneer een model vloeiende maar valse of niet-ondersteunde informatie genereert.
Een workflow waarin mensen AI-uitvoer beoordelen, begeleiden of negeren.
Een configuratiewaarde die vóór de training is ingesteld, zoals leersnelheid, batchgrootte of diepte.
Het vermogen van een model om patronen te volgen uit voorbeelden die rechtstreeks in de prompt worden gegeven.
De runtimefase waarin een getraind model voorspellingen of uitvoer genereert.
De hoeveelheid verwerkingskracht die wordt verbruikt bij het produceren van elk antwoord.
Het verfijnen van een model op instructie-antwoordparen om het volgen van taken te verbeteren.
Het voorspellen van het doel van de gebruiker op basis van een tekstquery om deze correct te routeren.
Een snelle techniek bedoeld om de veiligheidsbeperkingen van een model te omzeilen.
Het laatste tijdstip dat wordt weerspiegeld in de trainingsgegevens van een model.
Een kleiner model trainen om de resultaten van een groter model te imiteren.
Een grafiekstructuur van entiteiten en relaties die wordt gebruikt voor redeneren of ophalen.
Een regularisatiemethode die harde labels verzacht om de generalisatie te verbeteren.
De tijd tussen het verzenden van een aanvraag en het ontvangen van de uitvoer van het model.
Een taalmodel dat is getraind op enorme tekstcorpora om tekst te genereren en te analyseren.
Een trainingshyperparameter die bepaalt hoeveel parameters elke updatestap wijzigen.
Een parameter-efficiënte fijnafstemmingsmethode die adaptermatrices van lage rang toevoegt.
Een wiskundig doel dat de voorspellingsfout tijdens de training kwantificeert.
Methoden waarmee systemen patronen uit gegevens kunnen leren en in de loop van de tijd kunnen verbeteren.
Opgeslagen context die een AI-agent in stappen of sessies gebruikt om de continuïteit te verbeteren.
Een architectuur met gespecialiseerde subnetwerken waarbij per input alleen geselecteerde experts draaien.
Documentatie die het beoogde gebruik, de meetgegevens, de beperkingen en de risico's van een model beschrijft.
Prestatievermindering in de loop van de tijd, omdat de omstandigheden in de praktijk afwijken van de trainingsaannames.
Het verminderen van de numerieke precisie van modelgewichten om de geheugen- en gevolgtrekkingskosten te verlagen.
Een model dat meerdere gegevenstypen, zoals tekst, afbeeldingen en audio, kan verwerken of genereren.
Een NLP-taak die entiteiten zoals mensen, plaatsen, datums of organisaties identificeert.
De tak van AI richtte zich op het begrijpen en genereren van menselijke taal.
Een gelaagd computermodel geïnspireerd op biologische neuronen en synapsen.
Waarden transformeren naar een consistente schaal om de optimalisatiestabiliteit te verbeteren.
Technologie die tekst in afbeeldingen of scans omzet in machinaal leesbare tekst.
Een model vrijgegeven met publieke gewichten of code voor inspectie, aanpassing en hergebruik.
Wanneer een model trainingsgegevens onthoudt en slecht presteert op onzichtbare input.
Een geleerd gewicht binnen een model dat de resultaten ervan beïnvloedt.
Methoden die modellen aanpassen door een kleine subset van toegevoegde parameters te trainen.
Een taalmodelstatistiek die meet hoe verrast het model is door echte volgende tokens.
Een geordende workflow van voorbewerking, modelstappen en nabewerkingsfasen.
Het percentage voorspelde positieve uitkomsten dat daadwerkelijk correct is.
Initiële grootschalige modeltraining op brede gegevens vóór downstream-aanpassing.
De invoerinstructies en context die aan een generatief model worden verstrekt.
Het ontwerpen van aanwijzingen om de uitvoerkwaliteit, betrouwbaarheid en beheersbaarheid te verbeteren.
Een aanvalspatroon waarbij kwaadaardige instructies worden ingevoegd in modelinvoer of opgehaalde inhoud.
Het verwijderen van minder belangrijke modelgewichten of neuronen om de omvang en rekenkracht te verkleinen.
Modelgewichten converteren naar formaten met een lagere precisie, zoals 8-bit of 4-bit.
Een methode die externe kennis ophaalt en deze op het moment van inferentie in de generatie invoert.
Het aandeel feitelijke positieven dat een model correct identificeert.
Een modelpijplijn die gebruikersvoorkeuren voorspelt voor het rangschikken van inhoud of producten.
Een AI-systeem stresstesten met vijandige aanwijzingen om fouten en risico's aan het licht te brengen.
Training door beloningssignalen waarbij een agent acties leert die het rendement op de lange termijn maximaliseren.
Een trainingsmethode die menselijke voorkeurssignalen gebruikt om modelgedrag vorm te geven.
Het vinden van relevante documenten of records uit een kennisbron voor een zoekopdracht.
Een model dat output scoort op basis van voorkeurssignalen, vaak gebruikt in RLHF-pijplijnen.
Het vermogen van een model om de prestaties te behouden onder ruis, verschuivingen of vijandige input.
Een moderatielaag die onveilige modelinvoer of -uitvoer blokkeert of herschrijft.
Een empirische relatie die laat zien hoe de prestaties verbeteren met de modelgrootte, gegevens of rekenkracht.
Zoekopdrachten die overeenkomen met de betekenis in plaats van exacte overlap van trefwoorden, vaak met behulp van insluitingen.
Representaties leren van ongelabelde gegevens door gemaskeerde of getransformeerde delen te voorspellen.
Een NLP-taak die de emotionele toon of mening in tekst classificeert.
Een compact taalmodel dat is geoptimaliseerd voor lagere latentie, lagere kosten of gebruik op het apparaat.
Een model waarbij veel parameters nul zijn of inactief zijn om berekeningen te verminderen.
Een model trainen met gelabelde voorbeelden die invoer toewijzen aan bekende uitvoer.
Kunstmatig gegenereerde gegevens die worden gebruikt om gevoelige trainingsgegevens aan te vullen, te simuleren of te beschermen.
Een instructie met hoge prioriteit die het gedrag, het beleid en de reactiestijl voor een model bepaalt.
Een steekproefinstelling die de willekeur in de gegenereerde uitvoer regelt.
Een stuk tekst dat wordt verwerkt door taalmodellen, zoals een woordstuk of symbool.
Het proces waarbij tekst in tokens wordt gesplitst voor modelinvoer.
De mogelijkheid van een model om externe tools aan te roepen, zoals zoeken, rekenmachines of API's.
Een decoderingsstrategie die alleen monsters neemt van de k meest waarschijnlijke volgende tokens.
Een decoderingsstrategie die monsters neemt van de kleinste tokenset waarvan de kansen optellen tot p.
Het toepassen van kennis die is geleerd in een taak of domein om een andere taak te verbeteren.
Een neurale architectuur die aandacht gebruikt om relaties tussen reeksen parallel te modelleren.
De modelfoutwaarde die tijdens de training is berekend en in de loop van de tijd naar beneden is geoptimaliseerd.
Patronen leren uit ongelabelde gegevens zonder expliciete doelresultaten.
Een dataset die tijdens de ontwikkeling wordt gebruikt om modellen af te stemmen en overfitting te voorkomen.
Een database die is geoptimaliseerd voor het opslaan en opvragen van hoogdimensionale inbeddingsvectoren.
Een multimodaal model dat visuele en tekstuele informatie gezamenlijk verwerkt.
Gebruik luidruchtige, heuristische of gedeeltelijke labels om modellen te trainen wanneer schone labels schaars zijn.
Een geleerde numerieke waarde die signalen schaalt die door een neuraal netwerk gaan.
Een dichte vectorrepresentatie van woorden die semantische relaties vastleggen.
Technieken en praktijken om AI-voorspellingen transparanter en begrijpelijker te maken.
Taken oplossen zonder taakspecifieke voorbeelden door te vertrouwen op algemene voorkennis.
Een uit meerdere stappen bestaand proces waarbij een AI-systeem plannen maakt, uitvoert, resultaten controleert en naar een doel streeft.
Het op risico gebaseerde regelgevingskader van de Europese Unie voor AI-systemen en -aanbieders.
De extra kosten in tijd, rekenkracht of productsnelheid die nodig zijn om systemen veiliger en beter controleerbaar te maken.
Wanneer benchmarktestvoorbeelden of sterk gelijkende varianten aanwezig zijn in trainingsgegevens, worden de gerapporteerde prestaties verhoogd.
Methoden voor het schatten van oorzaak-gevolgrelaties in plaats van eenvoudige correlaties.
Een statistisch bereik dat waarschijnlijk de werkelijke waarde van een gemeten modelstatistiek bevat.
Een aanpak voor training en gedragsvorming waarbij de modelresultaten worden geleid door een vaste reeks schriftelijke principes.
Een overzicht van waar gegevens vandaan komen, hoe ze zijn getransformeerd en waar ze worden gebruikt.
De gedocumenteerde oorsprong, eigendom en geschiedenis van een dataset of modelartefact.
Een privacytechniek die statistische ruis toevoegt, zodat individuele records niet op betrouwbare wijze uit de output kunnen worden afgeleid.
Een kleiner model dat is getraind om het gedrag van een groter model te imiteren en tegelijkertijd minder rekenkracht te gebruiken bij gevolgtrekking.
Een model dat gespecialiseerd is in het omzetten van gegevens in vectoren die worden gebruikt voor semantisch zoeken, clusteren en ophalen.
Een herhaalbaar evaluatieframework dat aanwijzingen, datasets en scorelogica uitvoert in alle modelversies.
Een beheerd systeem voor het consistent opslaan en aanbieden van gevalideerde ML-functies voor training en gevolgtrekking.
De mate waarin een AI-reactie wordt ondersteund door brongegevens of opgehaald bewijsmateriaal.
Een generatiestrategie die uitvoertokens beperkt tot geldige structuren of beleidsconforme keuzes.
Een model dat is getraind op menselijke ranglijsten om te voorspellen welke antwoorden gebruikers waarschijnlijk zullen verkiezen.
Een geïmplementeerde API-interface die modelaanvragen ontvangt en voorspellingen retourneert in productie.
Een samengestelde verzameling documenten of records die wordt gebruikt voor het ophalen, ondersteunen van automatisering of het aarden van reacties.
Een gecomprimeerde representatieruimte waarin vergelijkbare concepten als vectoren dicht bij elkaar worden geplaatst.
Een centrale catalogus voor versiebeheer, goedkeuring en tracking van modellen in verschillende omgevingen.
AI-inferentie wordt lokaal uitgevoerd op gebruikershardware in plaats van in een externe cloudservice.
Logica die modeluitvoer valideert en omzet in sterk getypeerde, machinaal bruikbare structuren.
Een herbruikbaar promptpatroon met variabelen, opmaakregels en taakspecifieke instructies.
Het aandeel opgehaalde items dat relevant is voor de zoekopdracht van de gebruiker.
Een gestructureerd argument, ondersteund door bewijsmateriaal, dat een AI-systeem veilig is voor een gedefinieerde gebruikscontext.
Een model parallel uitvoeren met productieverkeer zonder gebruikersgerichte beslissingen te beïnvloeden.
Modeluitvoer beperkt tot een gedefinieerd schema, zoals JSON, toolargumenten of getypte velden.
Aanvullende gevolgtrekkingsberekening die wordt gebruikt tijdens het genereren van antwoorden om de kwaliteit of redenering te verbeteren.
Het vertrouwen van de gebruiker in AI-uitvoer afstemmen op de daadwerkelijke betrouwbaarheid van het systeem bij elke taak.
Prijzen waarbij de kosten worden geschaald met API-aanroepen, tokens, inferentietijd of verbruikte rekenkracht.
Een beleid waarbij de payloads van aanvragen/antwoorden niet worden opgeslagen na verwerking buiten kortstondige operationele vensters.
Een gevolgtrekkingsversnellingsmethode waarbij een klein conceptmodel tokens voorstelt die een groter model parallel verifieert.
Opgeslagen sleutel- en waardetensoren van eerdere tokens waarmee transformatoren nieuwe tokens kunnen genereren zonder de aandacht uit het verleden opnieuw te berekenen.
Een open protocol waarmee AI-applicaties op een standaard manier verbinding kunnen maken met externe tools, gegevensbronnen en contextproviders.
Een iteratieve cyclus waarin een AI-agent observeert, plant, handelt en reflecteert totdat hij een doel bereikt of een stopvoorwaarde bereikt.
Een stimulerend patroon dat redeneerstappen afwisselt met acties voor het gebruik van hulpmiddelen om taken betrouwbaarder op te lossen.
Een redeneringsbenadering waarbij een model meerdere vertakkende oplossingspaden onderzoekt en de meest veelbelovende selecteert.
Een trainingsmethode die modellen rechtstreeks op voorkeursparen afstemt zonder dat een apart beloningsmodel nodig is.
Een verfijningstechniek die 4-bits gewichtskwantisering combineert met LoRA-adapters om de geheugenbehoeften te verminderen.
Een geoptimaliseerd aandachtsalgoritme dat het geheugengebruik vermindert en de training en gevolgtrekking van transformatoren versnelt.
Een transformatormechanisme dat meerdere aandachtsoperaties parallel uitvoert om verschillende soorten relaties vast te leggen.
Informatie toegevoegd aan token-inbedding, zodat transformatoren de volgorde van de sequenties kunnen onderscheiden.
Een positionele coderingsmethode die query- en sleutelvectoren roteert om relatieve tokenposities te coderen.
Een positionele bias-methode die aandachtsscores bestraft op basis van tokenafstand, waardoor modellen kunnen worden geëxtrapoleerd naar langere contexten.
Een aandachtspatroon waarbij elk token alleen betrekking heeft op een venster met een vaste grootte van nabijgelegen tokens om de rekenkracht te verminderen.
Een tokenisatie-algoritme voor subwoorden dat de meest voorkomende tekenparen samenvoegt tot herbruikbare tokens.
Een taalonafhankelijke tokenizer die subwoordeenheden rechtstreeks uit onbewerkte tekst leert, zonder vooraf te splitsen op witruimte.
Algoritmen die vectoren vinden die dicht bij een zoekopdracht liggen zonder uitputtende vergelijking, waarbij nauwkeurigheid wordt ingeruild voor snelheid.
Een op grafieken gebaseerde indexstructuur voor snel zoeken naar de dichtstbijzijnde buur over hoogdimensionale vectoren.
Een model dat een eerste set opgehaalde resultaten opnieuw ordent, zodat de meest relevante items bovenaan komen te staan.
Een opzoekingsaanpak die zoeken op trefwoorden (lexicale zoekacties) combineert met vectorzoekopdrachten (semantische zoekacties) voor een betere herinnering en precisie.
Een model dat een zoekopdracht en een document in één keer scoort, voor zeer nauwkeurige relevantiebeoordelingen.
Een model dat query's en documenten codeert in afzonderlijke vectoren, zodat ze snel op schaal kunnen worden vergeleken.
Een taalmodel gebruiken om tijdens de evaluatie de resultaten van andere modellen te scoren of te vergelijken.
Een code-evaluatiemetriek die de kans meet dat ten minste één van de k gegenereerde monsters de tests doorstaat.
Een benchmark die taalmodellen test voor 57 academische en professionele vakken met behulp van meerkeuzevragen.
Een benchmark van Python-programmeerproblemen die wordt gebruikt om de correctheid van het genereren van code te meten via unit-tests.
Een benchmark voor wiskundige woordproblemen op de basisschool, gebruikt om stapsgewijs redeneren in taalmodellen te evalueren.
Hoe nauwkeurig de beweringen van een model overeenkomen met verifieerbare informatie uit de echte wereld.
Verwijzingen naar bronpassages of documenten in de reactie van een model ter ondersteuning van zijn beweringen.
Het inbedden van een detecteerbaar signaal in door AI gegenereerde tekst of media, zodat het later kan worden geïdentificeerd als machinaal geproduceerd.
Een tussenliggende trainingsfase tussen de voortraining en de post-training, vaak gebruikt voor aanpassingen van vaardigheden of domeinen.
Trainingsstappen toegepast na de voortraining, zoals het afstemmen van instructies, het optimaliseren van voorkeuren en het afstemmen van de veiligheid.
Een trainingsopstelling waarbij een model verbetert door gegevens te genereren via interacties of wedstrijden met kopieën van zichzelf.
Een ophaalmethode die meerdere zoekvarianten genereert, voor elke variant resultaten ophaalt en de ranglijsten samenvoegt.
Een ophaaltechniek die de gebruikersquery in verschillende varianten herschrijft om de herinnering te verbeteren.
Een ophaalpatroon dat kleine delen doorzoekt, maar de grotere bovenliggende documenten retourneert voor een rijkere context.
Een decoderingsalgoritme dat bij elke stap de bovenste verschillende kandidaatreeksen bewaart om uitvoer met een grotere waarschijnlijkheid te vinden.
Een decoderingsinstelling die de kans op tokens verlaagt die het model al heeft geproduceerd om lussen te verminderen.
Een decoderingsinstelling die de waarschijnlijkheid van tokens verkleint in verhouding tot hoe vaak ze tot nu toe zijn verschenen.
Een decoderingsinstelling die de kans verkleint dat tokens überhaupt zijn verschenen, waardoor nieuwe onderwerpen worden aangemoedigd.