AGI (Artificial General Intelligence)
Et hypotetisk AI-system som kan utføre de fleste intellektuelle oppgaver på menneskelig nivå på tvers av mange domener.
Viktig teknisk terminologi forklart på høyeste nivå av klarhet. Designet for forskere, studenter og menneskesentrert utdanning.
Viser 213 samsvarende vilkår.
Et hypotetisk AI-system som kan utføre de fleste intellektuelle oppgaver på menneskelig nivå på tvers av mange domener.
Et programvaresystem som kan observere, resonnere og iverksette tiltak for å oppnå et mål, ofte ved hjelp av verktøy og minne.
Arbeidet med å få AI-systemer til å oppføre seg i henhold til menneskelige intensjoner, verdier og sikkerhetsbegrensninger.
Retningslinjer, standarder og tilsynsmekanismer som styrer hvordan AI utvikles og brukes i samfunnet.
Et felt fokusert på å redusere skadelig atferd, feil og misbruksrisikoer i AI-systemer.
Et definert sett med regler eller trinn som en datamaskin følger for å løse et problem eller fullføre en oppgave.
Systematisk urettferdighet i modellutdata forårsaket av skjeve data, antakelser eller modelleringsvalg.
Hvor tydelig et AI-systems logikk, datakilder og begrensninger er dokumentert og forståelig.
Etiketter eller metadata som er lagt til mennesker, brukes til å trene eller evaluere maskinlæringsmodeller.
En strukturert måte for ett programvaresystem å sende forespørsler til og motta svar fra et annet system.
Det brede feltet av byggesystemer som utfører oppgaver som krever mønstergjenkjenning, resonnement, språk eller beslutningstaking.
En modellkomponent som dynamisk fokuserer på relevante deler av en input når den produserer en output.
Et system som kan ta beslutninger og handle med begrenset eller ingen direkte menneskelig kontroll i sanntid.
Kjernetreningsalgoritmen som oppdaterer modellvekter ved å spre prediksjonsfeil bakover gjennom nettverket.
En enkel referansemodell som brukes til å sammenligne om mer komplekse tilnærminger faktisk forbedrer resultatene.
En standardisert test eller datasett som brukes til å måle og sammenligne modellytelse.
Et konsekvent mønster av feil eller urettferdighet i data eller modellatferd.
Svært store og komplekse datasett som krever skalerbare lagrings- og prosesseringsteknikker.
En modell hvis indre resonnement er vanskelig å tolke direkte av mennesker.
Hvor godt en modells konfidensscore samsvarer med faktiske sannsynlighetssannsynligheter.
En resonneringsstil der en AI-modell dekomponerer et problem i mellomtrinn.
En oppgave der en modell tilordner en inngang til én eller flere forhåndsdefinerte kategorier.
En modell designet spesielt for klassifiseringsoppgaver.
En multimodal modellarkitektur som lærer delte representasjoner mellom tekst og bilder.
Behandlingsressursene som kreves for å trene og kjøre modeller, ofte målt i FLOPS- eller GPU-timer.
Grenen av AI som trekker ut mening fra bilder og video.
Maksimal mengde input-tokens en språkmodell kan behandle på en gang.
Opplæringsmetoder som lar en modell fortsette å lære av nye data uten å glemme forkunnskaper.
En nevral arkitektur optimalisert for å behandle rutenettlignende data som bilder.
En vanlig objektiv funksjon som brukes til å trene klassifikasjonsmodeller ved å straffe feil sannsynligheter.
Teknikker som lager modifiserte treningseksempler for å forbedre modellgeneralisering.
Et skifte i virkelige inputdata over tid som kan forringe modellens ytelse.
Prosessen med å tilordne tagger eller målutganger til rådata for overvåket læring.
En samling av strukturerte eller ustrukturerte eksempler som brukes til opplæring, validering eller testing.
Overflaten i funksjonsrom som skiller klasser forutsagt av en klassifiserer.
En modell som gjør spådommer gjennom en sekvens av hvis-da-funksjonsdelinger.
En undergruppe av maskinlæring som bruker mangelags nevrale nettverk for representasjonslæring.
En generativ arkitektur som lærer å reversere støy for å syntetisere bilder, lyd eller annet innhold.
Komprimering av kunnskap fra en stor lærermodell til en mindre elevmodell.
Metoder som overfører en modell som er trent i ett domene for å yte bedre i et annet domene.
En numerisk vektorrepresentasjon som fanger den semantiske betydningen av tekst, bilder eller andre data.
Komponenten i en modell som transformerer input til latente representasjoner.
Kombinere spådommer fra flere modeller for å forbedre robusthet eller nøyaktighet.
Et holdt ut datasett som brukes til å måle modellkvalitet etter trening.
I hvilken grad en modells atferd kan tolkes og forklares for mennesker.
En feil prediksjon der en modell går glipp av en sann positiv sak.
En feil prediksjon der en modell feilaktig flagger en negativ sak som positiv.
En inngangsvariabel som brukes av en modell for å lage spådommer.
Utforme eller transformere inputvariabler for å gjøre læring enklere og mer effektiv.
Konvertering av rådata til informative funksjoner som en modell kan bruke.
Lære eller tilpasse atferd fra bare et lite antall eksempler.
Fortsatt opplæring på domenespesifikke data for å tilpasse en forhåndstrent modell til en spesifikk oppgave.
En stor ferdigtrent modell som kan tilpasses mange nedstrømsoppgaver.
En modellfunksjon for å generere strukturerte anrop som utløser eksterne verktøy eller APIer.
Et generativt oppsett hvor en generator og diskriminator trener mot hverandre.
Hvor godt en modell presterer på nye, usynlige data utenfor treningssettet.
AI-systemer som produserer nytt innhold som tekst, bilder, lyd, video eller kode.
En vektor som viser hvor mye hver parameter skal endres for å redusere tap.
En optimaliseringsmetode som oppdaterer parametere i retningen som reduserer feil.
Pålitelige referanseetiketter som brukes til å trene eller evaluere modellutdata.
Regler, kontroller og kontroller som begrenser usikker eller uønsket modelladferd.
Når en modell genererer flytende, men falsk eller ikke-støttet informasjon.
En arbeidsflyt der mennesker gjennomgår, veileder eller overstyrer AI-utdata.
En konfigurasjonsverdi satt før trening, for eksempel læringshastighet, batchstørrelse eller dybde.
En modells evne til å følge mønstre fra eksempler gitt direkte i ledeteksten.
Kjøretidsfasen der en trent modell genererer spådommer eller utdata.
Mengden prosessorkraft som forbrukes mens du produserer hver respons.
Finjustere en modell på instruksjon-svar-par for å forbedre oppgavefølgen.
Forutsi brukerens formål fra en tekstspørring for å rute den riktig.
En rask teknikk beregnet på å omgå en modells sikkerhetsbegrensninger.
Det siste tidspunktet gjenspeiles i en modells treningsdata.
Trene en mindre modell for å imitere utgangene til en større modell.
En grafstruktur av enheter og relasjoner som brukes til resonnement eller gjenfinning.
En regulariseringsmetode som myker opp harde etiketter for å forbedre generaliseringen.
Tiden mellom sending av en forespørsel og mottak av modellens utdata.
En språkmodell trent på massive tekstkorpus for å generere og analysere tekst.
En treningshyperparameter som kontrollerer hvor mye parametere endrer hvert oppdateringstrinn.
En parametereffektiv finjusteringsmetode som legger til lavrangerte adaptermatriser.
Et matematisk mål som kvantifiserer prediksjonsfeil under trening.
Metoder som lar systemer lære mønstre fra data og forbedre seg over tid.
Lagret kontekst en AI-agent bruker på tvers av trinn eller økter for å forbedre kontinuiteten.
En arkitektur med spesialiserte undernettverk der kun utvalgte eksperter kjører per inngang.
Dokumentasjon som beskriver en modells tiltenkte bruk, beregninger, begrensninger og risikoer.
Ytelsesforringelse over tid ettersom forhold i den virkelige verden avviker fra treningsforutsetninger.
Reduserer numerisk presisjon av modellvekter for å redusere minne- og slutningskostnadene.
En modell som kan behandle eller generere flere datatyper som tekst, bilde og lyd.
En NLP-oppgave som identifiserer enheter som personer, steder, datoer eller organisasjoner.
Grenen til AI fokuserte på å forstå og generere menneskelig språk.
En lagdelt beregningsmodell inspirert av biologiske nevroner og synapser.
Transformere verdier til en konsistent skala for å forbedre optimaliseringsstabiliteten.
Teknologi som konverterer tekst i bilder eller skanner til maskinlesbar tekst.
En modell utgitt med offentlige vekter eller kode for inspeksjon, tilpasning og gjenbruk.
Når en modell husker treningsdata og yter dårlig på usynlige innganger.
En lært vekt inne i en modell som påvirker dens utganger.
Metoder som tilpasser modeller ved å trene opp en liten delmengde av ekstra parametere.
En språkmodellmåling som måler hvor overrasket modellen er over sanne neste tokens.
En ordnet arbeidsflyt av forbehandling, modelltrinn og etterbehandlingstrinn.
Andelen predikerte positive som faktisk er riktige.
Innledende modelltrening i stor skala på brede data før nedstrøms tilpasning.
Inndatainstruksjonene og konteksten gitt til en generativ modell.
Utforme spørsmål for å forbedre utskriftskvalitet, pålitelighet og kontrollerbarhet.
Et angrepsmønster der ondsinnede instruksjoner settes inn i modellinndata eller hentet innhold.
Fjerning av mindre viktige modellvekter eller nevroner for å redusere størrelse og beregne.
Konvertering av modellvekter til formater med lavere presisjon som 8-bit eller 4-bit.
En metode som henter ekstern kunnskap og mater den inn i generering på slutningstidspunkt.
Andelen faktiske positive som en modell identifiserer korrekt.
En modellpipeline som forutsier brukerpreferanser for rangering av innhold eller produkter.
Stresstesting av et AI-system med motstridende meldinger for å avsløre feil og risikoer.
Trening med belønningssignaler der en agent lærer handlinger som maksimerer langsiktig avkastning.
En treningsmetode som bruker menneskelige preferansesignaler for å forme modellatferd.
Finne relevante dokumenter eller poster fra en kunnskapskilde for en spørring.
En modell som skårer utganger basert på preferansesignaler, ofte brukt i RLHF-rørledninger.
En modells evne til å opprettholde ytelsen under støy, skift eller motstridende innganger.
Et modereringslag som blokkerer eller omskriver usikre modellinndata eller utganger.
Et empirisk forhold som viser hvordan ytelsen forbedres med modellstørrelse, data eller beregning.
Søk som samsvarer med betydning i stedet for eksakt søkeordoverlapping, ofte ved hjelp av innebygginger.
Lære representasjoner fra umerkede data ved å forutsi maskerte eller transformerte deler.
En NLP-oppgave som klassifiserer emosjonell tone eller mening i tekst.
En kompakt språkmodell optimalisert for lavere ventetid, kostnader eller bruk på enheten.
En modell hvor mange parametere er null eller inaktive for å redusere beregningen.
Trening av en modell med merkede eksempler som kartlegger innganger til kjente utganger.
Kunstig genererte data som brukes til å utvide, simulere eller beskytte sensitive treningsdata.
En høyprioritet instruksjon som angir atferd, policy og responsstil for en modell.
En samplingsinnstilling som kontrollerer tilfeldighet i genererte utdata.
En tekstbit behandlet av språkmodeller, for eksempel et ordstykke eller symbol.
Prosessen med å dele opp tekst i tokens for modellinndata.
En modells evne til å kalle eksterne verktøy som søk, kalkulatorer eller APIer.
En dekodingsstrategi som prøver bare fra de k mest sannsynlig neste tokene.
En dekodingsstrategi som sampler fra det minste tokensettet hvis sannsynligheter summerer til p.
Bruke kunnskap lært i én oppgave eller domene for å forbedre en annen oppgave.
En nevral arkitektur som bruker oppmerksomhet til å modellere forhold på tvers av sekvenser parallelt.
Modellfeilverdien beregnet under trening og optimalisert nedover over tid.
Lære mønstre fra umerkede data uten eksplisitte målutganger.
Et datasett som brukes under utvikling for å justere modeller og forhindre overtilpasning.
En database optimalisert for lagring og spørring av høydimensjonale innebyggingsvektorer.
En multimodal modell som i fellesskap behandler visuell og tekstlig informasjon.
Bruke støyende, heuristiske eller delvise etiketter for å trene modeller når rene etiketter er knappe.
En lært numerisk verdi som skalerer signaler som passerer gjennom et nevralt nettverk.
En tett vektorrepresentasjon av ord som fanger semantiske relasjoner.
Teknikker og praksis for å gjøre AI-spådommer mer transparente og forståelige.
Løse oppgaver uten oppgavespesifikke eksempler ved å stole på forkunnskaper.
En flertrinnsprosess der et AI-system planlegger, utfører, sjekker resultater og itererer mot et mål.
EUs risikobaserte regelverk for AI-systemer og leverandører.
Den ekstra kostnaden i tid, beregning eller produkthastighet som kreves for å gjøre systemene tryggere og mer kontrollerbare.
Når referansetesteksempler eller nære varianter er tilstede i treningsdata, øker rapportert ytelse.
Metoder for å estimere årsak-virkning-sammenhenger fremfor enkle sammenhenger.
Et statistisk område som sannsynligvis inneholder den sanne verdien av en målt modellberegning.
En trenings- og atferdsformende tilnærming der modellutdata styres av et fast sett med skriftlige prinsipper.
En oversikt over hvor data kom fra, hvordan de ble transformert og hvor de brukes.
Den dokumenterte opprinnelsen, eierskapet og historien til et datasett eller modellartefakt.
En personvernteknikk som legger til statistisk støy slik at individuelle poster ikke kan utledes pålitelig fra utdata.
En mindre modell trent til å imitere en større modells oppførsel mens du bruker mindre beregning ved inferens.
En modell spesialisert for å konvertere data til vektorer som brukes til semantisk søk, gruppering og gjenfinning.
Et repeterbart evalueringsrammeverk som kjører forespørsler, datasett og scoringslogikk på tvers av modellversjoner.
Et administrert system for lagring og servering av validerte ML-funksjoner konsekvent for trening og slutninger.
I hvilken grad en AI-respons støttes av kildedata eller hentet bevis.
En generasjonsstrategi som begrenser utdatatokens til gyldige strukturer eller policy-kompatible valg.
En modell trent på menneskelige rangeringer for å forutsi hvilke svar brukere sannsynligvis foretrekker.
Et distribuert API-grensesnitt som mottar modellforespørsler og returnerer spådommer i produksjon.
En kurert samling av dokumenter eller poster som brukes til henting, støtteautomatisering eller jordingssvar.
Et komprimert representasjonsrom hvor lignende konsepter er plassert nær hverandre som vektorer.
En sentral katalog for versjonering, godkjenning og sporing av modeller på tvers av miljøer.
AI-slutning utført lokalt på brukermaskinvare i stedet for i en ekstern skytjeneste.
Logikk som validerer og konverterer modellutdata til sterkt maskinskrevne, maskinbrukbare strukturer.
Et gjenbrukbart ledetekstmønster med variabler, formateringsregler og oppgavespesifikke instruksjoner.
Andelen av hentede elementer som er relevante for brukerens forespørsel.
Et strukturert argument, støttet av bevis, for at et AI-system er trygt for en definert brukskontekst.
Å kjøre en modell parallelt med produksjonstrafikk uten å påvirke brukervendte beslutninger.
Modellutdata begrenset til et definert skjema som JSON, verktøyargumenter eller innskrevne felt.
Ytterligere slutningsberegning brukt under generering av respons for å forbedre kvalitet eller resonnement.
Justere brukertilliten til AI-utdata med systemets faktiske pålitelighet i hver oppgave.
Prissetting der kostnadene skaleres med API-kall, tokens, slutningstid eller forbrukt databehandling.
En policy der nyttelaster for forespørsel/svar ikke lagres etter behandling utover kortvarige driftsvinduer.
En inferensakselerasjonsmetode der et lite utkast til modell foreslår tokens som en større modell verifiserer parallelt.
Lagrede nøkkel- og verditensorer fra tidligere tokens som lar transformatorer generere nye tokens uten å omberegne tidligere oppmerksomhet.
En åpen protokoll som lar AI-applikasjoner koble til eksterne verktøy, datakilder og kontekstleverandører på en standard måte.
En iterativ syklus der en AI-agent observerer, planlegger, handler og reflekterer til den fullfører et mål eller treffer en stopptilstand.
Et oppfordringsmønster som blander resonnementtrinn med handlinger for bruk av verktøy for å løse oppgaver mer pålitelig.
En resonnerende tilnærming der en modell utforsker flere forgreningsløsninger og velger de mest lovende.
En treningsmetode som finjusterer modeller direkte på preferansepar uten å trenge en egen belønningsmodell.
En finjusteringsteknikk som kombinerer 4-bits vektkvantisering med LoRA-adaptere for å redusere minnebehov.
En optimalisert oppmerksomhetsalgoritme som reduserer minnebruk og øker hastigheten på transformatortrening og slutninger.
En transformatormekanisme som kjører flere oppmerksomhetsoperasjoner parallelt for å fange opp ulike typer relasjoner.
Informasjon lagt til token-innbygging slik at transformatorer kan skille rekkefølgen.
En posisjonell kodingsmetode som roterer spørrings- og nøkkelvektorer for å kode relative tokenposisjoner.
En posisjonell skjevhetsmetode som straffer oppmerksomhetsscore basert på symbolsk avstand, og hjelper modeller med å ekstrapolere til lengre sammenhenger.
Et oppmerksomhetsmønster der hvert token kun passer på et vindu med fast størrelse av tokens i nærheten for å redusere beregningen.
En underordstokeniseringsalgoritme som slår sammen de hyppigste tegnparene til gjenbrukbare tokens.
En språkagnostisk tokenizer som lærer underordenheter direkte fra rå tekst uten å forhåndssplitte på mellomrom.
Algoritmer som finner vektorer nær en spørring uten uttømmende sammenligning, bytter nøyaktighet for hastighet.
En grafbasert indeksstruktur for raskt, tilnærmet nærmeste nabosøk over høydimensjonale vektorer.
En modell som omorganiserer et innledende sett med hentede resultater for å plassere de mest relevante elementene øverst.
En gjenfinningstilnærming som kombinerer nøkkelord (leksikalsk) søk med vektor (semantisk) søk for bedre gjenkalling og presisjon.
En modell som skårer en spørring og et dokument sammen i ett pass for høy nøyaktige relevansvurderinger.
En modell som koder forespørsler og dokumenter i separate vektorer slik at de kan sammenlignes raskt i skala.
Bruke en språkmodell for å score eller sammenligne resultater fra andre modeller under evaluering.
En kodeevalueringsmetrikk som måler sjansen for at minst én av k genererte sampler består testene.
En benchmark som tester språkmodeller på tvers av 57 akademiske og profesjonelle fag ved hjelp av flervalgsspørsmål.
En benchmark av Python-programmeringsproblemer som brukes til å måle kodegenereringskorrekthet via enhetstester.
En målestokk for matematikkordproblemer på grunnskolen som brukes til å evaluere trinnvise resonnementer i språkmodeller.
Hvor nøyaktig en modells påstander samsvarer med verifiserbar informasjon fra den virkelige verden.
Referanser til kildepassasjer eller dokumenter inkludert i en modells svar for å støtte påstandene.
Innbygging av et detekterbart signal i AI-generert tekst eller media slik at det senere kan identifiseres som maskinprodusert.
En mellomopplæringsfase mellom førtrening og ettertrening, ofte brukt til kapasitets- eller domenejusteringer.
Treningstrinn brukt etter forhåndstrening, for eksempel instruksjonsinnstilling, preferanseoptimalisering og sikkerhetsinnstilling.
Et treningsoppsett der en modell forbedres ved å generere data gjennom interaksjoner eller konkurranser med kopier av seg selv.
En gjenfinningsmetode som genererer flere søkevarianter, henter resultater for hver og slår sammen rangeringene.
En gjenfinningsteknikk som omskriver brukersøket til flere varianter for å forbedre tilbakekallingen.
Et gjenfinningsmønster som søker i små biter, men returnerer de større overordnede dokumentene for rikere kontekst.
En dekodingsalgoritme som holder de øverste flere kandidatsekvensene ved hvert trinn for å finne utganger med høyere sannsynlighet.
En dekodingsinnstilling som senker sannsynligheten for tokens modellen allerede har produsert for å redusere løkker.
En dekodingsinnstilling som reduserer sannsynligheten for tokens proporsjonalt med hvor ofte de har dukket opp så langt.
En dekodingsinnstilling som reduserer sannsynligheten for at tokens i det hele tatt har dukket opp, og oppmuntrer til nye emner.