AGI (Künstliche Allgemeine Intelligenz)
Ein hypothetisches KI-System, das die meisten intellektuellen Aufgaben in vielen Bereichen auf menschlicher Ebene ausführen kann.
Grundlegende Fachterminologie in höchster Klarheit erklärt. Konzipiert für Forscher, Studierende und menschenzentrierte Bildung.
Zeigt 213 passende Begriffe.
Ein hypothetisches KI-System, das die meisten intellektuellen Aufgaben in vielen Bereichen auf menschlicher Ebene ausführen kann.
Ein Softwaresystem, das beobachten, schlussfolgern und Maßnahmen ergreifen kann, um ein Ziel zu erreichen, häufig unter Einsatz von Werkzeugen und Gedächtnis.
Die Arbeit, KI-Systeme dazu zu bringen, sich entsprechend den Absichten, Werten und Sicherheitsbeschränkungen des Menschen zu verhalten.
Richtlinien, Standards und Aufsichtsmechanismen, die die Entwicklung und Nutzung von KI in der Gesellschaft steuern.
Ein Bereich, der sich auf die Reduzierung schädlichen Verhaltens, Ausfällen und Missbrauchsrisiken in KI-Systemen konzentriert.
Ein definierter Satz von Regeln oder Schritten, die ein Computer befolgt, um ein Problem zu lösen oder eine Aufgabe abzuschließen.
Systematische Ungerechtigkeit bei Modellergebnissen, die durch verzerrte Daten, Annahmen oder Modellierungsentscheidungen verursacht wird.
Wie klar die Logik, Datenquellen und Einschränkungen eines KI-Systems dokumentiert und verständlich sind.
Vom Menschen hinzugefügte Bezeichnungen oder Metadaten, die zum Trainieren oder Bewerten von Modellen für maschinelles Lernen verwendet werden.
Eine strukturierte Möglichkeit für ein Softwaresystem, Anfragen an ein anderes System zu senden und Antworten von diesem zu empfangen.
Das weite Feld des Aufbaus von Systemen, die Aufgaben ausführen, die Mustererkennung, Argumentation, Sprache oder Entscheidungsfindung erfordern.
Eine Modellkomponente, die sich beim Erzeugen einer Ausgabe dynamisch auf relevante Teile einer Eingabe konzentriert.
Ein System, das mit begrenzter oder keiner direkten menschlichen Kontrolle in Echtzeit Entscheidungen treffen und handeln kann.
Der zentrale Trainingsalgorithmus, der Modellgewichte aktualisiert, indem er Vorhersagefehler rückwärts durch das Netzwerk weiterleitet.
Ein einfaches Referenzmodell, das verwendet wird, um zu vergleichen, ob komplexere Ansätze tatsächlich die Ergebnisse verbessern.
Ein standardisierter Test oder Datensatz zum Messen und Vergleichen der Modellleistung.
Ein konsistentes Muster von Fehlern oder Ungerechtigkeiten im Daten- oder Modellverhalten.
Sehr große und komplexe Datensätze, die skalierbare Speicher- und Verarbeitungstechniken erfordern.
Ein Modell, dessen interne Argumentation von Menschen nur schwer direkt interpretiert werden kann.
Wie gut die Konfidenzwerte eines Modells mit den tatsächlichen Korrektheitswahrscheinlichkeiten übereinstimmen.
Ein Argumentationsstil, bei dem ein KI-Modell ein Problem in Zwischenschritte zerlegt.
Eine Aufgabe, bei der ein Modell eine Eingabe einer oder mehreren vordefinierten Kategorien zuordnet.
Ein Modell, das speziell für Klassifizierungsaufgaben entwickelt wurde.
Eine multimodale Modellarchitektur, die gemeinsame Darstellungen zwischen Text und Bildern lernt.
Die zum Trainieren und Ausführen von Modellen erforderlichen Verarbeitungsressourcen, oft gemessen in FLOPS oder GPU-Stunden.
Der Zweig der KI, der aus Bildern und Videos Bedeutung extrahiert.
Die maximale Anzahl an Eingabetokens, die ein Sprachmodell gleichzeitig verarbeiten kann.
Trainingsansätze, die es einem Modell ermöglichen, kontinuierlich aus neuen Daten zu lernen, ohne Vorkenntnisse zu vergessen.
Eine neuronale Architektur, die für die Verarbeitung gitterartiger Daten wie Bilder optimiert ist.
Eine gängige Zielfunktion, die zum Trainieren von Klassifizierungsmodellen durch Bestrafung falscher Wahrscheinlichkeiten verwendet wird.
Techniken, die modifizierte Trainingsbeispiele erstellen, um die Modellverallgemeinerung zu verbessern.
Eine Verschiebung der realen Eingabedaten im Laufe der Zeit, die die Modellleistung beeinträchtigen kann.
Der Prozess der Zuweisung von Tags oder Zielausgaben zu Rohdaten für überwachtes Lernen.
Eine Sammlung strukturierter oder unstrukturierter Beispiele, die für Schulung, Validierung oder Tests verwendet werden.
Die Oberfläche im Merkmalsraum, die von einem Klassifikator vorhergesagte Klassen trennt.
Ein Modell, das Vorhersagen durch eine Folge von Wenn-Dann-Merkmalsaufteilungen trifft.
Eine Teilmenge des maschinellen Lernens, die mehrschichtige neuronale Netze zum Repräsentationslernen verwendet.
Eine generative Architektur, die lernt, Rauschen umzukehren, um Bilder, Audio oder andere Inhalte zu synthetisieren.
Komprimieren von Wissen aus einem großen Lehrermodell in ein kleineres Schülermodell.
Methoden, die ein in einer Domäne trainiertes Modell übertragen, um in einer anderen Domäne eine bessere Leistung zu erzielen.
Eine numerische Vektordarstellung, die die semantische Bedeutung von Text, Bildern oder anderen Daten erfasst.
Die Komponente eines Modells, die Eingaben in latente Darstellungen umwandelt.
Kombinieren von Vorhersagen aus mehreren Modellen zur Verbesserung der Robustheit oder Genauigkeit.
Ein zurückgehaltener Datensatz, der zur Messung der Modellqualität nach dem Training verwendet wird.
Der Grad, in dem das Verhalten eines Modells für Menschen interpretiert und erklärt werden kann.
Eine falsche Vorhersage, bei der ein Modell einen echten positiven Fall übersieht.
Eine falsche Vorhersage, bei der ein Modell einen negativen Fall fälschlicherweise als positiv kennzeichnet.
Eine Eingabevariable, die von einem Modell verwendet wird, um Vorhersagen zu treffen.
Entwerfen oder Transformieren von Eingabevariablen, um das Lernen einfacher und effektiver zu machen.
Konvertieren von Rohdaten in informative Funktionen, die ein Modell verwenden kann.
Verhalten aus nur wenigen Beispielen lernen oder anpassen.
Fortgesetztes Training zu domänenspezifischen Daten, um ein vorab trainiertes Modell an eine bestimmte Aufgabe anzupassen.
Ein großes vorab trainiertes Modell, das an viele nachgelagerte Aufgaben angepasst werden kann.
Eine Modellfunktion zum Generieren strukturierter Aufrufe, die externe Tools oder APIs auslösen.
Ein generativer Aufbau, bei dem ein Generator und ein Diskriminator gegeneinander trainieren.
Wie gut ein Modell mit neuen, unsichtbaren Daten außerhalb des Trainingssatzes abschneidet.
KI-Systeme, die neue Inhalte wie Texte, Bilder, Audio, Video oder Code produzieren.
Ein Vektor, der zeigt, um wie viel sich jeder Parameter ändern sollte, um Verluste zu reduzieren.
Eine Optimierungsmethode, die Parameter in der Richtung aktualisiert, die Fehler reduziert.
Vertrauenswürdige Referenzlabels zum Trainieren oder Bewerten von Modellausgaben.
Regeln, Prüfungen und Kontrollen, die unsicheres oder unerwünschtes Modellverhalten begrenzen.
Wenn ein Modell fließende, aber falsche oder nicht unterstützte Informationen generiert.
Ein Arbeitsablauf, bei dem Menschen KI-Ausgaben überprüfen, steuern oder überschreiben.
Ein vor dem Training festgelegter Konfigurationswert, z. B. Lernrate, Stapelgröße oder Tiefe.
Die Fähigkeit eines Modells, Mustern anhand von Beispielen zu folgen, die direkt in der Eingabeaufforderung bereitgestellt werden.
Die Laufzeitphase, in der ein trainiertes Modell Vorhersagen oder Ausgaben generiert.
Die Menge an Rechenleistung, die bei der Erstellung jeder Antwort verbraucht wird.
Feinabstimmung eines Modells für Anweisungs-Antwort-Paare, um die Aufgabenverfolgung zu verbessern.
Den Zweck des Benutzers anhand einer Textabfrage vorhersagen, um ihn korrekt weiterzuleiten.
Eine schnelle Technik, mit der die Sicherheitsbeschränkungen eines Modells umgangen werden sollen.
Der letzte Zeitpunkt, der in den Trainingsdaten eines Modells widergespiegelt wird.
Trainieren Sie ein kleineres Modell, um die Ausgaben eines größeren Modells zu imitieren.
Eine Diagrammstruktur aus Entitäten und Beziehungen, die zur Schlussfolgerung oder zum Abruf verwendet wird.
Eine Regularisierungsmethode, die harte Bezeichnungen mildert, um die Generalisierung zu verbessern.
Die Zeit zwischen dem Senden einer Anfrage und dem Empfang der Modellausgabe.
Ein Sprachmodell, das auf umfangreichen Textkorpora trainiert wurde, um Text zu generieren und zu analysieren.
Ein Trainingshyperparameter, der steuert, wie stark Parameter sich bei jedem Aktualisierungsschritt ändern.
Eine parametereffiziente Feinabstimmungsmethode, die Adaptermatrizen mit niedrigem Rang hinzufügt.
Ein mathematisches Ziel, das Vorhersagefehler während des Trainings quantifiziert.
Methoden, die es Systemen ermöglichen, Muster aus Daten zu lernen und sich im Laufe der Zeit zu verbessern.
Gespeicherter Kontext, den ein KI-Agent schritt- oder sitzungsübergreifend verwendet, um die Kontinuität zu verbessern.
Eine Architektur mit spezialisierten Subnetzwerken, in denen nur ausgewählte Experten pro Eingabe arbeiten.
Dokumentation, die den Verwendungszweck, die Metriken, Einschränkungen und Risiken eines Modells beschreibt.
Leistungsabfall im Laufe der Zeit, da die realen Bedingungen von den Trainingsannahmen abweichen.
Reduzierung der numerischen Genauigkeit von Modellgewichten, um Speicher- und Inferenzkosten zu senken.
Ein Modell, das mehrere Datentypen wie Text, Bild und Audio verarbeiten oder generieren kann.
Eine NLP-Aufgabe, die Entitäten wie Personen, Orte, Daten oder Organisationen identifiziert.
Der Zweig der KI konzentrierte sich auf das Verstehen und Erzeugen menschlicher Sprache.
Ein geschichtetes Rechenmodell, inspiriert von biologischen Neuronen und Synapsen.
Transformieren von Werten in eine konsistente Skala, um die Optimierungsstabilität zu verbessern.
Technologie, die Text in Bildern oder Scans in maschinenlesbaren Text umwandelt.
Ein Modell, das mit öffentlichen Gewichten oder Code zur Überprüfung, Anpassung und Wiederverwendung freigegeben wird.
Wenn ein Modell Trainingsdaten speichert und bei unsichtbaren Eingaben eine schlechte Leistung erbringt.
Ein erlerntes Gewicht innerhalb eines Modells, das seine Ausgaben beeinflusst.
Methoden, die Modelle anpassen, indem sie eine kleine Teilmenge hinzugefügter Parameter trainieren.
Eine Sprachmodellmetrik, die misst, wie überrascht das Modell von echten nächsten Token ist.
Ein geordneter Arbeitsablauf aus Vorverarbeitungs-, Modellschritten und Nachverarbeitungsphasen.
Der Anteil der vorhergesagten positiven Ergebnisse, die tatsächlich korrekt sind.
Erstes groß angelegtes Modelltraining auf breiten Daten vor der nachgelagerten Anpassung.
Die Eingabeanweisungen und der Kontext, die einem generativen Modell bereitgestellt werden.
Entwerfen von Eingabeaufforderungen zur Verbesserung der Ausgabequalität, Zuverlässigkeit und Kontrollierbarkeit.
Ein Angriffsmuster, bei dem böswillige Anweisungen in Modelleingaben oder abgerufene Inhalte eingefügt werden.
Entfernen weniger wichtiger Modellgewichte oder Neuronen, um Größe und Rechenleistung zu reduzieren.
Konvertieren von Modellgewichten in Formate mit geringerer Genauigkeit wie 8-Bit oder 4-Bit.
Eine Methode, die externes Wissen abruft und es zum Zeitpunkt der Inferenz in die Generierung einspeist.
Der Anteil tatsächlich positiver Ergebnisse, die ein Modell korrekt identifiziert.
Eine Modellpipeline, die Benutzerpräferenzen für das Ranking von Inhalten oder Produkten vorhersagt.
Stresstest eines KI-Systems mit gegnerischen Eingabeaufforderungen, um Fehler und Risiken aufzudecken.
Training durch Belohnungssignale, bei dem ein Agent Aktionen lernt, die den langfristigen Ertrag maximieren.
Eine Trainingsmethode, die menschliche Präferenzsignale nutzt, um Modellverhalten zu formen.
Suchen relevanter Dokumente oder Datensätze aus einer Wissensquelle für eine Abfrage.
Ein Modell, das Ausgaben basierend auf Präferenzsignalen bewertet und häufig in RLHF-Pipelines verwendet wird.
Die Fähigkeit eines Modells, die Leistung unter Rauschen, Verschiebungen oder widersprüchlichen Eingaben aufrechtzuerhalten.
Eine Moderationsebene, die unsichere Modelleingaben oder -ausgaben blockiert oder umschreibt.
Eine empirische Beziehung, die zeigt, wie sich die Leistung mit der Modellgröße, den Daten oder der Rechenleistung verbessert.
Suche, die eher der Bedeutung entspricht als der exakten Überschneidung von Schlüsselwörtern, häufig unter Verwendung von Einbettungen.
Lernen von Darstellungen aus unbeschrifteten Daten durch Vorhersage maskierter oder transformierter Teile.
Eine NLP-Aufgabe, die den emotionalen Ton oder die Meinung im Text klassifiziert.
Ein kompaktes Sprachmodell, das für geringere Latenz, Kosten oder Nutzung auf dem Gerät optimiert ist.
Ein Modell, bei dem viele Parameter Null oder inaktiv sind, um den Rechenaufwand zu reduzieren.
Trainieren Sie ein Modell mit beschrifteten Beispielen, die Eingaben bekannten Ausgaben zuordnen.
Künstlich generierte Daten, die zur Erweiterung, Simulation oder zum Schutz sensibler Trainingsdaten verwendet werden.
Eine Anweisung mit hoher Priorität, die Verhalten, Richtlinien und Reaktionsstil für ein Modell festlegt.
Eine Stichprobeneinstellung, die die Zufälligkeit in generierten Ausgaben steuert.
Ein von Sprachmodellen verarbeiteter Textblock, beispielsweise ein Wortteil oder ein Symbol.
Der Prozess der Aufteilung von Text in Token zur Modelleingabe.
Die Fähigkeit eines Modells, externe Tools wie Suche, Rechner oder APIs aufzurufen.
Eine Dekodierungsstrategie, die nur die k wahrscheinlichsten nächsten Token abtastet.
Eine Dekodierungsstrategie, die Stichproben aus dem kleinsten Token-Satz macht, dessen Wahrscheinlichkeiten sich zu p summieren.
Anwenden des in einer Aufgabe oder Domäne erworbenen Wissens zur Verbesserung einer anderen Aufgabe.
Eine neuronale Architektur, die Aufmerksamkeit nutzt, um Beziehungen über Sequenzen hinweg parallel zu modellieren.
Der während des Trainings berechnete und im Laufe der Zeit nach unten optimierte Modellfehlerwert.
Lernmuster aus unbeschrifteten Daten ohne explizite Zielausgaben.
Ein Datensatz, der während der Entwicklung verwendet wird, um Modelle zu optimieren und eine Überanpassung zu verhindern.
Eine Datenbank, die für die Speicherung und Abfrage hochdimensionaler Einbettungsvektoren optimiert ist.
Ein multimodales Modell, das visuelle und textliche Informationen gemeinsam verarbeitet.
Verwendung von verrauschten, heuristischen oder partiellen Labels zum Trainieren von Modellen, wenn saubere Labels knapp sind.
Ein erlernter numerischer Wert, der Signale skaliert, die ein neuronales Netzwerk durchlaufen.
Eine dichte Vektordarstellung von Wörtern, die semantische Beziehungen erfasst.
Techniken und Praktiken, um KI-Vorhersagen transparenter und verständlicher zu machen.
Lösen von Aufgaben ohne aufgabenspezifische Beispiele durch Rückgriff auf allgemeines Vorwissen.
Ein mehrstufiger Prozess, bei dem ein KI-System plant, ausführt, Ergebnisse überprüft und auf ein Ziel hin iteriert.
Der risikobasierte Regulierungsrahmen der Europäischen Union für KI-Systeme und -Anbieter.
Der zusätzliche Zeit-, Rechen- oder Produktgeschwindigkeitsaufwand, der erforderlich ist, um Systeme sicherer und kontrollierbarer zu machen.
Wenn Benchmark-Testbeispiele oder ähnliche Varianten in Trainingsdaten vorhanden sind, erhöht sich die gemeldete Leistung.
Methoden zur Schätzung von Ursache-Wirkungs-Beziehungen anstelle einfacher Korrelationen.
Ein statistischer Bereich, der wahrscheinlich den wahren Wert einer gemessenen Modellmetrik enthält.
Ein Trainings- und Verhaltensformungsansatz, bei dem die Modellergebnisse von einem festen Satz schriftlicher Prinzipien geleitet werden.
Eine Aufzeichnung darüber, woher die Daten stammen, wie sie umgewandelt wurden und wo sie verwendet werden.
Der dokumentierte Ursprung, Eigentümer und Verlauf eines Datensatzes oder Modellartefakts.
Eine Datenschutztechnik, die statistisches Rauschen hinzufügt, sodass einzelne Datensätze nicht zuverlässig aus den Ausgaben abgeleitet werden können.
Ein kleineres Modell, das darauf trainiert wurde, das Verhalten eines größeren Modells zu imitieren und gleichzeitig weniger Rechenleistung bei der Inferenz zu verbrauchen.
Ein Modell, das auf die Konvertierung von Daten in Vektoren spezialisiert ist, die für die semantische Suche, das Clustering und den Abruf verwendet werden.
Ein wiederholbares Bewertungsframework, das Eingabeaufforderungen, Datensätze und Bewertungslogik modellübergreifend ausführt.
Ein verwaltetes System zum konsistenten Speichern und Bereitstellen validierter ML-Funktionen für Training und Inferenz.
Der Grad, in dem eine KI-Reaktion durch Quelldaten oder abgerufene Beweise gestützt wird.
Eine Generierungsstrategie, die Ausgabetokens auf gültige Strukturen oder richtlinienkonforme Auswahlmöglichkeiten beschränkt.
Ein auf menschlichen Rankings trainiertes Modell, um vorherzusagen, welche Antworten Benutzer wahrscheinlich bevorzugen.
Eine bereitgestellte API-Schnittstelle, die Modellanfragen empfängt und Vorhersagen in der Produktion zurückgibt.
Eine kuratierte Sammlung von Dokumenten oder Datensätzen, die zum Abrufen, zur Support-Automatisierung oder zur Kontaktaufnahme verwendet werden.
Ein komprimierter Darstellungsraum, in dem ähnliche Konzepte als Vektoren nebeneinander positioniert sind.
Ein zentraler Katalog zur Versionierung, Genehmigung und Nachverfolgung von Modellen in verschiedenen Umgebungen.
KI-Inferenz wird lokal auf der Benutzerhardware und nicht in einem Remote-Cloud-Dienst durchgeführt.
Logik, die die Modellausgabe validiert und in stark typisierte, maschinenverwendbare Strukturen umwandelt.
Ein wiederverwendbares Eingabeaufforderungsmuster mit Variablen, Formatierungsregeln und aufgabenspezifischen Anweisungen.
Der Anteil der abgerufenen Elemente, die für die Anfrage des Benutzers relevant sind.
Ein strukturiertes, durch Beweise gestütztes Argument dafür, dass ein KI-System für einen definierten Nutzungskontext sicher ist.
Führen Sie ein Modell parallel zum Produktionsverkehr aus, ohne die Entscheidungen des Benutzers zu beeinflussen.
Die Modellausgabe ist auf ein definiertes Schema wie JSON, Toolargumente oder typisierte Felder beschränkt.
Zusätzliche Inferenzberechnungen, die während der Antwortgenerierung verwendet werden, um die Qualität oder Argumentation zu verbessern.
Abstimmung des Vertrauens der Benutzer in die KI-Ausgaben mit der tatsächlichen Zuverlässigkeit des Systems bei jeder Aufgabe.
Preisgestaltung, bei der die Kosten mit API-Aufrufen, Token, Inferenzzeit oder verbrauchter Rechenleistung skalieren.
Eine Richtlinie, bei der Anforderungs-/Antwortnutzdaten nach der Verarbeitung nicht über kurzlebige Betriebsfenster hinaus gespeichert werden.
Eine Inferenzbeschleunigungsmethode, bei der ein kleines Entwurfsmodell Token vorschlägt, die ein größeres Modell parallel überprüft.
Gespeicherte Schlüssel- und Werttensoren früherer Token, die es Transformatoren ermöglichen, neue Token zu generieren, ohne die bisherige Aufmerksamkeit neu zu berechnen.
Ein offenes Protokoll, das es KI-Anwendungen ermöglicht, auf standardmäßige Weise eine Verbindung zu externen Tools, Datenquellen und Kontextanbietern herzustellen.
Ein iterativer Zyklus, in dem ein KI-Agent beobachtet, plant, handelt und nachdenkt, bis er ein Ziel erreicht oder eine Stoppbedingung erreicht.
Ein Aufforderungsmuster, das Argumentationsschritte mit Werkzeugnutzungsaktionen verschachtelt, um Aufgaben zuverlässiger zu lösen.
Ein Argumentationsansatz, bei dem ein Modell mehrere verzweigte Lösungspfade untersucht und die vielversprechendsten auswählt.
Eine Trainingsmethode, die Modelle direkt anhand von Präferenzpaaren verfeinert, ohne dass ein separates Belohnungsmodell erforderlich ist.
Eine Feinabstimmungstechnik, die 4-Bit-Gewichtsquantisierung mit LoRA-Adaptern kombiniert, um den Speicherbedarf zu reduzieren.
Ein optimierter Aufmerksamkeitsalgorithmus, der den Speicherverbrauch reduziert und das Transformatortraining und die Inferenz beschleunigt.
Ein Transformatormechanismus, der mehrere Aufmerksamkeitsoperationen parallel ausführt, um verschiedene Arten von Beziehungen zu erfassen.
Zu Token-Einbettungen hinzugefügte Informationen, damit Transformatoren die Reihenfolge der Sequenzen unterscheiden können.
Eine Positionskodierungsmethode, die Abfrage- und Schlüsselvektoren dreht, um relative Tokenpositionen zu kodieren.
Eine Positionsbias-Methode, die Aufmerksamkeitswerte basierend auf der Token-Distanz bestraft und so Modellen hilft, auf längere Kontexte zu extrapolieren.
Ein Aufmerksamkeitsmuster, bei dem sich jedes Token nur um ein Fenster mit fester Größe benachbarter Token kümmert, um den Rechenaufwand zu reduzieren.
Ein Unterwort-Tokenisierungsalgorithmus, der die häufigsten Zeichenpaare in wiederverwendbaren Token zusammenführt.
Ein sprachunabhängiger Tokenizer, der Unterworteinheiten direkt aus Rohtext lernt, ohne vorher in Leerzeichen aufzuteilen.
Algorithmen, die Vektoren in der Nähe einer Abfrage ohne umfassenden Vergleich finden und dabei Genauigkeit gegen Geschwindigkeit eintauschen.
Eine graphbasierte Indexstruktur für die schnelle Suche nach ungefähren nächsten Nachbarn über hochdimensionale Vektoren.
Ein Modell, das einen anfänglichen Satz abgerufener Ergebnisse neu anordnet, um die relevantesten Elemente oben zu platzieren.
Ein Retrieval-Ansatz, der die Schlüsselwortsuche (lexikalisch) mit der Vektorsuche (semantisch) kombiniert, um eine bessere Recherche und Präzision zu erzielen.
Ein Modell, das eine Abfrage und ein Dokument in einem Durchgang bewertet, um hochpräzise Relevanzbeurteilungen zu ermöglichen.
Ein Modell, das Abfragen und Dokumente in separate Vektoren kodiert, damit sie im großen Maßstab schnell verglichen werden können.
Verwendung eines Sprachmodells zur Bewertung oder zum Vergleich der Ergebnisse anderer Modelle während der Evaluierung.
Eine Code-Bewertungsmetrik, die die Wahrscheinlichkeit misst, dass mindestens eine von k generierten Stichproben die Tests besteht.
Ein Benchmark, bei dem Sprachmodelle in 57 akademischen und beruflichen Fächern mithilfe von Multiple-Choice-Fragen getestet werden.
Ein Benchmark für Python-Programmierprobleme, mit dem die Korrektheit der Codegenerierung mithilfe von Komponententests gemessen wird.
Ein Benchmark für mathematische Wortaufgaben in der Grundschule, der zur Bewertung des schrittweisen Denkens in Sprachmodellen verwendet wird.
Wie genau die Behauptungen eines Modells mit überprüfbaren realen Informationen übereinstimmen.
Verweise auf Quellenpassagen oder Dokumente, die in der Antwort eines Modells enthalten sind, um seine Behauptungen zu untermauern.
Einbetten eines erkennbaren Signals in KI-generierte Texte oder Medien, damit es später als maschinell erzeugt identifiziert werden kann.
Eine Zwischentrainingsphase zwischen Pre-Training und Post-Training, die häufig für Leistungs- oder Domänenanpassungen verwendet wird.
Trainingsschritte, die nach dem Vortraining angewendet werden, z. B. Anweisungsoptimierung, Präferenzoptimierung und Sicherheitsoptimierung.
Ein Trainingsaufbau, bei dem sich ein Modell verbessert, indem es durch Interaktionen oder Wettbewerbe mit Kopien von sich selbst Daten generiert.
Eine Abrufmethode, die mehrere Abfragevarianten generiert, für jede die Ergebnisse abruft und die Rankings zusammenführt.
Eine Abruftechnik, die die Benutzerabfrage in mehrere Varianten umschreibt, um den Abruf zu verbessern.
Ein Abrufmuster, das kleine Teile durchsucht, aber die größeren übergeordneten Dokumente für einen umfassenderen Kontext zurückgibt.
Ein Dekodierungsalgorithmus, der bei jedem Schritt die besten Kandidatensequenzen beibehält, um Ausgaben mit höherer Wahrscheinlichkeit zu finden.
Eine Dekodierungseinstellung, die die Wahrscheinlichkeit von Token verringert, die das Modell bereits produziert hat, um Schleifen zu reduzieren.
Eine Dekodierungseinstellung, die die Wahrscheinlichkeit von Token proportional dazu verringert, wie oft sie bisher aufgetaucht sind.
Eine Dekodierungseinstellung, die die Wahrscheinlichkeit verringert, dass Token überhaupt aufgetaucht sind, und so neue Themen anregt.