Отворете Енциклопедия

Речникът на AI

Основната техническа терминология е обяснена на най-високо ниво на яснота. Предназначен за изследователи, студенти и ориентирано към човека образование.

213 условияТърсене + азбучен филтърДефиниции на обикновен език

Показване 213 съвпадащи термини.

AGI (общ изкуствен интелект)

Хипотетична AI система, която може да изпълнява повечето интелектуални задачи на човешко ниво в много области.

AI референтен термин

AI агент

Софтуерна система, която може да наблюдава, разсъждава и предприема действия за постигане на цел, често използвайки инструменти и памет.

AI референтен термин

AI подравняване

Работата по карането на AI системите да се държат според човешките намерения, ценности и ограничения за безопасност.

AI референтен термин

AI управление

Политики, стандарти и механизми за надзор, които ръководят как AI се разработва и използва в обществото.

AI референтен термин

AI Безопасност

Област, фокусирана върху намаляването на вредното поведение, отказите и рисковете от злоупотреба в системите с изкуствен интелект.

AI референтен термин

Алгоритъм

Дефиниран набор от правила или стъпки, които компютърът следва, за да разреши проблем или да изпълни задача.

AI референтен термин

Алгоритмично отклонение

Систематична несправедливост в резултатите от модела, причинена от изкривени данни, предположения или избор на моделиране.

AI референтен термин

Алгоритмична прозрачност

Колко ясно са документирани и разбираеми логиката на една AI система, източниците на данни и ограниченията.

AI референтен термин

Анотация

Добавени от човека етикети или метаданни, използвани за обучение или оценка на модели за машинно обучение.

AI референтен термин

API (интерфейс за програмиране на приложения)

Структуриран начин за една софтуерна система да изпраща заявки до и да получава отговори от друга система.

AI референтен термин

Изкуствен интелект (AI)

Широкото поле за изграждане на системи, които изпълняват задачи, изискващи разпознаване на модели, разсъждения, език или вземане на решения.

AI референтен термин

Механизъм на вниманието

Компонент на модел, който динамично се фокусира върху съответните части на вход, когато създава изход.

AI референтен термин

Автономна система

Система, която може да взема решения и да действа с ограничен или никакъв пряк човешки контрол в реално време.

AI референтен термин

Обратно разпространение

Основният алгоритъм за обучение, който актуализира теглата на модела чрез разпространение на грешките при прогнозиране назад през мрежата.

AI референтен термин

Базов модел

Прост референтен модел, използван за сравнение дали по-сложните подходи наистина подобряват резултатите.

AI референтен термин

Бенчмарк

Стандартизиран тест или набор от данни, използвани за измерване и сравняване на ефективността на модела.

AI референтен термин

Пристрастие

Последователен модел на грешка или несправедливост в данните или поведението на модела.

AI референтен термин

Големи данни

Много големи и сложни набори от данни, които изискват мащабируеми техники за съхранение и обработка.

AI референтен термин

Модел на черна кутия

Модел, чието вътрешно разсъждение е трудно да се интерпретира директно от хората.

AI референтен термин

Калибриране

Колко добре резултатите за увереност на модела съвпадат с реалните вероятности за коректност.

AI референтен термин

Верига на мисълта

Стил на разсъждение, при който AI модел разлага проблем на междинни стъпки.

AI референтен термин

Класификация

Задача, при която модел присвоява вход към една или повече предварително дефинирани категории.

AI референтен термин

Класификатор

Модел, създаден специално за класификационни задачи.

AI референтен термин

КЛИП

Архитектура на мултимодален модел, която научава споделени представяния между текст и изображения.

AI референтен термин

Изчислете

Ресурсите за обработка, необходими за обучение и изпълнение на модели, често измервани във FLOPS или GPU часове.

AI референтен термин

Компютърно зрение

Клонът на AI, който извлича смисъл от изображения и видео.

AI референтен термин

Контекстен прозорец

Максималното количество входни токени, които един езиков модел може да обработва наведнъж.

AI референтен термин

Непрекъснато обучение

Подходи за обучение, които позволяват на модела да продължи да се учи от нови данни, без да забравя предишни знания.

AI референтен термин

Конволюционна невронна мрежа (CNN)

Невронна архитектура, оптимизирана за обработка на мрежови данни, като изображения.

AI референтен термин

Кръстосана загуба на ентропия

Обща целева функция, използвана за обучение на класификационни модели чрез санкциониране на неправилни вероятности.

AI референтен термин

Увеличаване на данни

Техники, които създават модифицирани примери за обучение за подобряване на обобщаването на модела.

AI референтен термин

Дрейф на данни

Промяна във входните данни от реалния свят с течение на времето, която може да влоши производителността на модела.

AI референтен термин

Етикетиране на данни

Процесът на присвояване на етикети или целеви изходи на необработени данни за контролирано обучение.

AI референтен термин

Набор от данни

Колекция от структурирани или неструктурирани примери, използвани за обучение, валидиране или тестване.

AI референтен термин

Граница на решението

Повърхността в пространството на характеристиките, която разделя класовете, предвидени от класификатор.

AI референтен термин

Дърво на решенията

Модел, който прави прогнози чрез поредица от разделяния на характеристиките ако-тогава.

AI референтен термин

Дълбоко обучение

Подмножество от машинно обучение, което използва многослойни невронни мрежи за представяне на обучение.

AI референтен термин

Дифузионен модел

Генеративна архитектура, която се научава да обръща шума, за да синтезира изображения, аудио или друго съдържание.

AI референтен термин

Дестилация

Компресиране на знания от голям модел на учител в по-малък модел на ученик.

AI референтен термин

Адаптиране на домейна

Методи, които прехвърлят модел, обучен в един домейн, за да се представя по-добре в друг домейн.

AI референтен термин

Вграждане

Числово векторно представяне, което улавя семантичното значение на текст, изображения или други данни.

AI референтен термин

Енкодер

Компонентът на модел, който трансформира входа в латентни представяния.

AI референтен термин

Ансамбъл

Комбиниране на прогнози от множество модели за подобряване на устойчивостта или точността.

AI референтен термин

Комплект за оценка

Задържан набор от данни, използван за измерване на качеството на модела след обучение.

AI референтен термин

Обяснимост

Степента, до която поведението на модела може да бъде интерпретирано и обяснено на хората.

AI референтен термин

Фалшив отрицателен

Неправилна прогноза, при която модел пропуска истински положителен случай.

AI референтен термин

Фалшиво положителен

Неправилна прогноза, при която модел неправилно маркира отрицателен случай като положителен.

AI референтен термин

Характеристика

Входна променлива, използвана от модел за правене на прогнози.

AI референтен термин

Инженеринг на характеристиките

Проектиране или трансформиране на входни променливи, за да направи ученето по-лесно и по-ефективно.

AI референтен термин

Извличане на функции

Преобразуване на необработени данни в информативни функции, които моделът може да използва.

AI референтен термин

Малкократно обучение

Учене или адаптиране на поведение само от малък брой примери.

AI референтен термин

Фина настройка

Продължаващо обучение върху специфични за домейн данни за адаптиране на предварително обучен модел към конкретна задача.

AI референтен термин

Модел на основата

Голям предварително обучен модел, който може да се адаптира към много задачи надолу по веригата.

AI референтен термин

Извикване на функция

Възможност на модел за генериране на структурирани повиквания, които задействат външни инструменти или API.

AI референтен термин

GAN (Generative Adversarial Network)

Генеративна настройка, при която генератор и дискриминатор се тренират един срещу друг.

AI референтен термин

Обобщение

Колко добре се представя моделът върху нови, невиждани данни извън набора за обучение.

AI референтен термин

Генеративен AI

AI системи, които произвеждат ново съдържание като текст, изображения, аудио, видео или код.

AI референтен термин

Градиент

Вектор, показващ колко трябва да се промени всеки параметър, за да се намалят загубите.

AI референтен термин

Градиентно спускане

Метод за оптимизация, който актуализира параметрите в посока, която намалява грешката.

AI референтен термин

Основна истина

Доверени референтни етикети, използвани за обучение или оценка на изходните данни на модела.

AI референтен термин

Мантинели

Правила, проверки и контроли, които ограничават небезопасното или нежелано поведение на модела.

AI референтен термин

Халюцинации

Когато модел генерира плавна, но невярна или неподдържана информация.

AI референтен термин

Човек в цикъла

Работен процес, при който хората преглеждат, насочват или отменят изходите на AI.

AI референтен термин

Хиперпараметър

Конфигурационна стойност, зададена преди обучението, като скорост на обучение, размер на партида или дълбочина.

AI референтен термин

Обучение в контекст

Способността на модела да следва модели от примери, предоставени директно в подканата.

AI референтен термин

Извод

Фазата на изпълнение, при която обучен модел генерира прогнози или резултати.

AI референтен термин

Извод-изчисляване на времето

Количеството процесорна мощност, изразходвана при генериране на всеки отговор.

AI референтен термин

Инструкция за настройка

Фина настройка на модел на двойки инструкция-отговор, за да се подобри изпълнението на задачата.

AI референтен термин

Класификация на намеренията

Предсказване на целта на потребителя от текстова заявка, за да я маршрутизира правилно.

AI референтен термин

Бягство от затвора

Бърза техника, предназначена да заобиколи ограниченията за безопасност на модела.

AI референтен термин

Прекъсване на знанията

Последният момент във времето, отразен в данните за обучение на модел.

AI референтен термин

Дестилация на знания

Обучение на по-малък модел да имитира резултатите от по-голям модел.

AI референтен термин

Графика на знанието

Графична структура от обекти и връзки, използвани за разсъждение или извличане.

AI референтен термин

Изглаждане на етикети

Метод за регулиране, който омекотява твърдите етикети, за да подобри обобщението.

AI референтен термин

Латентност

Времето между изпращането на заявка и получаването на изхода на модела.

AI референтен термин

Голям езиков модел (LLM)

Езиков модел, обучен върху масивни текстови корпуси за генериране и анализиране на текст.

AI референтен термин

Скорост на обучение

Хиперпараметър за обучение, контролиращ колко параметри се променят при всяка стъпка на актуализиране.

AI референтен термин

LoRA (адаптация от нисък ранг)

Параметрично ефективен метод за фина настройка, който добавя адаптерни матрици с нисък ранг.

AI референтен термин

Функция загуба

Математическа цел, която количествено определя грешката при прогнозиране по време на обучение.

AI референтен термин

Машинно обучение (ML)

Методи, които позволяват на системите да научават модели от данни и да се подобряват с течение на времето.

AI референтен термин

Памет (памет на агент)

Съхраненият контекст, който AI агент използва през стъпките или сесиите, за да подобри непрекъснатостта.

AI референтен термин

Смес от експерти (MoE)

Архитектура със специализирани подмрежи, където само избрани експерти работят на вход.

AI референтен термин

Модел карта

Документация, описваща предвидената употреба на модела, показателите, ограниченията и рисковете.

AI референтен термин

Модел Дрифт

Влошаване на производителността с течение на времето, тъй като условията в реалния свят се различават от допусканията за обучение.

AI референтен термин

Квантуване на модела

Намаляване на числената точност на теглата на модела, за да се намалят разходите за памет и изводи.

AI референтен термин

Мултимодален модел

Модел, който може да обработва или генерира множество типове данни като текст, изображение и аудио.

AI референтен термин

Разпознаване на именуван обект (NER)

NLP задача, която идентифицира обекти като хора, места, дати или организации.

AI референтен термин

Обработка на естествен език (NLP)

Клонът на AI се фокусира върху разбирането и генерирането на човешки език.

AI референтен термин

Невронна мрежа

Слоест изчислителен модел, вдъхновен от биологични неврони и синапси.

AI референтен термин

Нормализация

Трансформиране на стойности в последователен мащаб за подобряване на стабилността на оптимизацията.

AI референтен термин

OCR (оптично разпознаване на символи)

Технология, която преобразува текст в изображения или сканиране в машинно четим текст.

AI референтен термин

Модел с отворен код

Модел, издаден с публични тегла или код за проверка, адаптиране и повторно използване.

AI референтен термин

Прекомерно оборудване

Когато моделът запаметява данни за обучение и се представя лошо при невидими входни данни.

AI референтен термин

Параметър

Научено тегло вътре в модел, което влияе на неговите резултати.

AI референтен термин

Параметрно ефективна фина настройка (PEFT)

Методи, които адаптират модели чрез обучение на малък поднабор от добавени параметри.

AI референтен термин

Perplexity

Показател на езиков модел, измерващ колко изненадан е моделът от истинските следващи токени.

AI референтен термин

Тръбопровод

Подреден работен процес от предварителна обработка, стъпки на модела и етапи на последваща обработка.

AI референтен термин

Прецизност

Пропорцията на прогнозираните положителни резултати, които действително са правилни.

AI референтен термин

Предварителна подготовка

Първоначално обучение за широкомащабни модели върху широки данни преди адаптиране надолу по веригата.

AI референтен термин

подкана

Инструкциите за въвеждане и контекстът, предоставени на генериращ модел.

AI референтен термин

Бърз инженеринг

Проектиране на подкани за подобряване на качеството на изхода, надеждността и контролируемостта.

AI референтен термин

Бързо инжектиране

Модел на атака, при който злонамерени инструкции се вмъкват във входове на модела или извлечено съдържание.

AI референтен термин

Подрязване

Премахване на по-малко важни тегла на модела или неврони за намаляване на размера и изчисление.

AI референтен термин

Квантуване

Преобразуване на теглата на модела във формати с по-ниска точност, като 8-битов или 4-битов.

AI референтен термин

RAG (генериране с допълнено извличане)

Метод, който извлича външно знание и го захранва за генериране по време на извод.

AI референтен термин

Припомнете си

Пропорцията на действителните положителни резултати, които моделът идентифицира правилно.

AI референтен термин

Система за препоръки

Модел на конвейер, който предвижда потребителските предпочитания за класиране на съдържание или продукти.

AI референтен термин

Red Teaming

Стрес тестване на AI система с противопоставящи се подкани за разкриване на неуспехи и рискове.

AI референтен термин

Обучение с подсилване

Обучение чрез сигнали за възнаграждение, при което агент научава действия, които максимизират дългосрочната възвръщаемост.

AI референтен термин

Обучение за подсилване от човешка обратна връзка (RLHF)

Метод на обучение, който използва сигнали за човешки предпочитания, за да оформи поведението на модела.

AI референтен термин

Извличане

Намиране на подходящи документи или записи от източник на знания за заявка.

AI референтен термин

Модел на възнаграждение

Модел, който оценява резултатите въз основа на сигнали за предпочитания, често използвани в RLHF тръбопроводи.

AI референтен термин

Здравина

Способността на модела да поддържа производителност при шум, смени или противникови входове.

AI референтен термин

Предпазен филтър

Слой за модериране, който блокира или пренаписва опасни входове или изходи на модела.

AI референтен термин

Закон за мащабиране

Емпирична връзка, показваща как производителността се подобрява с размера на модела, данните или изчисленията.

AI референтен термин

Семантично търсене

Търсене, което съответства на значението, а не точното припокриване на ключови думи, често използвайки вграждания.

AI референтен термин

Самоконтролирано обучение

Обучаване на представяния от немаркирани данни чрез предвиждане на маскирани или трансформирани части.

AI референтен термин

Анализ на настроението

НЛП задача, която класифицира емоционалния тон или мнение в текста.

AI референтен термин

Малък езиков модел (SLM)

Компактен езиков модел, оптимизиран за по-ниска латентност, цена или използване на устройството.

AI референтен термин

Разреден модел

Модел, при който много параметри са нула или неактивни, за да се намали изчислението.

AI референтен термин

Контролирано обучение

Обучение на модел с обозначени примери, които картографират входове към известни изходи.

AI референтен термин

Синтетични данни

Изкуствено генерирани данни, използвани за увеличаване, симулиране или защита на чувствителни данни за обучение.

AI референтен термин

Системен ред

Инструкция с висок приоритет, която задава поведение, политика и стил на реакция за модел.

AI референтен термин

температура

Настройка за вземане на проби, контролираща произволността в генерираните изходи.

AI референтен термин

Токен

Част от текст, обработен от езикови модели, като част от дума или символ.

AI референтен термин

Токенизация

Процесът на разделяне на текст на токени за въвеждане на модел.

AI референтен термин

Използване на инструмента

Способността на модела да извиква външни инструменти като търсене, калкулатори или API.

AI референтен термин

Вземане на проби от Top-k

Стратегия за декодиране, която взема проби само от k най-вероятните следващи токена.

AI референтен термин

Top-p (ядро) вземане на проби

Стратегия за декодиране, която взема проби от най-малкия набор от символи, чиято сума на вероятностите е p.

AI референтен термин

Трансферно обучение

Прилагане на знания, научени в една задача или област, за подобряване на друга задача.

AI референтен термин

Трансформатор

Невронна архитектура, която използва внимание, за да моделира паралелни връзки между последователности.

AI референтен термин

Загуба на обучение

Стойността на грешката на модела, изчислена по време на обучение и оптимизирана надолу с времето.

AI референтен термин

Учене без надзор

Обучение на модели от немаркирани данни без изрични целеви изходи.

AI референтен термин

Комплект за валидиране

Набор от данни, използван по време на разработката за настройка на модели и предотвратяване на пренастройване.

AI референтен термин

Векторна база данни

База данни, оптимизирана за съхраняване и заявки за високоразмерни вектори за вграждане.

AI референтен термин

Визуално-езиков модел (VLM)

Мултимодален модел, който съвместно обработва визуална и текстова информация.

AI референтен термин

Слаб надзор

Използване на шумни, евристични или частични етикети за обучение на модели, когато чистите етикети са оскъдни.

AI референтен термин

Тегло

Научена числова стойност, която мащабира сигнали, преминаващи през невронна мрежа.

AI референтен термин

Вграждане на думи

Плътно векторно представяне на думи, улавящи семантични връзки.

AI референтен термин

XAI (обясним AI)

Техники и практики за правене на AI прогнозите по-прозрачни и разбираеми.

AI референтен термин

Zero-Shot обучение

Решаване на задачи без конкретни примери за задачи, като се разчита на предварителни общи познания.

AI референтен термин

Агентски работен процес

Многоетапен процес, при който AI система планира, изпълнява, проверява резултатите и итерира към целта.

AI референтен термин

Закон за ИИ

Основаната на риска регулаторна рамка на Европейския съюз за системи и доставчици на ИИ.

AI референтен термин

Данък за привеждане в съответствие

Допълнителните разходи във времето, изчисленията или скоростта на продукта, необходими, за да направят системите по-безопасни и по-контролируеми.

AI референтен термин

Изтичане на бенчмарк

Когато в данните за обучение присъстват примери за сравнителен тест или близки варианти, завишаване на отчетената производителност.

AI референтен термин

Причинно-следствено заключение

Методи за оценка на причинно-следствените връзки, а не прости корелации.

AI референтен термин

Доверителен интервал

Статистически диапазон, който вероятно съдържа истинската стойност на измерена метрика на модела.

AI референтен термин

Конституционен AI

Подход за обучение и формиране на поведение, при който резултатите от модела се ръководят от фиксиран набор от писмени принципи.

AI референтен термин

Data Lineage

Запис на това откъде идват данните, как са били трансформирани и къде се използват.

AI референтен термин

Произход на данните

Документираният произход, собственост и история на набор от данни или модел на артефакт.

AI референтен термин

Диференциална поверителност

Техника за поверителност, която добавя статистически шум, така че отделните записи не могат да бъдат надеждно изведени от резултатите.

AI референтен термин

Дестилиран модел

По-малък модел, обучен да имитира поведението на по-голям модел, като същевременно използва по-малко изчисления при извод.

AI референтен термин

Модел на вграждане

Модел, специализиран за конвертиране на данни във вектори, използвани за семантично търсене, групиране и извличане.

AI референтен термин

Евал Харнес

Повтаряща се рамка за оценка, която изпълнява подкани, набори от данни и логика за оценяване във версиите на модела.

AI референтен термин

Магазин за функции

Управлявана система за съхраняване и обслужване на валидирани ML функции последователно за обучение и изводи.

AI референтен термин

Заземеност

Степента, до която отговорът на AI се подкрепя от изходни данни или извлечени доказателства.

AI референтен термин

Защитено декодиране

Стратегия за генериране, която ограничава изходните токени до валидни структури или съвместими с правилата избори.

AI референтен термин

Модел на човешки предпочитания

Модел, обучен на човешки класации, за да предвиди кои отговори потребителите вероятно ще предпочетат.

AI референтен термин

Крайна точка на извода

Разгърнат API интерфейс, който получава заявки за модели и връща прогнози в производството.

AI референтен термин

База знания

Подбрана колекция от документи или записи, използвани за извличане, автоматизация на поддръжката или заземяване на отговори.

AI референтен термин

Латентно пространство

Компресирано репрезентативно пространство, където подобни концепции са разположени една до друга като вектори.

AI референтен термин

Регистър на модела

Централен каталог за версии, одобряване и проследяване на модели в различни среди.

AI референтен термин

AI на устройството

AI извод, извършен локално на потребителски хардуер, а не в отдалечена облачна услуга.

AI референтен термин

Анализатор на изхода

Логика, която валидира и преобразува изхода на модела в строго типизирани, машинно използваеми структури.

AI референтен термин

Шаблон за подкана

Повторно използваем модел на подкана с променливи, правила за форматиране и инструкции за специфични задачи.

AI референтен термин

Прецизност на извличане

Пропорцията на извлечените елементи, които са подходящи за заявката на потребителя.

AI референтен термин

Безопасен калъф

Структуриран аргумент, подкрепен от доказателства, че една AI система е безопасна за определен контекст на употреба.

AI референтен термин

Shadow Deployment

Изпълнение на модел паралелно с производствения трафик, без да се засягат решенията, които са изправени пред потребителите.

AI референтен термин

Структуриран изход

Изходът на модела е ограничен до дефинирана схема като JSON, аргументи на инструмента или въведени полета.

AI референтен термин

Изчисляване на тестово време

Допълнителни изчисления за изводи, използвани по време на генериране на отговор за подобряване на качеството или разсъжденията.

AI референтен термин

Доверете се на калибрирането

Изравняване на доверието на потребителите в резултатите от AI с действителната надеждност на системата при всяка задача.

AI референтен термин

Таксуване въз основа на употребата

Ценообразуване, при което разходите се мащабират с извиквания на API, токени, време за извод или изразходвани изчисления.

AI референтен термин

Нулево запазване на данни

Политика, при която полезните данни за заявка/отговор не се съхраняват след обработка извън краткотрайните оперативни прозорци.

AI референтен термин

Спекулативно декодиране

Метод за ускоряване на извода, при който малък чернови модел предлага токени, които по-голям модел проверява паралелно.

AI референтен термин

KV Кеш

Съхранени тензори на ключове и стойности от предишни токени, които позволяват на трансформаторите да генерират нови токени, без да преизчисляват миналото внимание.

AI референтен термин

MCP (моделен контекстен протокол)

Отворен протокол, който позволява на AI приложенията да се свързват с външни инструменти, източници на данни и доставчици на контекст по стандартен начин.

AI референтен термин

Agentic Loop

Итеративен цикъл, при който AI агент наблюдава, планира, действа и отразява, докато не изпълни цел или достигне условие за спиране.

AI референтен термин

ReAct

Подканящ модел, който преплита стъпките на разсъждение с действията за използване на инструменти за по-надеждно решаване на задачи.

AI референтен термин

Дърво на мислите

Подход на разсъждение, при който моделът изследва множество пътища за разклоняване на решения и избира най-обещаващите.

AI референтен термин

DPO (директна оптимизация на предпочитанията)

Метод на обучение, който прецизира моделите директно върху двойки предпочитания, без да е необходим отделен модел на възнаграждение.

AI референтен термин

QLoRA

Техника за фина настройка, която комбинира 4-битово квантуване на теглото с LoRA адаптери за намаляване на нуждите от памет.

AI референтен термин

Светкавично внимание

Оптимизиран алгоритъм за внимание, който намалява използването на паметта и ускорява обучението на трансформатора и изводите.

AI референтен термин

Внимание с няколко глави

Трансформиращ механизъм, който изпълнява няколко операции на вниманието паралелно, за да улови различни типове взаимоотношения.

AI референтен термин

Позиционно кодиране

Информация, добавена към вграждането на токени, така че трансформаторите да могат да разграничат реда на последователността.

AI референтен термин

RoPE (ротационни позиционни вграждания)

Метод на позиционно кодиране, който завърта заявка и ключови вектори, за да кодира относителни позиции на токени.

AI референтен термин

ALiBi

Метод на позиционно отклонение, който наказва оценките за внимание въз основа на символично разстояние, като помага на моделите да екстраполират към по-дълги контексти.

AI референтен термин

Плъзгащ се прозорец Внимание

Модел на внимание, при който всеки токен обръща внимание само на прозорец с фиксиран размер от близки токени, за да намали изчисленията.

AI референтен термин

BPE (кодиране на двойки байтове)

Алгоритъм за токенизиране на поддуми, който обединява най-честите двойки знаци в токени за многократна употреба.

AI референтен термин

SentencePiece

Езиково-агностичен токенизатор, който научава единици поддуми директно от необработен текст без предварително разделяне на интервали.

AI референтен термин

ANN (приблизително най-близък съсед)

Алгоритми, които намират вектори, близки до заявка, без изчерпателно сравнение, разменяйки точност за скорост.

AI референтен термин

HNSW

Индексна структура, базирана на графики, за бързо приблизително търсене на най-близкия съсед върху вектори с висока размерност.

AI референтен термин

Прекласиране

Модел, който пренарежда първоначален набор от извлечени резултати, за да постави най-подходящите елементи в горната част.

AI референтен термин

Хибридно търсене

Подход за извличане, който комбинира търсене по ключови думи (лексикално) с векторно (семантично) търсене за по-добро запомняне и прецизност.

AI референтен термин

Кръстосан енкодер

Модел, който оценява заявка и документ заедно с едно преминаване за преценки за уместност с висока точност.

AI референтен термин

Би-енкодер

Модел, който кодира заявки и документи в отделни вектори, така че да могат да се сравняват бързо в мащаб.

AI референтен термин

LLM-като съдия

Използване на езиков модел за оценяване или сравняване на резултати от други модели по време на оценка.

AI референтен термин

Pass@k

Показател за оценка на кода, измерващ шанса поне една от k генерирани проби да премине тестовете.

AI референтен термин

MMLU

Бенчмарк тестване на езикови модели в 57 академични и професионални предмета с помощта на въпроси с множествен избор.

AI референтен термин

HumanEval

Еталон на проблеми с програмирането на Python, използвани за измерване на коректността на генериране на код чрез тестове на единици.

AI референтен термин

GSM8K

Еталон на текстови задачи по математика в началното училище, използвани за оценка на разсъждение стъпка по стъпка в езикови модели.

AI референтен термин

Фактичност

Колко точно твърденията на даден модел съвпадат с проверима информация от реалния свят.

AI референтен термин

Цитати

Препратки към изходни пасажи или документи, включени в отговора на модела в подкрепа на неговите твърдения.

AI референтен термин

Воден знак

Вграждане на откриваем сигнал в генериран от AI текст или медия, така че по-късно да може да бъде идентифициран като машинно произведен.

AI референтен термин

По средата на тренировката

Междинна фаза на обучение между предварително и след обучение, често използвана за корекции на способности или домейн.

AI референтен термин

След тренировка

Стъпки на обучение, приложени след предварително обучение, като настройка на инструкциите, оптимизиране на предпочитанията и настройка на безопасността.

AI референтен термин

Самостоятелна игра

Обучителна настройка, при която моделът се подобрява чрез генериране на данни чрез взаимодействия или състезания със свои копия.

AI референтен термин

RAG-Fusion

Метод за извличане, който генерира множество варианти на заявка, извлича резултати за всяка и обединява класирането.

AI референтен термин

Извличане на множество заявки

Техника за извличане, която пренаписва потребителската заявка в няколко варианта, за да подобри запомнянето.

AI референтен термин

Извличане на родителски документ

Модел за извличане, който търси малки парчета, но връща техните по-големи родителски документи за по-богат контекст.

AI референтен термин

Търсене с лъч

Алгоритъм за декодиране, който запазва първите няколко кандидат последователности на всяка стъпка, за да намери изходни данни с по-висока вероятност.

AI референтен термин

Наказание за повторение

Настройка за декодиране, която намалява вероятността от токени, които моделът вече е произвел, за да се намалят циклите.

AI референтен термин

Наказание за честота

Настройка за декодиране, която намалява вероятността за токени пропорционално на това колко често са се появявали досега.

AI референтен термин

Наказание за присъствие

Настройка за декодиране, която намалява вероятността токените да са се появили изобщо, насърчавайки нови теми.

AI референтен термин