Глосарій штучного інтелекту — Пояснення термінів ШІ простою мовою

Показ 213 відповідні умови.

AGI (загальний штучний інтелект)

Гіпотетична система ШІ, яка може виконувати більшість інтелектуальних завдань на рівні людини в багатьох сферах.

ШІ опорний термін

ШІ агент

Програмна система, яка може спостерігати, міркувати та виконувати дії для досягнення мети, часто використовуючи інструменти та пам’ять.

ШІ опорний термін

Вирівнювання AI

Робота над тим, щоб системи штучного інтелекту вели себе відповідно до людських намірів, цінностей і обмежень безпеки.

ШІ опорний термін

Управління AI

Політики, стандарти та механізми нагляду, які керують розробкою та використанням ШІ в суспільстві.

ШІ опорний термін

ШІ Безпека

Область, зосереджена на зниженні шкідливої поведінки, збоїв і ризиків неправильного використання в системах ШІ.

ШІ опорний термін

Алгоритм

Визначений набір правил або кроків, яких дотримується комп’ютер для вирішення проблеми або виконання завдання.

ШІ опорний термін

Алгоритмічний зсув

Систематична несправедливість у результатах моделі, спричинена спотвореними даними, припущеннями чи вибором моделювання.

ШІ опорний термін

Алгоритмічна прозорість

Наскільки чітко задокументовані та зрозумілі логіка системи ШІ, джерела даних і обмеження.

ШІ опорний термін

Анотація

Мітки або метадані, додані людиною, використовуються для навчання або оцінки моделей машинного навчання.

ШІ опорний термін

API (інтерфейс прикладного програмування)

Структурований спосіб для однієї програмної системи надсилати запити до іншої системи та отримувати відповіді від неї.

ШІ опорний термін

Штучний інтелект (AI)

Широке поле побудови систем, які виконують завдання, що вимагають розпізнавання шаблонів, аргументації, мови або прийняття рішень.

ШІ опорний термін

Механізм уваги

Компонент моделі, який динамічно фокусується на відповідних частинах вхідних даних під час створення виходу.

ШІ опорний термін

Автономна система

Система, яка може приймати рішення та діяти з обмеженим або без прямого контролю людини в реальному часі.

ШІ опорний термін

Зворотне поширення

Основний навчальний алгоритм, який оновлює вагові коефіцієнти моделі шляхом передачі помилок передбачення назад через мережу.

ШІ опорний термін

Базова модель

Проста еталонна модель, яка використовується для порівняння того, чи справді більш складні підходи покращують результати.

ШІ опорний термін

Еталон

Стандартизований тест або набір даних, який використовується для вимірювання та порівняння продуктивності моделі.

ШІ опорний термін

Упередженість

Послідовна модель помилок або несправедливості в даних або поведінці моделі.

ШІ опорний термін

Великі дані

Дуже великі та складні набори даних, які вимагають масштабованих технологій зберігання та обробки.

ШІ опорний термін

Модель чорного ящика

Модель, внутрішні міркування якої важко інтерпретувати безпосередньо людям.

ШІ опорний термін

Калібрування

Наскільки показники надійності моделі відповідають фактичним імовірностям правильності.

ШІ опорний термін

Ланцюг думок

Стиль міркування, коли модель AI розкладає проблему на проміжні кроки.

ШІ опорний термін

Класифікація

Завдання, у якому модель призначає вхідні дані одній або кільком попередньо визначеним категоріям.

ШІ опорний термін

Класифікатор

Модель, розроблена спеціально для класифікаційних завдань.

ШІ опорний термін

CLIP

Архітектура мультимодальної моделі, яка вивчає спільні представлення між текстом і зображеннями.

ШІ опорний термін

Обчислити

Ресурси обробки, необхідні для навчання та запуску моделей, часто вимірюються в FLOPS або годинах GPU.

ШІ опорний термін

Комп'ютерний зір

Розділ штучного інтелекту, який витягує значення із зображень і відео.

ШІ опорний термін

Контекстне вікно

Максимальна кількість вхідних токенів, які мовна модель може обробити одночасно.

ШІ опорний термін

Постійне навчання

Підходи до навчання, які дозволяють моделі продовжувати навчатися на нових даних, не забуваючи попередні знання.

ШІ опорний термін

Згорточна нейронна мережа (CNN)

Нейронна архітектура, оптимізована для обробки сіткових даних, таких як зображення.

ШІ опорний термін

Перехресна втрата ентропії

Загальна цільова функція, яка використовується для навчання моделей класифікації шляхом штрафування за неправильні ймовірності.

ШІ опорний термін

Збільшення даних

Методи, які створюють модифіковані навчальні приклади для покращення узагальнення моделі.

ШІ опорний термін

Дрейф даних

Зміна вхідних даних реального світу з часом, що може погіршити продуктивність моделі.

ШІ опорний термін

Маркування даних

Процес призначення тегів або цільових виходів необробленим даним для контрольованого навчання.

ШІ опорний термін

Набір даних

Набір структурованих або неструктурованих прикладів, які використовуються для навчання, перевірки чи тестування.

ШІ опорний термін

Межа прийняття рішення

Поверхня в просторі ознак, яка розділяє класи, передбачені класифікатором.

ШІ опорний термін

Дерево рішень

Модель, яка робить прогнози через послідовність розділення функцій «якщо-тоді».

ШІ опорний термін

Глибоке навчання

Підмножина машинного навчання, яка використовує багаторівневі нейронні мережі для навчання представлення.

ШІ опорний термін

Модель дифузії

Генеративна архітектура, яка вчиться змінювати шум, щоб синтезувати зображення, аудіо чи інший вміст.

ШІ опорний термін

Дистиляція

Стиснення знань із великої моделі вчителя в меншу модель учня.

ШІ опорний термін

Адаптація домену

Методи, які передають модель, навчену в одному домені, для кращої роботи в іншому домені.

ШІ опорний термін

Вбудовування

Числове векторне представлення, яке фіксує семантичне значення тексту, зображень або інших даних.

ШІ опорний термін

Кодувальник

Компонент моделі, який перетворює вхідні дані на приховані представлення.

ШІ опорний термін

Ансамбль

Об’єднання прогнозів із кількох моделей для підвищення надійності та точності.

ШІ опорний термін

Набір для оцінювання

Захищений набір даних, який використовується для вимірювання якості моделі після навчання.

ШІ опорний термін

Пояснюваність

Ступінь, до якого поведінку моделі можна інтерпретувати та пояснити людям.

ШІ опорний термін

Помилково негативний

Неправильний прогноз, коли модель пропускає справжній позитивний випадок.

ШІ опорний термін

Помилковий позитивний результат

Неправильний прогноз, коли модель неправильно позначає негативний випадок як позитивний.

ШІ опорний термін

Особливість

Вхідна змінна, яка використовується моделлю для прогнозування.

ШІ опорний термін

Розробка функцій

Розробка або перетворення вхідних змінних, щоб зробити навчання легшим і ефективнішим.

ШІ опорний термін

Витяг функцій

Перетворення необроблених даних в інформативні функції, які може використовувати модель.

ШІ опорний термін

Невелике навчання

Вивчення або адаптація поведінки лише на невеликій кількості прикладів.

ШІ опорний термін

Точне налаштування

Постійне навчання на предметних даних для адаптації попередньо навченої моделі до конкретного завдання.

ШІ опорний термін

Модель фундаменту

Велика попередньо навчена модель, яку можна адаптувати до багатьох подальших завдань.

ШІ опорний термін

Виклик функції

Здатність моделі створювати структуровані виклики, які запускають зовнішні інструменти або API.

ШІ опорний термін

GAN (Generate Adversarial Network)

Генеративна установка, де генератор і дискримінатор тренуються один проти одного.

ШІ опорний термін

Узагальнення

Наскільки добре модель працює на нових, невидимих даних за межами навчального набору.

ШІ опорний термін

Генеративний ШІ

Системи штучного інтелекту, які створюють новий вміст, наприклад текст, зображення, аудіо, відео чи код.

ШІ опорний термін

Градієнт

Вектор, що показує, наскільки має змінитися кожен параметр, щоб зменшити втрати.

ШІ опорний термін

Градієнтний спуск

Метод оптимізації, який оновлює параметри в напрямку, що зменшує помилку.

ШІ опорний термін

Основна правда

Довірені еталонні мітки, які використовуються для навчання або оцінки вихідних даних моделі.

ШІ опорний термін

Огородження

Правила, перевірки та елементи керування, які обмежують небезпечну або небажану поведінку моделі.

ШІ опорний термін

Галюцинації

Коли модель генерує плавну, але неправдиву або непідтверджену інформацію.

ШІ опорний термін

Людина в циклі

Робочий процес, у якому люди переглядають, направляють або скасовують результати ШІ.

ШІ опорний термін

Гіперпараметр

Значення конфігурації, встановлене перед навчанням, наприклад швидкість навчання, розмір партії або глибина.

ШІ опорний термін

Навчання в контексті

Здатність моделі слідувати шаблонам із прикладів, наданих безпосередньо в підказці.

ШІ опорний термін

Висновок

Фаза виконання, на якій навчена модель генерує прогнози або результати.

ШІ опорний термін

Висновок-обчислення часу

Кількість обчислювальної потужності, спожитої під час створення кожної відповіді.

ШІ опорний термін

Інструкція Налаштування

Точне налаштування моделі на парах інструкція-відповідь для покращення виконання завдань.

ШІ опорний термін

Класифікація намірів

Прогнозування мети користувача на основі текстового запиту для його правильного маршрутизації.

ШІ опорний термін

Втеча з в'язниці

Швидка техніка, призначена для обходу обмежень безпеки моделі.

ШІ опорний термін

Відсічення знань

Останній момент часу, відображений у даних навчання моделі.

ШІ опорний термін

Дистиляція знань

Навчання меншої моделі імітувати результати більшої моделі.

ШІ опорний термін

Граф знань

Структура графа сутностей і зв’язків, які використовуються для міркувань або пошуку.

ШІ опорний термін

Згладжування міток

Метод регулярізації, який пом’якшує жорсткі мітки для покращення узагальнення.

ШІ опорний термін

Затримка

Час між надсиланням запиту та отриманням виходу моделі.

ШІ опорний термін

Велика мовна модель (LLM)

Мовна модель, навчена на масивних текстових корпусах для створення та аналізу тексту.

ШІ опорний термін

Швидкість навчання

Навчальний гіперпараметр, який контролює, скільки параметрів змінюється на кожному кроці оновлення.

ШІ опорний термін

LoRA (адаптація низького рангу)

Ефективний метод тонкого налаштування параметрів, який додає низькорангові матриці адаптерів.

ШІ опорний термін

Функція втрати

Математична мета, яка кількісно визначає помилку передбачення під час навчання.

ШІ опорний термін

Машинне навчання (ML)

Методи, які дозволяють системам вивчати шаблони з даних і вдосконалюватися з часом.

ШІ опорний термін

Пам'ять (Пам'ять агента)

Збережений контекст агент штучного інтелекту використовує на етапах або сеансах для покращення безперервності.

ШІ опорний термін

Суміш експертів (MoE)

Архітектура зі спеціалізованими підмережами, де лише вибрані експерти працюють на вході.

ШІ опорний термін

Модель картки

Документація з описом передбачуваного використання моделі, показників, обмежень і ризиків.

ШІ опорний термін

Модельний дрейф

Зниження продуктивності з часом, оскільки реальні умови відрізняються від припущень щодо навчання.

ШІ опорний термін

Квантування моделі

Зменшення чисельної точності вагових коефіцієнтів моделі для зменшення вартості пам’яті та висновків.

ШІ опорний термін

Мультимодальна модель

Модель, яка може обробляти або генерувати кілька типів даних, таких як текст, зображення та аудіо.

ШІ опорний термін

Розпізнавання іменованих сутностей (NER)

Завдання НЛП, яке визначає такі сутності, як люди, місця, дати чи організації.

ШІ опорний термін

Обробка природної мови (NLP)

Галузь ШІ зосереджена на розумінні та створенні людської мови.

ШІ опорний термін

Нейронна мережа

Багатошарова обчислювальна модель, натхненна біологічними нейронами та синапсами.

ШІ опорний термін

Нормалізація

Перетворення значень у послідовний масштаб для підвищення стабільності оптимізації.

ШІ опорний термін

OCR (оптичне розпізнавання символів)

Технологія, яка перетворює текст із зображень або відсканованих зображень на машиночитаний текст.

ШІ опорний термін

Модель з відкритим кодом

Модель, випущена з загальнодоступними вагами або кодом для перевірки, адаптації та повторного використання.

ШІ опорний термін

Переобладнання

Коли модель запам’ятовує навчальні дані та погано працює на невидимих вхідних даних.

ШІ опорний термін

Параметр

Вивчена вага всередині моделі, яка впливає на її результати.

ШІ опорний термін

Параметричне точне налаштування (PEFT)

Методи, які адаптують моделі шляхом навчання невеликої підмножини доданих параметрів.

ШІ опорний термін

Perplexity

Показник мовної моделі, який вимірює, наскільки модель здивована справжніми наступними токенами.

ШІ опорний термін

Трубопровід

Упорядкований робочий процес попередньої обробки, кроків моделі та етапів постобробки.

ШІ опорний термін

Точність

Частка прогнозованих позитивних результатів, які насправді є правильними.

ШІ опорний термін

Попередня підготовка

Початкове навчання великомасштабної моделі на широких даних перед подальшою адаптацією.

ШІ опорний термін

Підкажіть

Вхідні інструкції та контекст, надані для генеративної моделі.

ШІ опорний термін

Оперативна інженерія

Розробка підказок для покращення якості виведення, надійності та керованості.

ШІ опорний термін

Оперативна ін'єкція

Шаблон атаки, коли зловмисні інструкції вставляються у вхідні дані моделі або отриманий вміст.

ШІ опорний термін

Обрізка

Видалення менш важливих ваг моделі або нейронів для зменшення розміру та обчислень.

ШІ опорний термін

Квантування

Перетворення ваг моделі у формати з нижчою точністю, такі як 8- або 4-бітні.

ШІ опорний термін

RAG (генерація з доповненим пошуком)

Метод, який отримує зовнішні знання та передає їх у генерацію під час висновку.

ШІ опорний термін

Відкликати

Частка фактичних позитивів, які модель правильно визначає.

ШІ опорний термін

Система рекомендацій

Конвеєр моделі, який передбачає вподобання користувачів для ранжирування вмісту або продуктів.

ШІ опорний термін

Red Teaming

Стрес-тестування системи штучного інтелекту з протилежними підказками для виявлення збоїв і ризиків.

ШІ опорний термін

Навчання з підкріпленням

Навчання за сигналами винагороди, коли агент навчається діям, які максимізують довгострокову віддачу.

ШІ опорний термін

Навчання з підкріпленням на основі зворотного зв’язку людини (RLHF)

Метод навчання, який використовує сигнали переваг людини для формування модельної поведінки.

ШІ опорний термін

Пошук

Пошук відповідних документів або записів із джерела знань для запиту.

ШІ опорний термін

Модель винагороди

Модель, яка оцінює результати на основі сигналів переваги, часто використовується в конвеєрах RLHF.

ШІ опорний термін

Міцність

Здатність моделі підтримувати ефективність за умов шуму, зсувів або агресивних вхідних даних.

ШІ опорний термін

Фільтр безпеки

Рівень модерації, який блокує або переписує небезпечні входи або виходи моделі.

ШІ опорний термін

Закон масштабування

Емпіричний зв’язок, який показує, як покращується продуктивність із розміром моделі, даними чи обчисленнями.

ШІ опорний термін

Семантичний пошук

Пошук, який відповідає значенню, а не точному збігу ключових слів, часто з використанням вставок.

ШІ опорний термін

Самоконтрольоване навчання

Вивчення представлень із немаркованих даних шляхом передбачення замаскованих або трансформованих частин.

ШІ опорний термін

Аналіз настроїв

Завдання НЛП, яке класифікує емоційний тон або думку в тексті.

ШІ опорний термін

Мала мовна модель (SLM)

Компактна мовна модель, оптимізована для меншої затримки, вартості або використання на пристрої.

ШІ опорний термін

Розріджена модель

Модель, де багато параметрів дорівнюють нулю або неактивні, щоб зменшити обчислення.

ШІ опорний термін

Контрольоване навчання

Навчання моделі з позначеними прикладами, які відображають вхідні дані та відомі результати.

ШІ опорний термін

Синтетичні дані

Штучно створені дані, які використовуються для доповнення, імітації або захисту конфіденційних навчальних даних.

ШІ опорний термін

Системна підказка

Інструкція з високим пріоритетом, яка встановлює поведінку, політику та стиль відповіді для моделі.

ШІ опорний термін

температура

Налаштування вибірки, що контролює випадковість у згенерованих результатах.

ШІ опорний термін

Токен

Фрагмент тексту, оброблений мовними моделями, наприклад фрагмент слова або символ.

ШІ опорний термін

Токенізація

Процес поділу тексту на маркери для введення моделі.

ШІ опорний термін

Використання інструменту

Здатність моделі викликати зовнішні інструменти, такі як пошук, калькулятори або API.

ШІ опорний термін

Вибірка Top-k

Стратегія декодування, яка виконує вибірку лише з k найімовірніших наступних токенів.

ШІ опорний термін

Top-p (Ядро) Вибірка

Стратегія декодування, яка бере вибірку з найменшого набору токенів, сума ймовірностей якого дорівнює p.

ШІ опорний термін

Передача навчання

Застосування знань, отриманих в одному завданні чи домені, для покращення іншого завдання.

ШІ опорний термін

трансформатор

Нейронна архітектура, яка використовує увагу для паралельного моделювання зв’язків між послідовностями.

ШІ опорний термін

Втрата навчання

Значення помилки моделі, обчислене під час навчання та оптимізоване у бік зменшення з часом.

ШІ опорний термін

Навчання без контролю

Вивчення шаблонів з немаркованих даних без явних цільових виходів.

ШІ опорний термін

Набір перевірки

Набір даних, який використовується під час розробки для налаштування моделей і запобігання переобладнанню.

ШІ опорний термін

Векторна база даних

База даних, оптимізована для зберігання та запиту високовимірних вбудованих векторів.

ШІ опорний термін

Модель мови бачення (VLM)

Мультимодальна модель, яка спільно обробляє візуальну та текстову інформацію.

ШІ опорний термін

Слабкий нагляд

Використання зашумлених, евристичних або часткових міток для навчання моделей, коли чистих міток бракує.

ШІ опорний термін

вага

Вивчене числове значення, яке масштабує сигнали, що проходять через нейронну мережу.

ШІ опорний термін

Вбудовування слів

Щільне векторне представлення слів, що фіксують семантичні зв’язки.

ШІ опорний термін

XAI (зрозумілий штучний інтелект)

Техніки та практики, щоб зробити прогнози AI більш прозорими та зрозумілими.

ШІ опорний термін

Zero-Shot Навчання

Розв’язування задач без конкретних прикладів із опорою на попередні загальні знання.

ШІ опорний термін

Агентський робочий процес

Багатоетапний процес, у якому система штучного інтелекту планує, виконує, перевіряє результати та виконує ітерації до мети.

ШІ опорний термін

AI Act

Основана на ризиках нормативна база Європейського Союзу для систем штучного інтелекту та постачальників.

ШІ опорний термін

Податок на вирівнювання

Додаткові витрати на час, обчислення або швидкість продукту, необхідні для того, щоб зробити системи безпечнішими та керованими.

ШІ опорний термін

Еталонний витік

Якщо в навчальних даних присутні приклади порівняльного тесту або наближені варіанти, це завищує звітну продуктивність.

ШІ опорний термін

Причинно-наслідковий висновок

Методи оцінки причинно-наслідкових зв’язків, а не простих кореляцій.

ШІ опорний термін

Довірчий інтервал

Статистичний діапазон, який, імовірно, містить справжнє значення виміряної метрики моделі.

ШІ опорний термін

Конституційний ШІ

Підхід до навчання та формування поведінки, коли результати моделі керуються фіксованим набором письмових принципів.

ШІ опорний термін

Лінія даних

Запис про те, звідки надійшли дані, як вони були перетворені та де використовуються.

ШІ опорний термін

Походження даних

Задокументоване походження, право власності та історія набору даних або артефакту моделі.

ШІ опорний термін

Диференціальна конфіденційність

Техніка конфіденційності, яка додає статистичний шум, щоб окремі записи не можна було надійно вивести з результатів.

ШІ опорний термін

Дистильована модель

Менша модель, навчена імітувати поведінку більшої моделі, використовуючи менше обчислень для висновку.

ШІ опорний термін

Модель вбудовування

Спеціалізована модель для перетворення даних у вектори, що використовуються для семантичного пошуку, кластеризації та пошуку.

ШІ опорний термін

Еваль Харнес

Повторювана система оцінювання, яка запускає підказки, набори даних і логіку оцінки в версіях моделі.

ШІ опорний термін

Магазин функцій

Керована система для постійного зберігання та надання підтверджених функцій машинного навчання для навчання та висновків.

ШІ опорний термін

Приземленість

Ступінь, до якого відповідь ШІ підтверджується вихідними даними або отриманими доказами.

ШІ опорний термін

Захищене декодування

Стратегія генерації, яка обмежує вихідні маркери дійсними структурами або виборами, сумісними з політикою.

ШІ опорний термін

Модель переваг людини

Модель, навчена на людському рейтингу, щоб передбачити, яким відповідям користувачі, швидше за все, віддадуть перевагу.

ШІ опорний термін

Кінцева точка висновку

Розгорнутий інтерфейс API, який отримує запити моделі та повертає прогнози у виробництві.

ШІ опорний термін

База знань

Підібрана колекція документів або записів, які використовуються для пошуку, автоматизації підтримки або обґрунтування відповідей.

ШІ опорний термін

Прихований простір

Стислий простір репрезентації, де подібні поняття розташовані поруч один з одним як вектори.

ШІ опорний термін

Реєстр моделей

Центральний каталог для версії, затвердження та відстеження моделей у різних середовищах.

ШІ опорний термін

ШІ на пристрої

Штучний інтелект виконується локально на апаратному забезпеченні користувача, а не у віддаленій хмарній службі.

ШІ опорний термін

Парсер виводу

Логіка, яка перевіряє та перетворює вихідні дані моделі в строго типізовані структури, які можна використовувати машиною.

ШІ опорний термін

Шаблон запиту

Багаторазовий шаблон підказки зі змінними, правилами форматування та інструкціями для конкретних завдань.

ШІ опорний термін

Точність пошуку

Частка отриманих елементів, які відповідають запиту користувача.

ШІ опорний термін

Безпечний футляр

Структурований аргумент, підтверджений доказами, що система ШІ є безпечною для певного контексту використання.

ШІ опорний термін

Тіньове розгортання

Запуск моделі паралельно з робочим трафіком, не впливаючи на рішення користувача.

ШІ опорний термін

Структурований вихід

Вихід моделі обмежено визначеною схемою, як-от JSON, аргументами інструментів або введеними полями.

ШІ опорний термін

Обчислення тестового часу

Додаткове обчислення логічного висновку, яке використовується під час генерації відповіді для покращення якості чи аргументації.

ШІ опорний термін

Довірте калібрування

Порівнювання впевненості користувачів у результатах ШІ з фактичною надійністю системи в кожному завданні.

ШІ опорний термін

Оплата на основі використання

Ціноутворення, де витрати масштабуються з викликами API, маркерами, часом висновку або споживаними обчисленнями.

ШІ опорний термін

Нульове збереження даних

Політика, згідно з якою корисні навантаження запитів/відповідей не зберігаються після обробки за межами короткотривалих операційних вікон.

ШІ опорний термін

Спекулятивне декодування

Метод прискорення логічного висновку, коли маленька чернеткова модель пропонує токени, які більша модель перевіряє паралельно.

ШІ опорний термін

Кеш KV

Збережені тензори ключів і значень із попередніх токенів, які дозволяють трансформаторам генерувати нові токени без повторного обчислення минулої уваги.

ШІ опорний термін

MCP (протокол моделі контексту)

Відкритий протокол, який дозволяє додаткам штучного інтелекту підключатися до зовнішніх інструментів, джерел даних і постачальників контексту стандартним способом.

ШІ опорний термін

Агентська петля

Ітеративний цикл, у якому агент штучного інтелекту спостерігає, планує, діє та розмірковує, поки не досягне мети або не досягне умови зупинки.

ШІ опорний термін

ReAct

Шаблон підказок, який перемежовує кроки міркування з діями використання інструментів для більш надійного вирішення завдань.

ШІ опорний термін

Дерево думок

Підхід міркування, коли модель досліджує кілька розгалужених шляхів вирішення та вибирає найбільш перспективні.

ШІ опорний термін

DPO (пряма оптимізація переваг)

Метод навчання, який точно налаштовує моделі безпосередньо на пари переваг без необхідності окремої моделі винагороди.

ШІ опорний термін

QLoRA

Техніка тонкого налаштування, яка поєднує 4-бітне вагове квантування з адаптерами LoRA для зменшення потреби в пам’яті.

ШІ опорний термін

Спалах уваги

Оптимізований алгоритм концентрації уваги, який зменшує використання пам’яті та прискорює навчання трансформатора та логічні висновки.

ШІ опорний термін

Багатостороння увага

Механізм трансформатора, який виконує декілька операцій уваги паралельно, щоб охопити різні типи зв’язків.

ШІ опорний термін

Позиційне кодування

Інформація, додана до вбудованих токенів, щоб трансформатори могли розрізняти порядок послідовності.

ШІ опорний термін

RoPE (ротаційні позиційні вставки)

Метод позиційного кодування, який обертає вектори запиту та ключа для кодування відносних позицій маркерів.

ШІ опорний термін

АЛіБі

Метод позиційного упередження, який штрафує показники уваги на основі символічної відстані, допомагаючи моделям екстраполювати на довші контексти.

ШІ опорний термін

Розсувне вікно Увага

Шаблон уваги, де кожен маркер звертається лише до вікна фіксованого розміру сусідніх маркерів, щоб зменшити обчислення.

ШІ опорний термін

BPE (кодування пари байтів)

Алгоритм токенізації підслова, який об’єднує найпоширеніші пари символів у багаторазово використовувані токени.

ШІ опорний термін

SentencePiece

Незалежний від мови токенізатор, який вивчає одиниці підслів безпосередньо з необробленого тексту без попереднього розбиття на пробіли.

ШІ опорний термін

ANN (приблизний найближчий сусід)

Алгоритми, які знаходять вектори, близькі до запиту, без повного порівняння, обмінюючи точність на швидкість.

ШІ опорний термін

HNSW

Структура індексу на основі графів для швидкого наближеного пошуку найближчих сусідів за векторами великої розмірності.

ШІ опорний термін

Реранкер

Модель, яка змінює порядок початкового набору отриманих результатів, щоб розмістити найбільш відповідні елементи вгорі.

ШІ опорний термін

Гібридний пошук

Підхід до пошуку, який поєднує пошук за ключовими словами (лексичний) із векторним (семантичним) пошуком для кращого запам’ятовування та точності.

ШІ опорний термін

Крос-кодувальник

Модель, яка оцінює запит і документ разом за один прохід для високоточного оцінювання релевантності.

ШІ опорний термін

Бі-кодувальник

Модель, яка кодує запити та документи в окремі вектори, щоб їх можна було швидко порівнювати в масштабі.

ШІ опорний термін

LLM-як-суддя

Використання мовної моделі для оцінки або порівняння результатів інших моделей під час оцінювання.

ШІ опорний термін

Pass@k

Показник оцінки коду, який вимірює ймовірність того, що принаймні один із k згенерованих зразків пройде тести.

ШІ опорний термін

MMLU

Еталонний тест, який тестує мовні моделі з 57 академічних і професійних предметів за допомогою питань із варіантами відповідей.

ШІ опорний термін

HumanEval

Еталонний тест проблем програмування на Python, який використовується для вимірювання правильності генерації коду за допомогою модульних тестів.

ШІ опорний термін

GSM8K

Тест початкових шкільних математичних текстових задач, які використовуються для оцінки покрокових міркувань у мовних моделях.

ШІ опорний термін

Фактичность

Наскільки точно твердження моделі збігаються з реальною інформацією, яку можна перевірити.

ШІ опорний термін

Цитування

Посилання на вихідні уривки або документи, включені у відповідь моделі для підтвердження своїх тверджень.

ШІ опорний термін

Водяний знак

Вбудовування сигналу, який можна виявити, у текст або медіа, згенерований штучним інтелектом, щоб пізніше можна було ідентифікувати його як створений машиною.

ШІ опорний термін

Середина тренування

Проміжний етап навчання між попереднім навчанням і після навчанням, який часто використовується для коригування можливостей або домену.

ШІ опорний термін

Посттренінг

Етапи навчання, які застосовуються після попереднього навчання, наприклад налаштування інструкцій, оптимізація параметрів і налаштування безпеки.

ШІ опорний термін

Гра самостійно

Навчальна установка, де модель вдосконалюється шляхом генерування даних через взаємодію або змагання з її копіями.

ШІ опорний термін

RAG-Fusion

Метод пошуку, який генерує кілька варіантів запиту, отримує результати для кожного та об’єднує рейтинги.

ШІ опорний термін

Отримання кількох запитів

Техніка пошуку, яка переписує запит користувача на кілька варіантів для покращення запам’ятовування.

ШІ опорний термін

Пошук батьківських документів

Шаблон пошуку, який шукає невеликі фрагменти, але повертає їх більші батьківські документи для більшого контексту.

ШІ опорний термін

Пошук за променем

Алгоритм декодування, який зберігає декілька верхніх послідовностей-кандидатів на кожному кроці, щоб знайти результати з вищою ймовірністю.

ШІ опорний термін

Штраф за повторення

Налаштування декодування, яке знижує ймовірність токенів, які вже створила модель, щоб зменшити кількість циклів.

ШІ опорний термін

Штраф за частоту

Налаштування декодування, яке зменшує ймовірність появи токенів пропорційно частоті їх появи.

ШІ опорний термін

Штраф за присутність

Налаштування декодування, яке зменшує ймовірність появи жетонів взагалі, заохочуючи нові теми.

ШІ опорний термін

Перегляньте повну бібліотеку