AGI (загальний штучний інтелект)
Гіпотетична система ШІ, яка може виконувати більшість інтелектуальних завдань на рівні людини в багатьох сферах.
Основна технічна термінологія пояснена на найвищому рівні ясності. Призначений для дослідників, студентів і людиноорієнтованої освіти.
Показ 213 відповідні умови.
Гіпотетична система ШІ, яка може виконувати більшість інтелектуальних завдань на рівні людини в багатьох сферах.
Програмна система, яка може спостерігати, міркувати та виконувати дії для досягнення мети, часто використовуючи інструменти та пам’ять.
Робота над тим, щоб системи штучного інтелекту вели себе відповідно до людських намірів, цінностей і обмежень безпеки.
Політики, стандарти та механізми нагляду, які керують розробкою та використанням ШІ в суспільстві.
Область, зосереджена на зниженні шкідливої поведінки, збоїв і ризиків неправильного використання в системах ШІ.
Визначений набір правил або кроків, яких дотримується комп’ютер для вирішення проблеми або виконання завдання.
Систематична несправедливість у результатах моделі, спричинена спотвореними даними, припущеннями чи вибором моделювання.
Наскільки чітко задокументовані та зрозумілі логіка системи ШІ, джерела даних і обмеження.
Мітки або метадані, додані людиною, використовуються для навчання або оцінки моделей машинного навчання.
Структурований спосіб для однієї програмної системи надсилати запити до іншої системи та отримувати відповіді від неї.
Широке поле побудови систем, які виконують завдання, що вимагають розпізнавання шаблонів, аргументації, мови або прийняття рішень.
Компонент моделі, який динамічно фокусується на відповідних частинах вхідних даних під час створення виходу.
Система, яка може приймати рішення та діяти з обмеженим або без прямого контролю людини в реальному часі.
Основний навчальний алгоритм, який оновлює вагові коефіцієнти моделі шляхом передачі помилок передбачення назад через мережу.
Проста еталонна модель, яка використовується для порівняння того, чи справді більш складні підходи покращують результати.
Стандартизований тест або набір даних, який використовується для вимірювання та порівняння продуктивності моделі.
Послідовна модель помилок або несправедливості в даних або поведінці моделі.
Дуже великі та складні набори даних, які вимагають масштабованих технологій зберігання та обробки.
Модель, внутрішні міркування якої важко інтерпретувати безпосередньо людям.
Наскільки показники надійності моделі відповідають фактичним імовірностям правильності.
Стиль міркування, коли модель AI розкладає проблему на проміжні кроки.
Завдання, у якому модель призначає вхідні дані одній або кільком попередньо визначеним категоріям.
Модель, розроблена спеціально для класифікаційних завдань.
Архітектура мультимодальної моделі, яка вивчає спільні представлення між текстом і зображеннями.
Ресурси обробки, необхідні для навчання та запуску моделей, часто вимірюються в FLOPS або годинах GPU.
Розділ штучного інтелекту, який витягує значення із зображень і відео.
Максимальна кількість вхідних токенів, які мовна модель може обробити одночасно.
Підходи до навчання, які дозволяють моделі продовжувати навчатися на нових даних, не забуваючи попередні знання.
Нейронна архітектура, оптимізована для обробки сіткових даних, таких як зображення.
Загальна цільова функція, яка використовується для навчання моделей класифікації шляхом штрафування за неправильні ймовірності.
Методи, які створюють модифіковані навчальні приклади для покращення узагальнення моделі.
Зміна вхідних даних реального світу з часом, що може погіршити продуктивність моделі.
Процес призначення тегів або цільових виходів необробленим даним для контрольованого навчання.
Набір структурованих або неструктурованих прикладів, які використовуються для навчання, перевірки чи тестування.
Поверхня в просторі ознак, яка розділяє класи, передбачені класифікатором.
Модель, яка робить прогнози через послідовність розділення функцій «якщо-тоді».
Підмножина машинного навчання, яка використовує багаторівневі нейронні мережі для навчання представлення.
Генеративна архітектура, яка вчиться змінювати шум, щоб синтезувати зображення, аудіо чи інший вміст.
Стиснення знань із великої моделі вчителя в меншу модель учня.
Методи, які передають модель, навчену в одному домені, для кращої роботи в іншому домені.
Числове векторне представлення, яке фіксує семантичне значення тексту, зображень або інших даних.
Компонент моделі, який перетворює вхідні дані на приховані представлення.
Об’єднання прогнозів із кількох моделей для підвищення надійності та точності.
Захищений набір даних, який використовується для вимірювання якості моделі після навчання.
Ступінь, до якого поведінку моделі можна інтерпретувати та пояснити людям.
Неправильний прогноз, коли модель пропускає справжній позитивний випадок.
Неправильний прогноз, коли модель неправильно позначає негативний випадок як позитивний.
Вхідна змінна, яка використовується моделлю для прогнозування.
Розробка або перетворення вхідних змінних, щоб зробити навчання легшим і ефективнішим.
Перетворення необроблених даних в інформативні функції, які може використовувати модель.
Вивчення або адаптація поведінки лише на невеликій кількості прикладів.
Постійне навчання на предметних даних для адаптації попередньо навченої моделі до конкретного завдання.
Велика попередньо навчена модель, яку можна адаптувати до багатьох подальших завдань.
Здатність моделі створювати структуровані виклики, які запускають зовнішні інструменти або API.
Генеративна установка, де генератор і дискримінатор тренуються один проти одного.
Наскільки добре модель працює на нових, невидимих даних за межами навчального набору.
Системи штучного інтелекту, які створюють новий вміст, наприклад текст, зображення, аудіо, відео чи код.
Вектор, що показує, наскільки має змінитися кожен параметр, щоб зменшити втрати.
Метод оптимізації, який оновлює параметри в напрямку, що зменшує помилку.
Довірені еталонні мітки, які використовуються для навчання або оцінки вихідних даних моделі.
Правила, перевірки та елементи керування, які обмежують небезпечну або небажану поведінку моделі.
Коли модель генерує плавну, але неправдиву або непідтверджену інформацію.
Робочий процес, у якому люди переглядають, направляють або скасовують результати ШІ.
Значення конфігурації, встановлене перед навчанням, наприклад швидкість навчання, розмір партії або глибина.
Здатність моделі слідувати шаблонам із прикладів, наданих безпосередньо в підказці.
Фаза виконання, на якій навчена модель генерує прогнози або результати.
Кількість обчислювальної потужності, спожитої під час створення кожної відповіді.
Точне налаштування моделі на парах інструкція-відповідь для покращення виконання завдань.
Прогнозування мети користувача на основі текстового запиту для його правильного маршрутизації.
Швидка техніка, призначена для обходу обмежень безпеки моделі.
Останній момент часу, відображений у даних навчання моделі.
Навчання меншої моделі імітувати результати більшої моделі.
Структура графа сутностей і зв’язків, які використовуються для міркувань або пошуку.
Метод регулярізації, який пом’якшує жорсткі мітки для покращення узагальнення.
Час між надсиланням запиту та отриманням виходу моделі.
Мовна модель, навчена на масивних текстових корпусах для створення та аналізу тексту.
Навчальний гіперпараметр, який контролює, скільки параметрів змінюється на кожному кроці оновлення.
Ефективний метод тонкого налаштування параметрів, який додає низькорангові матриці адаптерів.
Математична мета, яка кількісно визначає помилку передбачення під час навчання.
Методи, які дозволяють системам вивчати шаблони з даних і вдосконалюватися з часом.
Збережений контекст агент штучного інтелекту використовує на етапах або сеансах для покращення безперервності.
Архітектура зі спеціалізованими підмережами, де лише вибрані експерти працюють на вході.
Документація з описом передбачуваного використання моделі, показників, обмежень і ризиків.
Зниження продуктивності з часом, оскільки реальні умови відрізняються від припущень щодо навчання.
Зменшення чисельної точності вагових коефіцієнтів моделі для зменшення вартості пам’яті та висновків.
Модель, яка може обробляти або генерувати кілька типів даних, таких як текст, зображення та аудіо.
Завдання НЛП, яке визначає такі сутності, як люди, місця, дати чи організації.
Галузь ШІ зосереджена на розумінні та створенні людської мови.
Багатошарова обчислювальна модель, натхненна біологічними нейронами та синапсами.
Перетворення значень у послідовний масштаб для підвищення стабільності оптимізації.
Технологія, яка перетворює текст із зображень або відсканованих зображень на машиночитаний текст.
Модель, випущена з загальнодоступними вагами або кодом для перевірки, адаптації та повторного використання.
Коли модель запам’ятовує навчальні дані та погано працює на невидимих вхідних даних.
Вивчена вага всередині моделі, яка впливає на її результати.
Методи, які адаптують моделі шляхом навчання невеликої підмножини доданих параметрів.
Показник мовної моделі, що вимірює, наскільки модель здивована справжніми наступними лексемами.
Упорядкований робочий процес попередньої обробки, кроків моделі та етапів постобробки.
Частка прогнозованих позитивних результатів, які насправді є правильними.
Початкове навчання великомасштабної моделі на широких даних перед подальшою адаптацією.
Вхідні інструкції та контекст, надані для генеративної моделі.
Розробка підказок для покращення якості виведення, надійності та керованості.
Шаблон атаки, коли зловмисні інструкції вставляються у вхідні дані моделі або отриманий вміст.
Видалення менш важливих ваг моделі або нейронів для зменшення розміру та обчислень.
Перетворення ваг моделі у формати з нижчою точністю, такі як 8- або 4-бітні.
Метод, який отримує зовнішні знання та передає їх у генерацію під час висновку.
Частка фактичних позитивів, які модель правильно визначає.
Конвеєр моделі, який передбачає вподобання користувачів для ранжирування вмісту або продуктів.
Стрес-тестування системи штучного інтелекту з протилежними підказками для виявлення збоїв і ризиків.
Навчання за сигналами винагороди, коли агент навчається діям, які максимізують довгострокову віддачу.
Метод навчання, який використовує сигнали переваг людини для формування модельної поведінки.
Пошук відповідних документів або записів із джерела знань для запиту.
Модель, яка оцінює результати на основі сигналів переваги, часто використовується в конвеєрах RLHF.
Здатність моделі підтримувати ефективність за умов шуму, зсувів або агресивних вхідних даних.
Рівень модерації, який блокує або переписує небезпечні входи або виходи моделі.
Емпіричний зв’язок, який показує, як покращується продуктивність із розміром моделі, даними чи обчисленнями.
Пошук, який відповідає значенню, а не точному збігу ключових слів, часто з використанням вставок.
Вивчення представлень із немаркованих даних шляхом передбачення замаскованих або трансформованих частин.
Завдання НЛП, яке класифікує емоційний тон або думку в тексті.
Компактна мовна модель, оптимізована для меншої затримки, вартості або використання на пристрої.
Модель, де багато параметрів дорівнюють нулю або неактивні, щоб зменшити обчислення.
Навчання моделі з позначеними прикладами, які відображають вхідні дані та відомі результати.
Штучно створені дані, які використовуються для доповнення, імітації або захисту конфіденційних навчальних даних.
Інструкція з високим пріоритетом, яка встановлює поведінку, політику та стиль відповіді для моделі.
Налаштування вибірки, що контролює випадковість у згенерованих результатах.
Фрагмент тексту, оброблений мовними моделями, наприклад фрагмент слова або символ.
Процес поділу тексту на маркери для введення моделі.
Здатність моделі викликати зовнішні інструменти, такі як пошук, калькулятори або API.
Стратегія декодування, яка виконує вибірку лише з k найімовірніших наступних токенів.
Стратегія декодування, яка бере вибірку з найменшого набору токенів, сума ймовірностей якого дорівнює p.
Застосування знань, отриманих в одному завданні чи домені, для покращення іншого завдання.
Нейронна архітектура, яка використовує увагу для паралельного моделювання зв’язків між послідовностями.
Значення помилки моделі, обчислене під час навчання та оптимізоване у бік зменшення з часом.
Вивчення шаблонів з немаркованих даних без явних цільових виходів.
Набір даних, який використовується під час розробки для налаштування моделей і запобігання переобладнанню.
База даних, оптимізована для зберігання та запиту високовимірних вбудованих векторів.
Мультимодальна модель, яка спільно обробляє візуальну та текстову інформацію.
Використання зашумлених, евристичних або часткових міток для навчання моделей, коли чистих міток бракує.
Вивчене числове значення, яке масштабує сигнали, що проходять через нейронну мережу.
Щільне векторне представлення слів, що фіксують семантичні зв’язки.
Техніки та практики, щоб зробити прогнози AI більш прозорими та зрозумілими.
Розв’язування задач без конкретних прикладів із опорою на попередні загальні знання.
Багатоетапний процес, у якому система штучного інтелекту планує, виконує, перевіряє результати та виконує ітерації до мети.
Основана на ризиках нормативна база Європейського Союзу для систем штучного інтелекту та постачальників.
Додаткові витрати на час, обчислення або швидкість продукту, необхідні для того, щоб зробити системи безпечнішими та керованими.
Якщо в навчальних даних присутні приклади порівняльного тесту або наближені варіанти, це завищує звітну продуктивність.
Методи оцінки причинно-наслідкових зв’язків, а не простих кореляцій.
Статистичний діапазон, який, імовірно, містить справжнє значення виміряної метрики моделі.
Підхід до навчання та формування поведінки, коли результати моделі керуються фіксованим набором письмових принципів.
Запис про те, звідки надійшли дані, як вони були перетворені та де використовуються.
Задокументоване походження, право власності та історія набору даних або артефакту моделі.
Техніка конфіденційності, яка додає статистичний шум, щоб окремі записи не можна було надійно вивести з результатів.
Менша модель, навчена імітувати поведінку більшої моделі, використовуючи менше обчислень для висновку.
Спеціалізована модель для перетворення даних у вектори, які використовуються для семантичного пошуку, кластеризації та пошуку.
Повторювана система оцінювання, яка запускає підказки, набори даних і логіку оцінки в версіях моделі.
Керована система для постійного зберігання та надання підтверджених функцій машинного навчання для навчання та висновків.
Ступінь, до якого відповідь ШІ підтверджується вихідними даними або отриманими доказами.
Стратегія генерації, яка обмежує вихідні маркери дійсними структурами або виборами, сумісними з політикою.
Модель, навчена на людському рейтингу, щоб передбачити, яким відповідям користувачі, швидше за все, віддадуть перевагу.
Розгорнутий інтерфейс API, який отримує запити моделі та повертає прогнози у виробництві.
Підібрана колекція документів або записів, які використовуються для пошуку, автоматизації підтримки або обґрунтування відповідей.
Стислий простір репрезентації, де подібні поняття розташовані поруч один з одним як вектори.
Центральний каталог для версії, затвердження та відстеження моделей у різних середовищах.
Штучний інтелект виконується локально на апаратному забезпеченні користувача, а не у віддаленій хмарній службі.
Логіка, яка перевіряє та перетворює вихідні дані моделі в строго типізовані структури, які можна використовувати машиною.
Багаторазовий шаблон підказки зі змінними, правилами форматування та інструкціями для конкретних завдань.
Частка отриманих елементів, які відповідають запиту користувача.
Структурований аргумент, підтверджений доказами, що система ШІ є безпечною для певного контексту використання.
Запуск моделі паралельно з робочим трафіком, не впливаючи на рішення користувача.
Вихід моделі обмежено визначеною схемою, як-от JSON, аргументами інструментів або введеними полями.
Додаткове обчислення логічного висновку, яке використовується під час генерації відповіді для покращення якості чи аргументації.
Порівнювання впевненості користувачів у результатах ШІ з фактичною надійністю системи в кожному завданні.
Ціноутворення, де витрати масштабуються з викликами API, маркерами, часом висновку або споживаними обчисленнями.
Політика, згідно з якою корисні навантаження запитів/відповідей не зберігаються після обробки за межами короткотривалих операційних вікон.
Метод прискорення логічного висновку, коли маленька чернеткова модель пропонує токени, які більша модель перевіряє паралельно.
Збережені тензори ключів і значень із попередніх токенів, які дозволяють трансформаторам генерувати нові токени без повторного обчислення минулої уваги.
Відкритий протокол, який дозволяє додаткам штучного інтелекту підключатися до зовнішніх інструментів, джерел даних і постачальників контексту стандартним способом.
Ітеративний цикл, у якому агент штучного інтелекту спостерігає, планує, діє та розмірковує, поки не досягне мети або не досягне умови зупинки.
Шаблон підказок, який перемежовує кроки міркування з діями використання інструментів для більш надійного вирішення завдань.
Підхід міркування, коли модель досліджує кілька розгалужених шляхів вирішення та вибирає найбільш перспективні.
Метод навчання, який точно налаштовує моделі безпосередньо на пари переваг без необхідності окремої моделі винагороди.
Техніка тонкого налаштування, яка поєднує 4-бітне вагове квантування з адаптерами LoRA для зменшення потреби в пам’яті.
Оптимізований алгоритм концентрації уваги, який зменшує використання пам’яті та прискорює навчання трансформатора та логічні висновки.
Механізм трансформатора, який виконує декілька операцій уваги паралельно, щоб охопити різні типи зв’язків.
Інформація, додана до вбудованих токенів, щоб трансформатори могли розрізняти порядок послідовності.
Метод позиційного кодування, який обертає вектори запиту та ключа для кодування відносних позицій маркерів.
Метод позиційного упередження, який штрафує показники уваги на основі символічної відстані, допомагаючи моделям екстраполювати на довші контексти.
Шаблон уваги, де кожен маркер звертається лише до вікна фіксованого розміру сусідніх маркерів, щоб зменшити обчислення.
Алгоритм токенізації підслова, який об’єднує найпоширеніші пари символів у багаторазово використовувані токени.
Незалежний від мови токенізатор, який вивчає одиниці підслів безпосередньо з необробленого тексту без попереднього розбиття на пробіли.
Алгоритми, які знаходять вектори, близькі до запиту, без повного порівняння, обмінюючи точність на швидкість.
Структура індексу на основі графів для швидкого наближеного пошуку найближчих сусідів за векторами великої розмірності.
Модель, яка змінює порядок початкового набору отриманих результатів, щоб розмістити найбільш відповідні елементи вгорі.
Підхід до пошуку, який поєднує пошук за ключовими словами (лексичний) із векторним (семантичним) пошуком для кращого запам’ятовування та точності.
Модель, яка оцінює запит і документ разом за один прохід для високоточного оцінювання релевантності.
Модель, яка кодує запити та документи в окремі вектори, щоб їх можна було швидко порівнювати в масштабі.
Використання мовної моделі для оцінки або порівняння результатів інших моделей під час оцінювання.
Показник оцінки коду, який вимірює ймовірність того, що принаймні один із k згенерованих зразків пройде тести.
Еталонний тест, який тестує мовні моделі з 57 академічних і професійних предметів за допомогою питань із варіантами відповідей.
Еталонний тест проблем програмування на Python, який використовується для вимірювання правильності генерації коду за допомогою модульних тестів.
Тест початкових шкільних математичних текстових задач, які використовуються для оцінки покрокових міркувань у мовних моделях.
Наскільки точно твердження моделі збігаються з реальною інформацією, яку можна перевірити.
Посилання на вихідні уривки або документи, включені у відповідь моделі для підтвердження своїх тверджень.
Вбудовування сигналу, який можна виявити, у текст або медіа, згенерований штучним інтелектом, щоб пізніше можна було ідентифікувати його як створений машиною.
Проміжний етап навчання між попереднім навчанням і після навчанням, який часто використовується для коригування можливостей або домену.
Етапи навчання, які застосовуються після попереднього навчання, наприклад налаштування інструкцій, оптимізація параметрів і налаштування безпеки.
Навчальна установка, у якій модель вдосконалюється, генеруючи дані через взаємодію або змагання з її копіями.
Метод пошуку, який генерує кілька варіантів запиту, отримує результати для кожного та об’єднує рейтинги.
Техніка пошуку, яка переписує запит користувача на кілька варіантів для покращення запам’ятовування.
Шаблон пошуку, який шукає невеликі фрагменти, але повертає їх більші батьківські документи для більшого контексту.
Алгоритм декодування, який зберігає декілька верхніх послідовностей-кандидатів на кожному кроці, щоб знайти результати з вищою ймовірністю.
Налаштування декодування, яке знижує ймовірність токенів, які вже створила модель, щоб зменшити кількість циклів.
Налаштування декодування, яке зменшує ймовірність появи токенів пропорційно частоті їх появи.
Налаштування декодування, яке зменшує ймовірність появи жетонів взагалі, заохочуючи нові теми.