打开百科全书

人工智能术语表

以最高清晰度解释基本技术术语。专为研究人员、学生和以人为本的教育而设计。

213 条款搜索 + 字母过滤器简单语言定义

显示中 213 匹配条款。

AGI(通用人工智能)

一个假设的人工智能系统,可以在许多领域以人类水平执行大多数智力任务。

AI参考术语

人工智能代理

一种可以观察、推理并采取行动来实现目标的软件系统,通常使用工具和内存。

AI参考术语

人工智能对齐

让人工智能系统按照人类意图、价值观和安全约束行事的工作。

AI参考术语

人工智能治理

指导人工智能如何在社会中开发和使用的政策、标准和监督机制。

AI参考术语

人工智能安全

该领域专注于减少人工智能系统中的有害行为、故障和误用风险。

AI参考术语

算法

计算机为解决问题或完成任务而遵循的一组定义的规则或步骤。

AI参考术语

算法偏差

由于数据、假设或建模选择的偏差而导致模型输出的系统性不公平。

AI参考术语

算法透明

人工智能系统的逻辑、数据源和局限性的记录和理解有多清晰。

AI参考术语

注释

人工添加的标签或元数据用于训练或评估机器学习模型。

AI参考术语

API(应用程序编程接口)

一种软件系统向另一个系统发送请求并接收响应的结构化方式。

AI参考术语

人工智能(AI)

构建执行需要模式识别、推理、语言或决策的任务的系统的广泛领域。

AI参考术语

注意力机制

生成输出时动态关注输入的相关部分的模型组件。

AI参考术语

自治系统

一种可以在有限或没有直接人类控制的情况下实时做出决策和采取行动的系统。

AI参考术语

反向传播

核心训练算法通过网络向后传播预测误差来更新模型权重。

AI参考术语

基线模型

一个简单的参考模型,用于比较更复杂的方法是否真正改善结果。

AI参考术语

基准测试

用于测量和比较模型性能的标准化测试或数据集。

AI参考术语

偏差

数据或模型行为中一致的错误或不公平模式。

AI参考术语

大数据

非常大且复杂的数据集,需要可扩展的存储和处理技术。

AI参考术语

黑盒模型

其内部推理难以由人类直接解释的模型。

AI参考术语

校准

模型的置信度得分与实际正确性概率的匹配程度。

AI参考术语

思想链

一种推理风格,人工智能模型将问题分解为中间步骤。

AI参考术语

分类

模型将输入分配给一个或多个预定义类别的任务。

AI参考术语

分类器

专为分类任务设计的模型。

AI参考术语

剪辑

一种学习文本和图像之间共享表示的多模态模型架构。

AI参考术语

计算

训练和运行模型所需的处理资源,通常以 FLOPS 或 GPU 小时来衡量。

AI参考术语

计算机视觉

人工智能的一个分支,从图像和视频中提取意义。

AI参考术语

上下文窗口

语言模型一次可以处理的输入标记的最大数量。

AI参考术语

持续学习

让模型不断从新数据中学习而不忘记先验知识的训练方法。

AI参考术语

卷积神经网络(CNN)

一种针对处理图像等网格数据而优化的神经架构。

AI参考术语

交叉熵损失

一种常见的目标函数,用于通过惩罚不正确的概率来训练分类模型。

AI参考术语

数据增强

创建修改后的训练示例以提高模型泛化能力的技术。

AI参考术语

数据漂移

现实世界输入数据随时间的变化可能会降低模型性能。

AI参考术语

数据标签

将标签或目标输出分配给原始数据以进行监督学习的过程。

AI参考术语

数据集

用于训练、验证或测试的结构化或非结构化示例的集合。

AI参考术语

决策边界

特征空间中用于分隔分类器预测的类的表面。

AI参考术语

决策树

通过一系列 if-then 特征分割进行预测的模型。

AI参考术语

深度学习

机器学习的一个子集,使用多层神经网络进行表示学习。

AI参考术语

扩散模型

一种生成架构,可以学习反转噪声以合成图像、音频或其他内容。

AI参考术语

蒸馏

将知识从大型教师模型压缩到较小的学生模型中。

AI参考术语

领域适应

将在一个领域训练的模型转移到另一个领域以更好地执行的方法。

AI参考术语

嵌入

捕获文本、图像或其他数据语义的数字向量表示。

AI参考术语

编码器

将输入转换为潜在表示的模型组件。

AI参考术语

合奏团

结合多个模型的预测以提高鲁棒性或准确性。

AI参考术语

评估集

用于测量训练后模型质量的保留数据集。

AI参考术语

可解释性

模型的行为可以被解释和解释给人类的程度。

AI参考术语

假阴性

模型错过真正的阳性案例的错误预测。

AI参考术语

误报

模型错误地将负面案例标记为正面的错误预测。

AI参考术语

特点

模型用来进行预测的输入变量。

AI参考术语

特征工程

设计或转换输入变量,使学习变得更容易、更有效。

AI参考术语

特征提取

将原始数据转换为模型可以使用的信息特征。

AI参考术语

少样本学习

仅从少量示例中学习或适应行为。

AI参考术语

微调

对特定领域的数据进行持续训练,以使预先训练的模型适应特定任务。

AI参考术语

基础模型

一个大型的预训练模型,可以适应许多下游任务。

AI参考术语

函数调用

生成触发外部工具或 API 的结构化调用的模型功能。

AI参考术语

GAN(生成对抗网络)

生成器和鉴别器相互训练的生成设置。

AI参考术语

概括

模型在训练集之外的新的、未见过的数据上的表现如何。

AI参考术语

生成式人工智能

生成文本、图像、音频、视频或代码等新内容的人工智能系统。

AI参考术语

渐变

一个向量,显示每个参数应改变多少以减少损失。

AI参考术语

梯度下降

一种向减少误差的方向更新参数的优化方法。

AI参考术语

地面真相

用于训练或评估模型输出的可信参考标签。

AI参考术语

护栏

限制不安全或不需要的模型行为的规则、检查和控制。

AI参考术语

幻觉

当模型生成流畅但错误或不受支持的信息时。

AI参考术语

人在环

人类审查、指导或覆盖人工智能输出的工作流程。

AI参考术语

超参数

训练前设置的配置值,例如学习率、批量大小或深度。

AI参考术语

情境学习

模型遵循提示中直接提供的示例中的模式的能力。

AI参考术语

推理

经过训练的模型生成预测或输出的运行时阶段。

AI参考术语

推理时间计算

生成每个响应时消耗的处理能力。

AI参考术语

指令调优

微调指令-响应对的模型以改善任务跟踪。

AI参考术语

意图分类

根据文本查询预测用户的目的以正确路由。

AI参考术语

越狱

一种旨在绕过模型安全约束的提示技术。

AI参考术语

知识截止

模型训练数据中反映的最新时间点。

AI参考术语

知识蒸馏

训练较小的模型来模仿较大模型的输出。

AI参考术语

知识图谱

用于推理或检索的实体和关系的图形结构。

AI参考术语

标签平滑

一种软化硬标签以提高泛化能力的正则化方法。

AI参考术语

延迟

发送请求和接收模型输出之间的时间。

AI参考术语

大语言模型(LLM)

在海量文本语料库上训练来生成和分析文本的语言模型。

AI参考术语

学习率

训练超参数控制每个更新步骤的参数变化量。

AI参考术语

LoRA(低阶适应)

一种添加低秩适配器矩阵的参数高效微调方法。

AI参考术语

损失函数

量化训练期间预测误差的数学目标。

AI参考术语

机器学习(ML)

允许系统从数据中学习模式并随着时间的推移进行改进的方法。

AI参考术语

内存(代理内存)

AI 代理跨步骤或会话使用存储的上下文来提高连续性。

AI参考术语

混合专家 (MoE)

具有专门子网络的架构,其中每个输入仅运行选定的专家。

AI参考术语

型号卡

描述模型的预期用途、指标、限制和风险的文档。

AI参考术语

模型漂移

由于现实条件与训练假设存在差异,性能会随着时间的推移而下降。

AI参考术语

模型量化

降低模型权重的数值精度以减少内存和推理成本。

AI参考术语

多式联运模型

可以处理或生成文本、图像和音频等多种数据类型的模型。

AI参考术语

命名实体识别 (NER)

识别人物、地点、日期或组织等实体的 NLP 任务。

AI参考术语

自然语言处理(NLP)

人工智能的分支专注于理解和生成人类语言。

AI参考术语

神经网络

受生物神经元和突触启发的分层计算模型。

AI参考术语

标准化

将值转换为一致的比例以提高优化稳定性。

AI参考术语

OCR(光学字符识别)

将图像或扫描中的文本转换为机器可读文本的技术。

AI参考术语

开源模型

使用公共权重或代码发布的模型,用于检查、调整和重用。

AI参考术语

过拟合

当模型记住训练数据并在未见过的输入上表现不佳时。

AI参考术语

参数

模型中学习到的权重会影响其输出。

AI参考术语

参数高效微调 (PEFT)

通过训练一小部分添加参数来调整模型的方法。

AI参考术语

Perplexity

一种语言模型指标,衡量模型对真正的下一个标记的惊讶程度。

AI参考术语

管道

预处理、模型步骤和后处理阶段的有序工作流程。

AI参考术语

精度

实际正确的预测阳性的比例。

AI参考术语

预训练

在下游适应之前对广泛数据进行初始大规模模型训练。

AI参考术语

提示

提供给生成模型的输入指令和上下文。

AI参考术语

及时工程

设计提示以提高输出质量、可靠性和可控性。

AI参考术语

及时注射

一种攻击模式,其中将恶意指令插入模型输入或检索的内容中。

AI参考术语

修剪

删除不太重要的模型权重或神经元以减小尺寸和计算量。

AI参考术语

量化

将模型权重转换为较低精度的格式,例如 8 位或 4 位。

AI参考术语

RAG(检索增强生成)

一种检索外部知识并在推理时将其输入生成的方法。

AI参考术语

召回

模型正确识别的实际阳性的比例。

AI参考术语

推荐系统

预测用户对内容或产品进行排名的偏好的模型管道。

AI参考术语

红队

使用对抗性提示对人工智能系统进行压力测试,以揭示失败和风险。

AI参考术语

强化学习

通过奖励信号进行训练,代理学习能够最大化长期回报的行动。

AI参考术语

根据人类反馈进行强化学习 (RLHF)

一种使用人类偏好信号来塑造模型行为的训练方法。

AI参考术语

检索

从知识源中查找相关文档或记录以进行查询。

AI参考术语

奖励模式

一种根据偏好信号对输出进行评分的模型,通常用于 RLHF 管道。

AI参考术语

稳健性

模型在噪声、变化或对抗性输入下保持性能的能力。

AI参考术语

安全过滤器

阻止或重写不安全模型输入或输出的调节层。

AI参考术语

缩放定律

一种经验关系,显示性能如何随模型大小、数据或计算而提高。

AI参考术语

语义搜索

通常使用嵌入来匹配含义而不是精确关键字重叠的搜索。

AI参考术语

自我监督学习

通过预测屏蔽或变换的部分来学习未标记数据的表示。

AI参考术语

情绪分析

对文本中的情绪基调或观点进行分类的 NLP 任务。

AI参考术语

小语言模型 (SLM)

一种紧凑的语言模型,针对较低的延迟、成本或设备上的使用情况进行了优化。

AI参考术语

稀疏模型

许多参数为零或不活动以减少计算的模型。

AI参考术语

监督学习

使用将输入映射到已知输出的标记示例来训练模型。

AI参考术语

综合数据

用于增强、模拟或保护敏感训练数据的人工生成的数据。

AI参考术语

系统提示

为模型设置行为、策略和响应方式的高优先级指令。

AI参考术语

温度

控制生成输出中的随机性的采样设置。

AI参考术语

代币

由语言模型处理的文本块,例如单词或符号。

AI参考术语

代币化

将文本拆分为模型输入标记的过程。

AI参考术语

工具使用

模型调用外部工具(例如搜索、计算器或 API)的能力。

AI参考术语

Top-k 采样

仅从 k 个最有可能的下一个标记中采样的解码策略。

AI参考术语

Top-p(核)采样

一种解码策略,从概率总和为 p 的最小标记集中进行采样。

AI参考术语

迁移学习

应用在一项任务或领域中学到的知识来改进另一项任务。

AI参考术语

变压器

一种神经架构,利用注意力并行地对序列之间的关系进行建模。

AI参考术语

训练损失

模型误差值在训练期间计算并随着时间的推移向下优化。

AI参考术语

无监督学习

从没有明确目标输出的未标记数据中学习模式。

AI参考术语

验证集

开发过程中用于调整模型并防止过度拟合的数据集。

AI参考术语

矢量数据库

针对存储和查询高维嵌入向量而优化的数据库。

AI参考术语

视觉语言模型 (VLM)

联合处理视觉和文本信息的多模态模型。

AI参考术语

监管薄弱

当干净标签稀缺时,使用噪声、启发式或部分标签来训练模型。

AI参考术语

重量

一个学习的数值,用于缩放通过神经网络的信号。

AI参考术语

词嵌入

捕获语义关系的单词的密集向量表示。

AI参考术语

XAI(可解释的人工智能)

使人工智能预测更加透明和易于理解的技术和实践。

AI参考术语

零样本学习

通过依赖先前的常识来解决没有特定任务示例的任务。

AI参考术语

代理工作流程

人工智能系统计划、执行、检查结果并迭代实现目标的多步骤过程。

AI参考术语

人工智能法

欧盟针对人工智能系统和提供商的基于风险的监管框架。

AI参考术语

结盟税

使系统更安全、更可控所需的时间、计算或产品速度方面的额外成本。

AI参考术语

基准泄漏

当训练数据中存在基准测试示例或相近变体时,会夸大报告的性能。

AI参考术语

因果推理

估计因果关系而不是简单相关性的方法。

AI参考术语

置信区间

可能包含测量模型指标的真实值的统计范围。

AI参考术语

宪法人工智能

一种训练和行为塑造方法,其中模型输出由一组固定的书面原则指导。

AI参考术语

数据沿袭

记录数据来自何处、如何转换以及在何处使用。

AI参考术语

数据来源

数据集或模型工件的记录来源、所有权和历史记录。

AI参考术语

差异隐私

一种隐私技术,会增加统计噪声,因此无法从输出中可靠地推断出单个记录。

AI参考术语

蒸馏模型

经过训练的较小模型可以模仿较大模型的行为,同时在推理时使用较少的计算。

AI参考术语

嵌入模型

专门用于将数据转换为用于语义搜索、聚类和检索的向量的模型。

AI参考术语

评估安全带

一个可重复的评估框架,可跨模型版本运行提示、数据集和评分逻辑。

AI参考术语

特征库

一个托管系统,用于一致地存储和提供经过验证的 ML 功能,以进行训练和推理。

AI参考术语

接地气

人工智能响应得到源数据或检索到的证据支持的程度。

AI参考术语

保护解码

将输出代币限制为有效结构或符合策略的选择的生成策略。

AI参考术语

人类偏好模型

一个根据人类排名进行训练的模型,用于预测用户可能更喜欢哪些响应。

AI参考术语

推理端点

已部署的 API 接口,用于接收模型请求并返回生产中的预测。

AI参考术语

知识库

用于检索、支持自动化或基础响应的精选文档或记录集合。

AI参考术语

潜在空间

压缩的表示空间,其中相似的概念作为向量彼此靠近。

AI参考术语

模型注册表

用于跨环境进行版本控制、批准和跟踪模型的中央目录。

AI参考术语

设备上的人工智能

人工智能推理在用户硬件上本地执行,而不是在远程云服务中执行。

AI参考术语

输出解析器

验证模型输出并将其转换为强类型、机器可用结构的逻辑。

AI参考术语

提示模板

具有变量、格式规则和特定于任务的指令的可重用提示模式。

AI参考术语

检索精度

与用户查询相关的检索到的项目的比例。

AI参考术语

安全案例

有证据支持的结构化论证,表明人工智能系统对于定义的使用环境是安全的。

AI参考术语

影子部署

与生产流量并行运行模型,不会影响面向用户的决策。

AI参考术语

结构化输出

模型输出受限于已定义的架构,例如 JSON、工具参数或类型化字段。

AI参考术语

测试时计算

在响应生成期间使用额外的推理计算来提高质量或推理。

AI参考术语

信任校准

将用户对人工智能输出的信心与系统在每项任务中的实际可靠性结合起来。

AI参考术语

基于使用的计费

成本随 API 调用、令牌、推理时间或消耗的计算而变化的定价。

AI参考术语

零数据保留

一种策略,在处理超出短暂的操作窗口后,不存储请求/响应有效负载。

AI参考术语

推测性解码

一种推理加速方法,其中小型草稿模型提出令牌,大型模型并行验证。

AI参考术语

KV缓存

存储来自先前令牌的键和值张量,使 Transformer 可以生成新令牌而无需重新计算过去的注意力。

AI参考术语

MCP(模型上下文协议)

一种开放协议,允许人工智能应用程序以标准方式连接到外部工具、数据源和上下文提供者。

AI参考术语

代理循环

人工智能代理观察、计划、行动和反思的迭代循环,直到完成目标或达到停止条件。

AI参考术语

反应

一种提示模式,将推理步骤与工具使用操作交织在一起,以更可靠地解决任务。

AI参考术语

思想之树

一种推理方法,模型探索多个分支解决方案路径并选择最有希望的路径。

AI参考术语

DPO(直接偏好优化)

一种直接在偏好对上微调模型的训练方法,无需单独的奖励模型。

AI参考术语

QLoRA

一种微调技术,将 4 位权重量化与 LoRA 适配器相结合,以减少内存需求。

AI参考术语

闪光注意

一种优化的注意力算法,可减少内存使用并加速 Transformer 训练和推理。

AI参考术语

多头注意力

一种并行运行多个注意力操作以捕获不同类型关系的转换器机制。

AI参考术语

位置编码

添加到标记嵌入的信息,以便转换器可以区分序列顺序。

AI参考术语

RoPE(旋转位置嵌入)

一种位置编码方法,可旋转查询向量和键向量以对相对标记位置进行编码。

AI参考术语

铝锂

一种位置偏差方法,根据标记距离惩罚注意力分数,帮助模型推断更长的上下文。

AI参考术语

滑动窗口注意

一种注意模式,其中每个令牌仅关注附近令牌的固定大小窗口以减少计算。

AI参考术语

BPE(字节对编码)

一种子词标记化算法,将最常见的字符对合并为可重用的标记。

AI参考术语

句子片段

一种与语言无关的分词器,可以直接从原始文本中学习子词单元,而无需在空格上进行预分割。

AI参考术语

ANN(近似最近邻)

无需进行详尽比较即可找到接近查询的向量的算法,以准确性换取速度。

AI参考术语

新南威尔士州

基于图的索引结构,用于高维向量上的快速近似最近邻搜索。

AI参考术语

重新排序

一种对一组初始检索结果重新排序以将最相关的项目放在顶部的模型。

AI参考术语

混合搜索

一种检索方法,将关键字(词汇)搜索与矢量(语义)搜索相结合,以提高召回率和精度。

AI参考术语

交叉编码器

一种模型,可一次性对查询和文档进行评分,以实现高精度的相关性判断。

AI参考术语

双编码器

一种将查询和文档编码为单独向量的模型,以便可以快速大规模地比较它们。

AI参考术语

法学硕士法官

在评估过程中使用语言模型对其他模型的输出进行评分或比较。

AI参考术语

通过@k

一种代码评估指标,用于衡量 k 个生成的样本中至少有一个通过测试的机会。

AI参考术语

MMLU

使用多项选择题测试跨 57 个学术和专业科目的语言模型的基准测试。

AI参考术语

人类评估

Python 编程问题的基准,用于通过单元测试衡量代码生成的正确性。

AI参考术语

GSM8K

小学数学应用题的基准,用于评估语言模型中的逐步推理。

AI参考术语

事实性

模型的主张与可验证的现实世界信息的匹配程度如何。

AI参考术语

引文

对模型响应中包含的源段落或文档的引用,以支持其主张。

AI参考术语

水印

在人工智能生成的文本或媒体中嵌入可检测信号,以便稍后将其识别为机器生成的。

AI参考术语

训练中期

预训练和训练后之间的中间训练阶段,通常用于能力或领域调整。

AI参考术语

培训后

预训练后应用的训练步骤,例如指令调整、偏好优化和安全调整。

AI参考术语

自玩

一种训练设置,模型通过与自身副本的交互或竞争生成数据来改进。

AI参考术语

RAG-融合

一种检索方法,可生成多个查询变体、检索每个查询变体的结果并融合排名。

AI参考术语

多查询检索

一种检索技术,将用户查询重写为多个变体以提高召回率。

AI参考术语

父文档检索

一种检索模式,搜索小块但返回其较大的父文档以获得更丰富的上下文。

AI参考术语

波束搜索

一种解码算法,在每一步中保留前几个候选序列以找到更高概率的输出。

AI参考术语

重复处罚

一种解码设置,可降低模型已生成的令牌的概率,以减少循环。

AI参考术语

频率惩罚

一种解码设置,可根据令牌迄今为止出现的频率成比例地降低令牌的概率。

AI参考术语

出席处罚

一种解码设置,可降低令牌出现的概率,从而鼓励新主题。

AI参考术语