AGI(通用人工智能)
一个假设的人工智能系统,可以在许多领域以人类水平执行大多数智力任务。
以最高清晰度解释基本技术术语。专为研究人员、学生和以人为本的教育而设计。
显示中 213 匹配条款。
一个假设的人工智能系统,可以在许多领域以人类水平执行大多数智力任务。
一种可以观察、推理并采取行动来实现目标的软件系统,通常使用工具和内存。
让人工智能系统按照人类意图、价值观和安全约束行事的工作。
指导人工智能如何在社会中开发和使用的政策、标准和监督机制。
该领域专注于减少人工智能系统中的有害行为、故障和误用风险。
计算机为解决问题或完成任务而遵循的一组定义的规则或步骤。
由于数据、假设或建模选择的偏差而导致模型输出的系统性不公平。
人工智能系统的逻辑、数据源和局限性的记录和理解有多清晰。
人工添加的标签或元数据用于训练或评估机器学习模型。
一种软件系统向另一个系统发送请求并接收响应的结构化方式。
构建执行需要模式识别、推理、语言或决策的任务的系统的广泛领域。
生成输出时动态关注输入的相关部分的模型组件。
一种可以在有限或没有直接人类控制的情况下实时做出决策和采取行动的系统。
核心训练算法通过网络向后传播预测误差来更新模型权重。
一个简单的参考模型,用于比较更复杂的方法是否真正改善结果。
用于测量和比较模型性能的标准化测试或数据集。
数据或模型行为中一致的错误或不公平模式。
非常大且复杂的数据集,需要可扩展的存储和处理技术。
其内部推理难以由人类直接解释的模型。
模型的置信度得分与实际正确性概率的匹配程度。
一种推理风格,人工智能模型将问题分解为中间步骤。
模型将输入分配给一个或多个预定义类别的任务。
专为分类任务设计的模型。
一种学习文本和图像之间共享表示的多模态模型架构。
训练和运行模型所需的处理资源,通常以 FLOPS 或 GPU 小时来衡量。
人工智能的一个分支,从图像和视频中提取意义。
语言模型一次可以处理的输入标记的最大数量。
让模型不断从新数据中学习而不忘记先验知识的训练方法。
一种针对处理图像等网格数据而优化的神经架构。
一种常见的目标函数,用于通过惩罚不正确的概率来训练分类模型。
创建修改后的训练示例以提高模型泛化能力的技术。
现实世界输入数据随时间的变化可能会降低模型性能。
将标签或目标输出分配给原始数据以进行监督学习的过程。
用于训练、验证或测试的结构化或非结构化示例的集合。
特征空间中用于分隔分类器预测的类的表面。
通过一系列 if-then 特征分割进行预测的模型。
机器学习的一个子集,使用多层神经网络进行表示学习。
一种生成架构,可以学习反转噪声以合成图像、音频或其他内容。
将知识从大型教师模型压缩到较小的学生模型中。
将在一个领域训练的模型转移到另一个领域以更好地执行的方法。
捕获文本、图像或其他数据语义的数字向量表示。
将输入转换为潜在表示的模型组件。
结合多个模型的预测以提高鲁棒性或准确性。
用于测量训练后模型质量的保留数据集。
模型的行为可以被解释和解释给人类的程度。
模型错过真正的阳性案例的错误预测。
模型错误地将负面案例标记为正面的错误预测。
模型用来进行预测的输入变量。
设计或转换输入变量,使学习变得更容易、更有效。
将原始数据转换为模型可以使用的信息特征。
仅从少量示例中学习或适应行为。
对特定领域的数据进行持续训练,以使预先训练的模型适应特定任务。
一个大型的预训练模型,可以适应许多下游任务。
生成触发外部工具或 API 的结构化调用的模型功能。
生成器和鉴别器相互训练的生成设置。
模型在训练集之外的新的、未见过的数据上的表现如何。
生成文本、图像、音频、视频或代码等新内容的人工智能系统。
一个向量,显示每个参数应改变多少以减少损失。
一种向减少误差的方向更新参数的优化方法。
用于训练或评估模型输出的可信参考标签。
限制不安全或不需要的模型行为的规则、检查和控制。
当模型生成流畅但错误或不受支持的信息时。
人类审查、指导或覆盖人工智能输出的工作流程。
训练前设置的配置值,例如学习率、批量大小或深度。
模型遵循提示中直接提供的示例中的模式的能力。
经过训练的模型生成预测或输出的运行时阶段。
生成每个响应时消耗的处理能力。
微调指令-响应对的模型以改善任务跟踪。
根据文本查询预测用户的目的以正确路由。
一种旨在绕过模型安全约束的提示技术。
模型训练数据中反映的最新时间点。
训练较小的模型来模仿较大模型的输出。
用于推理或检索的实体和关系的图形结构。
一种软化硬标签以提高泛化能力的正则化方法。
发送请求和接收模型输出之间的时间。
在海量文本语料库上训练来生成和分析文本的语言模型。
训练超参数控制每个更新步骤的参数变化量。
一种添加低秩适配器矩阵的参数高效微调方法。
量化训练期间预测误差的数学目标。
允许系统从数据中学习模式并随着时间的推移进行改进的方法。
AI 代理跨步骤或会话使用存储的上下文来提高连续性。
具有专门子网络的架构,其中每个输入仅运行选定的专家。
描述模型的预期用途、指标、限制和风险的文档。
由于现实条件与训练假设存在差异,性能会随着时间的推移而下降。
降低模型权重的数值精度以减少内存和推理成本。
可以处理或生成文本、图像和音频等多种数据类型的模型。
识别人物、地点、日期或组织等实体的 NLP 任务。
人工智能的分支专注于理解和生成人类语言。
受生物神经元和突触启发的分层计算模型。
将值转换为一致的比例以提高优化稳定性。
将图像或扫描中的文本转换为机器可读文本的技术。
使用公共权重或代码发布的模型,用于检查、调整和重用。
当模型记住训练数据并在未见过的输入上表现不佳时。
模型中学习到的权重会影响其输出。
通过训练一小部分添加参数来调整模型的方法。
一种语言模型指标,衡量模型对真正的下一个标记的惊讶程度。
预处理、模型步骤和后处理阶段的有序工作流程。
实际正确的预测阳性的比例。
在下游适应之前对广泛数据进行初始大规模模型训练。
提供给生成模型的输入指令和上下文。
设计提示以提高输出质量、可靠性和可控性。
一种攻击模式,其中将恶意指令插入模型输入或检索的内容中。
删除不太重要的模型权重或神经元以减小尺寸和计算量。
将模型权重转换为较低精度的格式,例如 8 位或 4 位。
一种检索外部知识并在推理时将其输入生成的方法。
模型正确识别的实际阳性的比例。
预测用户对内容或产品进行排名的偏好的模型管道。
使用对抗性提示对人工智能系统进行压力测试,以揭示失败和风险。
通过奖励信号进行训练,代理学习能够最大化长期回报的行动。
一种使用人类偏好信号来塑造模型行为的训练方法。
从知识源中查找相关文档或记录以进行查询。
一种根据偏好信号对输出进行评分的模型,通常用于 RLHF 管道。
模型在噪声、变化或对抗性输入下保持性能的能力。
阻止或重写不安全模型输入或输出的调节层。
一种经验关系,显示性能如何随模型大小、数据或计算而提高。
通常使用嵌入来匹配含义而不是精确关键字重叠的搜索。
通过预测屏蔽或变换的部分来学习未标记数据的表示。
对文本中的情绪基调或观点进行分类的 NLP 任务。
一种紧凑的语言模型,针对较低的延迟、成本或设备上的使用情况进行了优化。
许多参数为零或不活动以减少计算的模型。
使用将输入映射到已知输出的标记示例来训练模型。
用于增强、模拟或保护敏感训练数据的人工生成的数据。
为模型设置行为、策略和响应方式的高优先级指令。
控制生成输出中的随机性的采样设置。
由语言模型处理的文本块,例如单词或符号。
将文本拆分为模型输入标记的过程。
模型调用外部工具(例如搜索、计算器或 API)的能力。
仅从 k 个最有可能的下一个标记中采样的解码策略。
一种解码策略,从概率总和为 p 的最小标记集中进行采样。
应用在一项任务或领域中学到的知识来改进另一项任务。
一种神经架构,利用注意力并行地对序列之间的关系进行建模。
模型误差值在训练期间计算并随着时间的推移向下优化。
从没有明确目标输出的未标记数据中学习模式。
开发过程中用于调整模型并防止过度拟合的数据集。
针对存储和查询高维嵌入向量而优化的数据库。
联合处理视觉和文本信息的多模态模型。
当干净标签稀缺时,使用噪声、启发式或部分标签来训练模型。
一个学习的数值,用于缩放通过神经网络的信号。
捕获语义关系的单词的密集向量表示。
使人工智能预测更加透明和易于理解的技术和实践。
通过依赖先前的常识来解决没有特定任务示例的任务。
人工智能系统计划、执行、检查结果并迭代实现目标的多步骤过程。
欧盟针对人工智能系统和提供商的基于风险的监管框架。
使系统更安全、更可控所需的时间、计算或产品速度方面的额外成本。
当训练数据中存在基准测试示例或相近变体时,会夸大报告的性能。
估计因果关系而不是简单相关性的方法。
可能包含测量模型指标的真实值的统计范围。
一种训练和行为塑造方法,其中模型输出由一组固定的书面原则指导。
记录数据来自何处、如何转换以及在何处使用。
数据集或模型工件的记录来源、所有权和历史记录。
一种隐私技术,会增加统计噪声,因此无法从输出中可靠地推断出单个记录。
经过训练的较小模型可以模仿较大模型的行为,同时在推理时使用较少的计算。
专门用于将数据转换为用于语义搜索、聚类和检索的向量的模型。
一个可重复的评估框架,可跨模型版本运行提示、数据集和评分逻辑。
一个托管系统,用于一致地存储和提供经过验证的 ML 功能,以进行训练和推理。
人工智能响应得到源数据或检索到的证据支持的程度。
将输出代币限制为有效结构或符合策略的选择的生成策略。
一个根据人类排名进行训练的模型,用于预测用户可能更喜欢哪些响应。
已部署的 API 接口,用于接收模型请求并返回生产中的预测。
用于检索、支持自动化或基础响应的精选文档或记录集合。
压缩的表示空间,其中相似的概念作为向量彼此靠近。
用于跨环境进行版本控制、批准和跟踪模型的中央目录。
人工智能推理在用户硬件上本地执行,而不是在远程云服务中执行。
验证模型输出并将其转换为强类型、机器可用结构的逻辑。
具有变量、格式规则和特定于任务的指令的可重用提示模式。
与用户查询相关的检索到的项目的比例。
有证据支持的结构化论证,表明人工智能系统对于定义的使用环境是安全的。
与生产流量并行运行模型,不会影响面向用户的决策。
模型输出受限于已定义的架构,例如 JSON、工具参数或类型化字段。
在响应生成期间使用额外的推理计算来提高质量或推理。
将用户对人工智能输出的信心与系统在每项任务中的实际可靠性结合起来。
成本随 API 调用、令牌、推理时间或消耗的计算而变化的定价。
一种策略,在处理超出短暂的操作窗口后,不存储请求/响应有效负载。
一种推理加速方法,其中小型草稿模型提出令牌,大型模型并行验证。
存储来自先前令牌的键和值张量,使 Transformer 可以生成新令牌而无需重新计算过去的注意力。
一种开放协议,允许人工智能应用程序以标准方式连接到外部工具、数据源和上下文提供者。
人工智能代理观察、计划、行动和反思的迭代循环,直到完成目标或达到停止条件。
一种提示模式,将推理步骤与工具使用操作交织在一起,以更可靠地解决任务。
一种推理方法,模型探索多个分支解决方案路径并选择最有希望的路径。
一种直接在偏好对上微调模型的训练方法,无需单独的奖励模型。
一种微调技术,将 4 位权重量化与 LoRA 适配器相结合,以减少内存需求。
一种优化的注意力算法,可减少内存使用并加速 Transformer 训练和推理。
一种并行运行多个注意力操作以捕获不同类型关系的转换器机制。
添加到标记嵌入的信息,以便转换器可以区分序列顺序。
一种位置编码方法,可旋转查询向量和键向量以对相对标记位置进行编码。
一种位置偏差方法,根据标记距离惩罚注意力分数,帮助模型推断更长的上下文。
一种注意模式,其中每个令牌仅关注附近令牌的固定大小窗口以减少计算。
一种子词标记化算法,将最常见的字符对合并为可重用的标记。
一种与语言无关的分词器,可以直接从原始文本中学习子词单元,而无需在空格上进行预分割。
无需进行详尽比较即可找到接近查询的向量的算法,以准确性换取速度。
基于图的索引结构,用于高维向量上的快速近似最近邻搜索。
一种对一组初始检索结果重新排序以将最相关的项目放在顶部的模型。
一种检索方法,将关键字(词汇)搜索与矢量(语义)搜索相结合,以提高召回率和精度。
一种模型,可一次性对查询和文档进行评分,以实现高精度的相关性判断。
一种将查询和文档编码为单独向量的模型,以便可以快速大规模地比较它们。
在评估过程中使用语言模型对其他模型的输出进行评分或比较。
一种代码评估指标,用于衡量 k 个生成的样本中至少有一个通过测试的机会。
使用多项选择题测试跨 57 个学术和专业科目的语言模型的基准测试。
Python 编程问题的基准,用于通过单元测试衡量代码生成的正确性。
小学数学应用题的基准,用于评估语言模型中的逐步推理。
模型的主张与可验证的现实世界信息的匹配程度如何。
对模型响应中包含的源段落或文档的引用,以支持其主张。
在人工智能生成的文本或媒体中嵌入可检测信号,以便稍后将其识别为机器生成的。
预训练和训练后之间的中间训练阶段,通常用于能力或领域调整。
预训练后应用的训练步骤,例如指令调整、偏好优化和安全调整。
一种训练设置,模型通过与自身副本的交互或竞争生成数据来改进。
一种检索方法,可生成多个查询变体、检索每个查询变体的结果并融合排名。
一种检索技术,将用户查询重写为多个变体以提高召回率。
一种检索模式,搜索小块但返回其较大的父文档以获得更丰富的上下文。
一种解码算法,在每一步中保留前几个候选序列以找到更高概率的输出。
一种解码设置,可降低模型已生成的令牌的概率,以减少循环。
一种解码设置,可根据令牌迄今为止出现的频率成比例地降低令牌的概率。
一种解码设置,可降低令牌出现的概率,从而鼓励新主题。