基础知识指南

主动学习

主动学习是一种训练策略，模型本身会选择人类接下来应该标记哪些未标记的示例。

概述

主动学习是一种训练策略，模型本身会选择人类接下来应该标记哪些未标记的示例。这很重要，因为标记数据非常昂贵，而智能选择可以通过一小部分注释达到高精度。

主动学习位于核心人工智能工具包中。当你理解它时，其他人工智能主题就变得更容易评估和比较。

深入探讨

大多数监督学习假设您已经拥有大量标记数据。主动学习翻转了这一点：你从一个小的标记集和大量未标记的示例开始，然后反复要求人类（“预言家”）仅标记信息最丰富的示例。该模型经过训练，用于对未标记的池进行评分，并且发送最高值的示例进行标记 - 然后重复循环。常见的选择策略包括不确定性抽样（选择模型最不自信的示例）、委员会查询（选择整体不同意的地方）和多样性抽样（覆盖数据的不同区域）。如果做得好，主动学习可以使用更少的标签来匹配完整数据集的准确性，这就是它在医学成像、自然语言处理以及专家注释缓慢或昂贵的任何领域流行的原因。

技术洞察

核心思想是在付费标记每个未标记点之前估计其“价值”。不确定性采样使用模型自身的概率 - 例如，选择顶级类概率最接近机会的点，或者选择前两类之间具有最高熵或最小间隔的点。委员会询问训练多个模型并选择他们最不同意的点。一个关键的风险是抽样偏差：贪婪地追逐不确定性可能会忽略整个区域，因此通常会结合多样性或批量感知方法。

掌握主动学习

为了建立深入的理解，请将主动学习视为一种操作模型，而不是单一功能。定义期望的结果，澄清假设，并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中，使用主动学习的强大团队首先构建强大的概念模型，然后将这些模型映射到实际的生产约束。他们记录明确的成功标准，根据实际数据和工作流程进行测试，并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

它可以帮助您将清晰的技术声明与营销语言分开。同时，不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。最具弹性的方法是将实验速度与治理规则结合起来：运行试点、捕获证据、发布决策日志，并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

它可以帮助您将清晰的技术声明与营销语言分开。

它可以帮助您将清晰的技术声明与营销语言分开。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

在花费金钱或时间之前，您可以提出更好的实施问题。

在花费金钱或时间之前，您可以提出更好的实施问题。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

具有共同理解的团队可以做出更好的产品、政策和学习决策。

具有共同理解的团队可以做出更好的产品、政策和学习决策。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

主动学习的未来

主动学习越来越多地与大型预训练和基础模型相结合，其目标从标记所有内容转变为对一些高价值示例进行廉价的微调。预计与弱监督、自监督预训练和人机循环工具的更紧密集成，为审阅者提供标签以供确认而不是创建。由于标签成本在许多实际部署中占主导地位，因此自动选择加上高效的注释接口仍将是在医学和法律等数据稀缺的专业领域构建模型的核心。

现实世界的实施

放射学团队通过让模型标记最模糊的扫描供放射专家进行标记来训练肿瘤检测器，从而大大减少注释时间。

垃圾邮件或内容审核系统会显示人类审阅者最不确定的边界消息，在硬边界情况下改进得最快。

语音识别公司选择其模型最不确定的音频剪辑（口音、噪音）来发送转录，而不是标记随机剪辑。

电子商务目录使用委员会查询来挑选多个分类器不同意的产品图像，并优先考虑它们以进行手动类别标记。

实施模式

实践中的主动学习

放射学团队通过让模型标记最模糊的扫描供放射专家进行标记来训练肿瘤检测器，从而大大减少注释时间。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的主动学习

垃圾邮件或内容审核系统会显示人类审阅者最不确定的边界消息，在硬边界情况下改进得最快。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的主动学习

语音识别公司选择其模型最不确定的音频剪辑（口音、噪音）来发送转录，而不是标记随机剪辑。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

实践中的主动学习

电子商务目录使用委员会查询来挑选多个分类器不同意的产品图像，并优先考虑它们以进行手动类别标记。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

风险与防护栏

不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。

基准测试可能看起来很强大，但实际性能却参差不齐。

忽视数据质量和评估计划通常会产生脆弱的结果。

实施路线图

从您需要的结果的简单语言定义开始。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

在测试之前选择一种成功指标和一种失败条件。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

使用代表性数据运行小型试点，而不是完善的演示集。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

记录主动学习在哪些方面有帮助以及在哪些方面更简单的方法更好。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

不断探索

什么是人工智能？

在深入研究之前先了解基本概念。

阅读指南

人工智能如何学习

了解现代系统背后的培训过程。

阅读指南

Check your understanding

Test yourself: take the Active Learning quiz

Start quiz →

主动学习

概述

深入探讨

技术洞察

掌握主动学习

战略影响

主动学习的未来

现实世界的实施

实施模式

实践中的主动学习

实践中的主动学习

实践中的主动学习

实践中的主动学习

风险与防护栏

实施路线图

不断探索

什么是人工智能？

人工智能如何学习

Related guides