基础知识指南

自我监督学习

自监督学习通过发明一个任务来训练未标记数据的模型，该任务的答案隐藏在数据本身中。

概述

自监督学习通过发明一个任务来训练未标记数据的模型，该任务的答案隐藏在数据本身中。这就是现代语言和视觉基础模型如何从原始互联网中学习，而无需大量人工标记者。

自我监督学习位于核心人工智能工具包中。当你理解它时，其他人工智能主题就变得更容易评估和比较。

深入探讨

手动标记数据既缓慢又昂贵，但世界上充满了未标记的文本、图像、音频和视频。自我监督学习通过创建“借口任务”来解锁它，其中数据提供自己的答案。典型的例子是 BERT 使用的屏蔽语言模型：隐藏句子中的一些单词并训练模型根据上下文来预测它们。 GPT 风格的模型预测下一个单词。在视觉方面，SimCLR 等对比方法向模型展示同一图像的两个增强作物，并教会它它们属于在一起，同时将不同的图像分开。解决这些自制的难题迫使模型构建丰富的意义和结构的内部表示。然后，这些表示可以在很少或没有标记数据的情况下有效地转移到真正的下游任务。

技术洞察

诀窍是免费生成监督信号。在屏蔽建模中，隐藏的标记是标签，因此可以在没有任何人工注释的情况下计算损失。在对比学习中，一个图像的两个增强形成一个“正对”，应该靠近嵌入空间，而其他图像则被“负”推开。无论哪种方式，模型都会在纯粹从数据自身结构派生的标签上进行优化，学习随后只需要进行轻微微调的一般特征。

掌握自我监督学习

为了建立深入的理解，请将自我监督学习视为一种操作模型，而不是单一功能。定义期望的结果，澄清假设，并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中，使用自我监督学习的强大团队首先构建强大的概念模型，然后将这些模型映射到实际的生产约束。他们记录明确的成功标准，根据实际数据和工作流程进行测试，并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

它可以帮助您将清晰的技术声明与营销语言分开。同时，不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。最具弹性的方法是将实验速度与治理规则结合起来：运行试点、捕获证据、发布决策日志，并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

它可以帮助您将清晰的技术声明与营销语言分开。

它可以帮助您将清晰的技术声明与营销语言分开。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

在花费金钱或时间之前，您可以提出更好的实施问题。

在花费金钱或时间之前，您可以提出更好的实施问题。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

具有共同理解的团队可以做出更好的产品、政策和学习决策。

具有共同理解的团队可以做出更好的产品、政策和学习决策。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

自我监督学习的未来

自我监督学习是当今基础模型背后的引擎，而且这一作用只会越来越大。明显的趋势是多模式预训练，其中单个模型使用自我监督目标从文本、图像、音频和视频中联合学习。研究人员正在超越对比方法，转向视觉中的掩模预测方法和不需要反面例子的自蒸馏技术。随着高质量标记数据成为瓶颈，直接从大量未标记数据流中学习有用的结构将仍然是扩展人工智能的核心策略。

现实世界的实施

BERT 通过预测屏蔽单词来学习语言，然后针对搜索、情绪或问题回答进行微调

SimCLR 在未标记的照片上预训练图像编码器，以便稍后可以使用很少的标签进行分类

GPT 风格的模型通过在巨大的文本语料库中重复预测下一个标记来学习写作

在适应转录之前，对原始未标记音频进行预训练的语音模型（预测掩蔽声音片段）

实施模式

自我监督学习的实践

BERT 通过预测屏蔽单词来学习语言，然后针对搜索、情绪或问题回答进行微调。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

自我监督学习的实践

SimCLR 在未标记的照片上预训练图像编码器，以便稍后可以使用很少的标签进行分类。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

自我监督学习的实践

GPT 风格的模型通过在巨大的文本语料库中重复预测下一个标记来学习写作。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

自我监督学习的实践

在适应转录之前，对原始未标记音频进行预训练的语音模型（预测掩蔽声音片段）。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

风险与防护栏

不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。

基准测试可能看起来很强大，但实际性能却参差不齐。

忽视数据质量和评估计划通常会产生脆弱的结果。

实施路线图

从您需要的结果的简单语言定义开始。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

在测试之前选择一种成功指标和一种失败条件。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

使用代表性数据运行小型试点，而不是完善的演示集。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

记录自我监督学习在哪些方面有帮助以及哪些更简单的方法更好。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

不断探索

什么是人工智能？

在深入研究之前先了解基本概念。

阅读指南

人工智能如何学习

了解现代系统背后的培训过程。

阅读指南

Check your understanding

Test yourself: take the Self-Supervised Learning quiz

Start quiz →

自我监督学习

概述

深入探讨

技术洞察

掌握自我监督学习

战略影响

自我监督学习的未来

现实世界的实施

实施模式

自我监督学习的实践

自我监督学习的实践

自我监督学习的实践

自我监督学习的实践

风险与防护栏

实施路线图

不断探索

什么是人工智能？

人工智能如何学习

Related guides