语言人工智能指南

ELMo 上下文嵌入

ELMo(语言模型嵌入)是 2018 年的一项突破,它为每个单词提供了由其句子形成的表示,因此“河岸”中的“银行”与“储蓄银行”中的“银行”不同。

概述

ELMo(语言模型嵌入)是 2018 年的一项突破,它为每个单词提供了由其句子形成的表示,因此“河岸”中的“银行”与“储蓄银行”中的“银行”不同。它标志着从静态词向量到上下文感知 NLP 的转变。

ELMo 上下文嵌入是语言 AI ​​堆栈的一部分,用于大规模读取、生成、分类和转换文本和语音。

深入探讨

ELMo 由艾伦人工智能研究所 (Peters et al., 2018) 推出,通过在十亿单词语料库上训练的深度双向 LSTM 语言模型运行句子来生成单词表示。与 Word2Vec 或 GloVe 为每个单词分配一个固定向量不同,ELMo 会根据周围的上下文为每个单词计算一个新的向量。至关重要的是,ELMo 通过学习的、特定于任务的权重结合了所有内部 LSTM 层,而不是仅使用顶层。较低层倾向于捕获语法(词性、结构),而较高层则捕获语义和词义。将 ELMo 添加到现有模型中,在六个基准任务中产生了巨大的收益,包括问答、情感分析和命名实体识别。

技术洞察

ELMo 堆叠了两个 LSTM:一个预测下一个单词的前向语言模型和一个预测前一个单词的后向语言模型,每个模型都基于字符级 CNN 输入(因此它可以处理未见过的单词)。对于下游任务,ELMo 使用 softmax 归一化权重和标量来折叠层表示,所有这些都是在微调期间学习的。这意味着每个任务都可以决定需要从冻结的预训练 biLM 中获得多少句法信号和语义信号。

掌握 ELMo 上下文嵌入

ELMo(语言模型嵌入)是 2018 年的一项突破,它为每个单词提供了由其句子形成的表示,因此“河岸”中的“银行”与“储蓄银行”中的“银行”不同。它标志着从静态词向量到上下文感知 NLP 的转变。 ELMo 上下文嵌入是语言 AI ​​堆栈的一部分,用于大规模读取、生成、分类和转换文本和语音。为了建立深入的理解,请将 ELMo 上下文嵌入视为一种操作模型,而不是单个功能:定义所需的结果,澄清假设,并将系统可以可靠地执行的操作与仍需要专家判断的操作分开。

在实践中,使用 ELMo 上下文嵌入的强大团队将提示、检索和审查循环设计为一个集成通信系统。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

语言工作流程可以在不牺牲一致性的情况下更快地移动。与此同时,幻觉事实可以悄悄地进入报告、支持流程或研究成果。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

语言工作流程可以在不牺牲一致性的情况下更快地移动。

语言工作流程可以在不牺牲一致性的情况下更快地移动。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

它扩展了跨语言和沟通方式的访问。

它扩展了跨语言和沟通方式的访问。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

团队可以花更多时间进行判断,而自动化则可以处理重复。

团队可以花更多时间进行判断,而自动化则可以处理重复。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

ELMo 上下文嵌入的未来

ELMo 的核心思想,即来自语言模型预训练的上下文表示,已成为基础,但其循环 LSTM 架构很快就被基于 Transformer 的模型(例如 2018 年底的 BERT)所掩盖,BERT 可以并行读取整个句子,并且扩展性更好。如今,ELMo 主要具有历史和教育意义,尽管字符 CNN 输入处理和层加权思想仍然影响着资源匮乏和形态丰富的语言中的专门嵌入工作。

现实世界的实施

改进命名实体识别系统,该系统必须根据周围的单词判断“华盛顿”是指个人、州还是城市

通过捕获“生病”在“我感觉不舒服”中表示消极但在俚语“那生病了”中表示积极来促进情绪分析

通过将上下文相关的标记向量输入阅读器来增强 SQuAD 基准的问答系统

在机器翻译中消除词义歧义,以便像“植物”这样的多义词可以在给定的上下文中正确翻译

实施模式

ELMo 上下文嵌入实践

改进命名实体识别系统,必须根据周围的单词判断“华盛顿”是否指的是一个人、州或城市。

改进命名实体识别系统,该系统必须根据周围的单词判断“华盛顿”是否指代一个人、州或城市。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会得到更好的结果。

ELMo 上下文嵌入实践

通过捕获“生病”在“我感觉生病”中表示消极,但在俚语“那生病了”中表示积极,来促进情绪分析。

通过捕获“生病”在“我感觉不舒服”中表示消极,但在俚语“那生病了”中表示积极,来促进情绪分析 当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

ELMo 上下文嵌入实践

通过将上下文相关的标记向量输入阅读器来增强 SQuAD 基准的问答系统。

通过将上下文相关的标记向量输入读取器来增强 SQuAD 基准上的问答系统 当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

ELMo 上下文嵌入实践

在机器翻译中消除词义歧义,以便像“植物”这样的多义词可以在给定的上下文中正确翻译。

消除机器翻译中的词义歧义,以便在给定的上下文中正确翻译“植物”等多义词。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

风险与防护栏

!

幻觉的事实可以悄悄地进入报告、支持流程或研究成果。

!

及时的敏感性可能会在类似的请求中产生不一致的结果。

!

如果访问控制薄弱,敏感文本数据可能会暴露。

实施路线图

1

在推出之前定义输出格式、语气和质量标准。

在推出之前定义输出格式、语气和质量标准。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

2

当准确性很重要时,请使用可信来源进行地面响应。

当准确性很重要时,请使用可信来源进行地面响应。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

3

为高风险输出保留人工审查检查点。

为高风险输出保留人工审查检查点。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

4

跟踪故障模式并定期重新训练提示或工作流程。

跟踪故障模式并定期重新训练提示或工作流程。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

不断探索