技术指南

挤压和激励网络

挤压和激励(SE)块让卷积网络了解每个特征通道的权重,并根据全局上下文重新校准它们。

概述

挤压和激励(SE)块让卷积网络了解每个特征通道的权重,并根据全局上下文重新校准它们。这种廉价的类注意力机制赢得了 2017 年 ImageNet 竞赛,并成为标准的 CNN 构建块。

挤压和激励网络是一个技术构建块,会大规模影响模型质量、基础设施成本、延迟和可靠性。

深入探讨

SE 模块由 Hu、Shen 和 Sun 于 2017 年提出,为 CNN 增加了显式通道关注。它分两步进行。 “挤压”使用全局平均池化将每个特征图(高度 x 宽度)折叠为单个数字,为​​每个通道生成一个描述符来总结其全局激活。 “激励”通过两个带有瓶颈的小型全连接层(一个 ReLU,然后是一个 sigmoid)将该向量馈入,以产生 0 到 1 之间的每通道权重。这些权重与原始特征图相乘,放大有用的通道并抑制不相关的通道。 SENet 赢得了 ILSVRC 2017 分类挑战,将 top-5 错误率降低至约 2.25%。该块仅添加百分之几的额外参数和计算,并以最小的更改插入到 ResNet、Inception 或 MobileNet 中。

技术洞察

挤压产生一个 C 长度向量 z,其中 z_c 是通道 c 的空间平均值。激励计算 s = sigmoid(W2 * ReLU(W1 * z)),其中 W1 按缩减比率 r(通常为 16)减少维度,而 W2 恢复它,从而保持增加的成本很小。输出是按通道按 s 缩放的输入特征图。这是一种自我控制的形式:网络根据全球统计数据决定哪些渠道对于该特定输入很重要。

掌握挤压和激励网络

挤压和激励(SE)块让卷积网络了解每个特征通道的权重,并根据全局上下文重新校准它们。这种廉价的类注意力机制赢得了 2017 年 ImageNet 竞赛,并成为标准的 CNN 构建块。挤压和激励网络是一个技术构建块,会大规模影响模型质量、基础设施成本、延迟和可靠性。为了建立深入的理解,请将挤压和激励网络视为一种操作模型,而不是单一功能:定义期望的结果,澄清假设,并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中,使用挤压和激励网络的强大团队可以根据可靠性和成本来优化架构、数据和基础设施选择。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

多年来,架构决策决定着性能和运营成本。与此同时,优化一个基准测试可以隐藏更广泛的系统弱点。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

多年来,架构决策决定着性能和运营成本。

多年来,架构决策决定着性能和运营成本。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

技术教育帮助团队选择正确的堆栈,而不仅仅是最新的堆栈。

技术教育帮助团队选择正确的堆栈,而不仅仅是最新的堆栈。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

更好的工程选择可以减少生产中的可靠性事故。

更好的工程选择可以减少生产中的可靠性事故。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

挤压和激励网络的未来

SE 块存在于高效架构内部:EfficientNet 和 MobileNetV3 将它们嵌入到其构建块中。这个想法催生了一系列注意力模块,CBAM 增加了空间注意力,ECA-Net 用廉价的一维卷积取代了瓶颈,这些轻量级的重新校准技巧现在出现在检测、分割,甚至一些视觉变换器混合中。只要卷积持续存在,预计通道注意力仍然是一个低成本的准确性杠杆。

现实世界的实施

SENet 通过将 SE 块添加到 ResNeXt 主干网络赢得了 ImageNet ILSVRC 2017 分类挑战赛

EfficientNet 和 MobileNetV3 在每个块中嵌入 SE 模块,以提高移动设备上的准确性

对象检测器和分割模型插入 SE 块以强调信息丰富的特征通道

ECA-Net 和 CBAM 通过更便宜或空间感知的通道重新校准扩展了 SE 理念

实施模式

实践中的挤压和激励网络

SENet 通过将 SE 块添加到 ResNeXt 主干网络,赢得了 ImageNet ILSVRC 2017 分类挑战赛。

SENet 通过将 SE 块添加到 ResNeXt 主干网络,赢得了 ImageNet ILSVRC 2017 分类挑战赛。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

实践中的挤压和激励网络

EfficientNet 和 MobileNetV3 在每个块中嵌入 SE 模块,以提高移动设备上的准确性。

EfficientNet 和 MobileNetV3 在每个块中嵌入 SE 模块,以提高移动设备上的准确性。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

实践中的挤压和激励网络

对象检测器和分割模型插入 SE 块以强调信息丰富的特征通道。

对象检测器和分割模型插入 SE 块以强调信息丰富的特征通道。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

实践中的挤压和激励网络

ECA-Net 和 CBAM 通过更便宜或空间感知的通道重新校准扩展了 SE 理念。

ECA-Net 和 CBAM 通过更便宜或空间感知的通道重新校准来扩展 SE 理念。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

风险与防护栏

!

优化一项基准测试可以隐藏更广泛的系统弱点。

!

基础设施和维护成本常常被低估。

!

随着系统变得更加复杂,安全性和可观察性差距可能会扩大。

实施路线图

1

在实施之前定义延迟、质量和成本目标。

在实施之前定义延迟、质量和成本目标。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

2

在实际负载和数据条件下进行基准测试。

在实际负载和数据条件下进行基准测试。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

3

仪器监控错误、漂移和用户影响。

仪器监控错误、漂移和用户影响。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

4

在扩展之前准备回滚和事件响应路径。

在扩展之前准备回滚和事件响应路径。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

不断探索