概述
人工智能天气模型直接从过去几十年的观测中学习大气模式,在几秒钟内生成 10 天的预测,可以与需要数小时运行的基于物理的超级计算机模型相媲美或击败。这正在重塑气象学家预测风暴、热浪和飓风的方式。
天气预报中的人工智能将人工智能应用于特定领域的环境中,在这些环境中,法规、操作和风险承受能力强烈影响着设计选择。
深入探讨
70 年来,天气预报意味着在巨型超级计算机上求解流体物理方程,这一过程称为数值天气预报 (NWP)。 AI 颠覆了这种方法:Google DeepMind 的 GraphCast、华为的盘古天气和 NVIDIA 的 FourCastNet 等模型均在 ERA5 再分析数据集(大约 40 年的每小时全球天气)上进行训练。他们了解今天的大气层和明天的大气层之间的统计关系,然后通过模式匹配而不是模拟物理进行预测。 GraphCast 在单个 TPU 上不到一分钟就能以 0.25 度的分辨率生成 10 天的全球预测,而在超级计算机集群上则需要数小时。 2023 年,GraphCast 在大多数变量上都优于黄金标准 ECMWF 模型。欧洲中心现在运行自己的人工智能操作模型 AIFS。
技术洞察
GraphCast 将地球表示为图表:以多个尺度连接的节点的多重网格,让信息在本地和长距离内通过几个步骤传播。图神经网络获取当前和之前的大气状态,然后预测未来 6 小时的状态。为了预测 10 天,它以自回归方式反馈自己的输出 40 次。训练优化了压力水平和温度、风和湿度等变量的加权误差。
掌握天气预报中的人工智能
人工智能天气模型直接从过去几十年的观测中学习大气模式,在几秒钟内生成 10 天的预测,可以与需要数小时运行的基于物理的超级计算机模型相媲美或击败。这正在重塑气象学家预测风暴、热浪和飓风的方式。天气预报中的人工智能将人工智能应用于特定领域的环境中,在这些环境中,法规、操作和风险承受能力强烈影响着设计选择。为了建立深入的理解,请将天气预报中的人工智能视为一种操作模型,而不是单一功能:定义期望的结果,澄清假设,并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。
在实践中,在天气预报中使用人工智能的强大团队将技术能力与领域政策、可审计性和一线决策相结合。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。
行业背景决定了人工智能创意能否与现实接触。同时,监管要求可能会使原本强大的原型失效。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。
战略影响
行业背景决定了人工智能创意能否与现实接触。
行业背景决定了人工智能创意能否与现实接触。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。
领域约束会影响可接受的错误率和监督模型。
领域约束会影响可接受的错误率和监督模型。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。
成功的部署使技术能力与一线工作流程保持一致。
成功的部署使技术能力与一线工作流程保持一致。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。
现实世界的实施
Google DeepMind 的 GraphCast 可在一分钟内生成 10 天的全球预报,用于提前几天标记气旋路径
ECMWF 运行其可操作的 AIFS 模型,以补充其传统的基于物理的欧洲天气服务预报
NVIDIA 的 FourCastNet 快速生成大型集合来估计极端风和降水事件的概率
GenCast 生成的概率集合预报在 97% 的测试天气目标上击败了 ECMWF 的 ENS,从而改进了热带气旋路径指导
实施模式
人工智能在天气预报中的实践
Google DeepMind 的 GraphCast 可在一分钟内生成 10 天的全球预报,用于提前几天标记气旋路径。
Google DeepMind 的 GraphCast 在不到一分钟的时间内生成 10 天的全球预测,用于提前几天标记气旋路径。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会得到更好的结果。
人工智能在天气预报中的实践
ECMWF 运行其可操作的 AIFS 模型,以补充其传统的基于物理的欧洲天气服务预报。
ECMWF 运行其可操作的 AIFS 模型,以补充其针对欧洲气象服务的传统基于物理的预测。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力增益和错误成本时,通常会获得更好的结果。
人工智能在天气预报中的实践
NVIDIA 的 FourCastNet 快速生成大型集合来估计极端风和降水事件的概率。
NVIDIA 的 FourCastNet 快速生成大型集合来估计极端风和降水事件的概率。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力增益和错误成本时,通常会获得更好的结果。
人工智能在天气预报中的实践
GenCast 生成的概率集合预报在 97% 的测试天气目标上击败了 ECMWF 的 ENS,从而改善了热带气旋路径指导。
GenCast 生成的概率集合预报在 97% 的测试天气目标上击败了 ECMWF 的 ENS,改进了热带气旋路径指导。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。
风险与防护栏
监管要求可能会使原本强大的原型失效。
历史数据可能会编码损害特定社区的偏见。
遗留系统可能会造成集成瓶颈和隐性成本。
实施路线图
让领域专家参与从问题框架到评估的整个过程。
让领域专家参与从问题框架到评估的整个过程。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。
在启动前设计审计跟踪和文档。
在启动前设计审计跟踪和文档。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。
尽早验证合规性和安全义务。
尽早验证合规性和安全义务。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。
分阶段推出,并具有明确的停止和回滚标准。
分阶段推出,并具有明确的停止和回滚标准。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。