技术指南

Seldon 核心和推理图

Seldon Core 是一个用于在 Kubernetes 上部署机器学习模型的开源平台,具有一个突出的功能:推理图。

概述

Seldon Core 是一个用于在 Kubernetes 上部署机器学习模型的开源平台,具有一个突出的功能:推理图。它不是提供一个孤立的模型,而是让您将模型、路由器、组合器和转换器链接到作为一项可部署服务运行的单个有向图中。

Seldon 核心和推理图是一个技术构建块,会大规模影响模型质量、基础设施成本、延迟和可靠性。

深入探讨

许多实际生产用例涉及多个模型调用。您可以预处理输入,将请求路由到多个模型之一,运行集成,然后对结果进行后处理。 Seldon Core 将其表达为 SeldonDeployment 中定义的推理图(或者,在 v2 架构中,通过 Seldon Core Operator 和 MLServer)。该图是由可重用的组件类型构建的:模型提供预测,变压器修改输入或输出,路由器决定调用哪个子级(启用 A/B 测试和多臂老虎机),组合器聚合多个模型的输出以进行集成。 Seldon 通过预打包的服务器和自定义 Python 包装器支持许多框架,并且它公开了丰富的指标、分布式跟踪和开箱即用的有效负载日志记录,以实现可观察性和可解释性。

技术洞察

推理图是有向无环图,其中每个节点都是具有标准预测接口的微服务,Seldon 的编排器(服务编排器/执行器)通过图路由请求并合并响应。由于路由器可以实现多臂老虎机逻辑,因此流量可以根据实时奖励信号自适应地转向性能更好的模型。 Seldon Core v2 使用 MLServer 和开放推理协议将图与各个模型服务器解耦,从而在共享硬件上实现多模型服务和过度使用。

掌握 Seldon 核心和推理图

Seldon Core 是一个用于在 Kubernetes 上部署机器学习模型的开源平台,具有一个突出的功能:推理图。它不是提供一个孤立的模型,而是让您将模型、路由器、组合器和转换器链接到作为一项可部署服务运行的单个有向图中。 Seldon 核心和推理图是一个技术构建块,会大规模影响模型质量、基础设施成本、延迟和可靠性。为了建立深入的理解,请将 Seldon Core 和推理图视为一种操作模型,而不是单一功能:定义期望的结果,澄清假设,并将系统可以可靠地执行的操作与仍然需要专家判断的操作分开。

在实践中,使用 Seldon Core 和推理图的强大团队可以根据可靠性和成本来优化架构、数据和基础设施选择。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

多年来,架构决策决定着性能和运营成本。与此同时,优化一个基准测试可以隐藏更广泛的系统弱点。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

多年来,架构决策决定着性能和运营成本。

多年来,架构决策决定着性能和运营成本。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

技术教育帮助团队选择正确的堆栈,而不仅仅是最新的堆栈。

技术教育帮助团队选择正确的堆栈,而不仅仅是最新的堆栈。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

更好的工程选择可以减少生产中的可靠性事故。

更好的工程选择可以减少生产中的可靠性事故。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

Seldon 核心和推理图的未来

Seldon 正在通过 Core v2 的管道和数据流设计,以及与漂移检测 (Alibi Detect) 和可解释性 (Alibi Expand) 的更紧密耦合,转向模块化、以数据为中心的 MLOps。随着法学硕士和代理系统成为检索、模型和工具的复合图,推理图抽象自然地映射到这些工作流程上。预计将更加重视多模型服务效率、流媒体和标准化可观测性,以便复杂的多步骤人工智能系统在生产中保持可调试和可治理。

现实世界的实施

贷方链接一个 Transformer,将特征一次性编码到模型节点中,然后链接一个格式化分数的 Transformer,所有这些都作为一个 SeldonDeployment。

一家媒体公司使用运行多臂老虎机的路由器节点来动态地将更多流量发送到获得更高点击奖励的推荐模型。

一个团队将三个欺诈模型与一个组合器节点集成在一起,该节点在将单个决策返回给调用者之前对它们的分数进行平均。

一家受监管的保险公司将 Seldon 的有效负载记录和 Alibi 解释器附加到推理图上,以便可以跟踪和解释每个预测以进行审计。

实施模式

Seldon 核心和推理图的实践

贷方链接一个 Transformer,将特征一次性编码到模型节点中,然后链接一个格式化分数的 Transformer,所有这些都作为一个 SeldonDeployment。

贷方将一个 Transformer 链接起来,将功能一次性编码到模型节点中,然后将一个 Transformer 格式化分数,所有这些都是一个 Seldon 部署团队在预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时通常会获得更好的结果。

Seldon 核心和推理图的实践

一家媒体公司使用运行多臂老虎机的路由器节点来动态地将更多流量发送到获得更高点击奖励的推荐模型。

一家媒体公司使用运行多臂老虎机的路由器节点来动态地将更多流量发送到能够获得更高点击奖励的推荐模型。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

Seldon 核心和推理图的实践

一个团队将三个欺诈模型与一个组合器节点集成在一起,该节点在将单个决策返回给调用者之前对它们的分数进行平均。

团队将三个欺诈模型与组合器节点集成在一起,该节点在将单个决策返回给调用者之前对它们的分数进行平均。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

Seldon 核心和推理图的实践

一家受监管的保险公司将 Seldon 的有效负载记录和 Alibi 解释器附加到推理图上,以便可以跟踪和解释每个预测以进行审计。

一家受监管的保险公司将 Seldon 的有效负载记录和 Alibi 解释器附加到推理图上,以便可以跟踪和解释每个预测以进行审计。当团队预先定义质量阈值、为边缘情况保留人工升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会获得更好的结果。

风险与防护栏

!

优化一项基准测试可以隐藏更广泛的系统弱点。

!

基础设施和维护成本常常被低估。

!

随着系统变得更加复杂,安全性和可观察性差距可能会扩大。

实施路线图

1

在实施之前定义延迟、质量和成本目标。

在实施之前定义延迟、质量和成本目标。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

2

在实际负载和数据条件下进行基准测试。

在实际负载和数据条件下进行基准测试。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

3

仪器监控错误、漂移和用户影响。

仪器监控错误、漂移和用户影响。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

4

在扩展之前准备回滚和事件响应路径。

在扩展之前准备回滚和事件响应路径。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

不断探索