基础知识指南

集成方法和梯度提升

集成方法结合了许多简单的模型，因此该组可以比任何单个模型做出更好的预测。

概述

集成方法结合了许多简单的模型，因此该组可以比任何单个模型做出更好的预测。梯度提升是其中最强大的——它一次构建一棵树，每棵树都会纠正上一棵树的错误，并主导现实世界的表格机器学习。

集成方法和梯度提升位于核心人工智能工具包中。当你理解它时，其他人工智能主题就变得更容易评估和比较。

深入探讨

集成基于一个简单的想法：许多弱学习器结合起来可以形成一个强学习器。两个家庭主导。 Bagging（例如随机森林）在随机样本上并行训练许多树并对它们进行平均，这主要减少方差。 Boosting 按顺序训练模型，每个模型都关注前一个模型所犯的错误，这主要是减少偏差。梯度提升将每棵新树构建为适合迄今为止损失函数的负梯度（残余误差）的步骤。 XGBoost、LightGBM 和 CatBoost 等库添加了正则化、巧妙的分割和速度技巧。在结构化/表格数据（欺诈检测、定价、排名）方面，这些方法通常击败深度学习并赢得大多数 Kaggle 竞赛。

技术洞察

在梯度增强中，您从粗略的预测开始，并重复向残差添加一个小树拟合——损失相对于当前预测的梯度。每棵树的贡献都按学习率（收缩）进行缩放，因此模型会小步改进。由于如果过度拟合，错误会加剧，因此正则化（树深度限制、子采样行和特征、叶权重的 L1/L2 惩罚）对于防止集成记住噪声至关重要。

掌握集成方法和梯度提升

为了加深理解，请将集成方法和梯度提升视为一种操作模型，而不是单个功能。定义期望的结果，澄清假设，并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中，使用集成方法和梯度提升的强大团队首先构建强大的概念模型，然后将这些模型映射到实际的生产约束。他们记录明确的成功标准，根据实际数据和工作流程进行测试，并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

它可以帮助您将清晰的技术声明与营销语言分开。同时，不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。最具弹性的方法是将实验速度与治理规则结合起来：运行试点、捕获证据、发布决策日志，并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

它可以帮助您将清晰的技术声明与营销语言分开。

它可以帮助您将清晰的技术声明与营销语言分开。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

在花费金钱或时间之前，您可以提出更好的实施问题。

在花费金钱或时间之前，您可以提出更好的实施问题。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

具有共同理解的团队可以做出更好的产品、政策和学习决策。

具有共同理解的团队可以做出更好的产品、政策和学习决策。在高质量部署中，这会转化为可衡量的操作规则、所有权边界和定期审查仪式，以便团队可以增强信心，而不是扩大模糊性。

集成方法和梯度提升的未来

梯度增强树仍然是表格数据的默认设置，并且没有显示出被废黜的迹象，即使深度学习在其他地方取得了进展。预计速度和 GPU 加速将持续提升，对分类数据和缺失数据进行更好的本机处理，并与自动化机器学习 (AutoML) 管道进行更紧密的集成。将 boosting 与神经网络相结合以及更快、更容易解释的变体的研究正在进行中。对于从业者来说，提升库将仍然是解决电子表格问题的可靠、高精度的首选。

现实世界的实施

银行和支付处理商使用 XGBoost 根据金额、位置和时间等表格特征来标记欺诈交易。

搜索引擎和在线商店使用梯度提升的“学习排名”模型对结果进行排名。

保险和贷款公司根据结构化客户数据预测风险并设定价格。

Kaggle 参赛者通过将 LightGBM 和 CatBoost 模型堆叠在一起赢得了表格数据竞赛。

实施模式

集成方法和梯度提升的实践

银行和支付处理商使用 XGBoost 根据金额、位置和时间等表格特征来标记欺诈交易。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

集成方法和梯度提升的实践

搜索引擎和在线商店使用梯度提升的“学习排名”模型对结果进行排名。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

集成方法和梯度提升的实践

保险和贷款公司根据结构化客户数据预测风险并设定价格。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

集成方法和梯度提升的实践

Kaggle 参赛者通过将 LightGBM 和 CatBoost 模型堆叠在一起赢得了表格数据竞赛。

当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时，通常会获得更好的结果。

风险与防护栏

不同的团队可能会以不同的方式使用同一术语，因此请尽早定义范围。

基准测试可能看起来很强大，但实际性能却参差不齐。

忽视数据质量和评估计划通常会产生脆弱的结果。

实施路线图

从您需要的结果的简单语言定义开始。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

在测试之前选择一种成功指标和一种失败条件。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

使用代表性数据运行小型试点，而不是完善的演示集。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

记录集成方法和梯度提升在哪些方面有帮助以及在哪些方面更简单的方法更好。

将此视为证据门：如果不满足标准，则暂停推出，缩小差距，然后再扩大使用。

不断探索

什么是人工智能？

在深入研究之前先了解基本概念。

阅读指南

人工智能如何学习

了解现代系统背后的培训过程。

阅读指南

Check your understanding

Test yourself: take the Ensemble Methods and Gradient Boosting quiz

Start quiz →

集成方法和梯度提升

概述

深入探讨

技术洞察

掌握集成方法和梯度提升

战略影响

集成方法和梯度提升的未来

现实世界的实施

实施模式

集成方法和梯度提升的实践

集成方法和梯度提升的实践

集成方法和梯度提升的实践

集成方法和梯度提升的实践

风险与防护栏

实施路线图

不断探索

什么是人工智能？

人工智能如何学习

Related guides