当前位置：首页 > news >正文

《XGBoost算法的原理推导》12-2 t轮迭代中对样本i的预测值公式解析

news 2026/5/14 9:03:45

本文是将文章《XGBoost算法的原理推导》中的公式单独拿出来做一个详细的解析，便于初学者更好的理解。

好的，公式(12-2)表示的是 XGBoost 在第 $t$ 轮迭代中对样本 $i$ 的预测值。它说明了在第 $t$ 轮迭代中，模型的预测是通过累加之前所有树的输出值，再加上当前新树的输出得到的。这是 XGBoost 的梯度提升过程的核心之一。让我们一步步解析这个公式的含义和其背后的思想。

公式的结构

$\hat{y}_i^{(t)} = \sum_{k=1}^{t-1} f_k(x_i) + f_t(x_i) \tag{12-2}$

公式中的符号和含义

$\hat{y}_i^{(t)}$ ：
- 表示第 $t$ 轮迭代时，模型对第 $i$ 个样本的预测值。
- 这是当前模型对样本 $i$ 的最新预测，经过前 $t$ 轮迭代的累加优化。
$\sum_{k=1}^{t-1} f_k(x_i)$ ：
- 这是前 $t - 1$ 轮的累加预测结果。
- 每一轮 $k$ 中生成的树 $f_k$ 都是一个弱学习器，专注于减少前几轮的预测误差。前 $t - 1$ 轮中所有树的预测值的累加，就代表了在第 $t - 1$ 轮迭代完成后，模型对样本 $i$ 的总预测值。
- 可以把 $\sum_{k=1}^{t-1} f_k(x_i)$ 看作是第 $t - 1$ 轮的预测结果，即 $\hat{y}_i^{(t-1)}$ 。
$f_t(x_i)$ ：
- 表示第 $t$ 轮新生成的树对样本 $i$ 的预测值。
- 这一轮生成的新树 $f_t$ 是基于前 $t - 1$ 轮的残差（预测误差）训练得到的，旨在修正当前模型的预测误差，使得预测结果更接近真实目标值。

公式的意义

公式 $\hat{y}_i^{(t)} = \sum_{k=1}^{t-1} f_k(x_i) + f_t(x_i)$ 体现了梯度提升的思想，即通过逐步迭代来优化模型的预测能力。
在每一轮迭代中，XGBoost 会添加一棵新的树 $f_t$ ，这棵树的目标是尽量拟合前一轮的残差。换句话说，新的树 $f_t$ 是根据前一轮的误差训练的，目的是修正当前模型对样本 $i$ 的预测，使得模型逐渐逼近真实目标值 $y_i$ 。
随着迭代轮数 $t$ 的增加，累加的预测值会越来越接近真实的 $y_i$ ，从而提高模型的整体预测精度。

等价于递推公式

这个公式实际上与递推公式是等价的。我们可以这样写递推公式：

$\hat{y}_i^{(t)} = \hat{y}_i^{(t-1)} + f_t(x_i)$

在这里：

$\hat{y}_i^{(t-1)} = \sum_{k=1}^{t-1} f_k(x_i)$ ，表示前 $t - 1$ 轮的累加预测结果。
因此， $\hat{y}_i^{(t)} = \sum_{k=1}^{t-1} f_k(x_i) + f_t(x_i)$ 是一种更展开的写法。

为什么这样逐步累加是有效的

残差修正：
- 在每一轮中，XGBoost 都会根据之前的残差训练一棵新的树 $f_t$ ，这棵树的输出会帮助减少当前的误差，使得模型的预测越来越接近真实值。
逐步逼近：
- 每次添加的新树只需处理当前的剩余误差，不需要完全重新拟合整个模型。这种逐步修正的方式使得模型能够更精确地捕捉数据的细节，而不会因为一次性拟合复杂模式而导致过拟合。
控制复杂度：
- 这种累加结构也方便了对模型复杂度的控制。因为每次只增加一个新树，XGBoost 可以通过设置最大树数、树的深度等超参数来控制模型的复杂度，从而防止过拟合。

总结

公式(12-2)表示了 XGBoost 在第 $t$ 轮迭代中的预测更新。它说明了模型的预测值是所有之前轮次的树的预测结果之和，加上当前轮次新树的输出。这种逐步累加的方式使得 XGBoost 能够有效地修正误差，逐步逼近真实目标值，从而提升模型的预测精度。

《XGBoost算法的原理推导》12-2 t轮迭代中对样本i的预测值公式解析

公式的结构

公式中的符号和含义

公式的意义

等价于递推公式

为什么这样逐步累加是有效的

总结

相关文章：

《XGBoost算法的原理推导》12-2 t轮迭代中对样本i的预测值公式解析

./bin/mindieservice_daemon启动成功

Linux: network: ip link M-DOWN的具体含义是什么？

Spring中的过滤器和拦截器

leetcode20.括号匹配

Unity性能优化-具体操作

【嵌入式开发——ARM】1ARM架构

Linux中.NET读取excel组件，不会出现The type initializer for ‘Gdip‘ threw an exception异常

mmclassification的配置文件样本

Java基础——类和对象的定义链表的创建，输出

Linux应用项目之量产工具（一）——显示系统

Python小白学习教程从入门到入坑------第二十九课访问模式（语法进阶）

使用 PageHelper 在 Spring Boot 项目中实现分页查询

深度学习-张量相关

电脑提示xinput1_3.dll丢失怎么解决,分享6种有效的解决方法

【计网】数据链路层笔记

蓝牙FTP 协议详解及 Android 实现

【前端】Svelte：动画效果

2024系统架构师--论基于架构的软件设计方法(ABSD)及应用（论文范文）

ORU 的 Open RAN 管理平面 (M 平面)

【光栅和蛇形误差扩散半色调】基于Floyd-Steinberg算法进行误差扩散半色调研究（Matlab代码实现）

初创团队如何利用Taotoken的Token Plan有效控制AI实验成本

LoRA微调工程化2026：从实验到生产的完整落地指南

微机原理课设别头疼！手把手教你用8255和8253芯片搞定电子琴仿真（附Proteus工程和汇编源码）

基于LLM与OpenClaw的智能自动化：构建自然语言驱动的桌面脚本生成器

Doccano自动标注实战：我用它3天搞定了一个NER项目的数据标注

通讯录系统数据库设计与实现

混沌工程实战：使用Roast平台提升分布式系统韧性

Omnara：构建AI智能体统一控制中心，实现人机双向实时协同

台湾科技产业“小即是美”模式：从半导体到AI的敏捷创新网络构建