当前位置：首页 > news >正文

模式识别与机器学习（十）：梯度提升树

news 2026/2/10 2:14:33

1.原理

提升方法实际采用加法模型（即基函数的线性组合）与前向分步算法。以决策树为基函数的提升方法称为提升树（boosting tree）。对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。提升树模型可以表示为决策树的加法模型：
$f_M(x)=\sum_{m=1}^MT(x;\theta_m)$
其中， $T(x;\theta_{m})$ 表示决策树， $\theta_{m}$ 为决策树参数，M为树的个数。
而梯度提升树的具体步骤如下：

1.初始化 $f_{0}(x)=0$ ，并选取损失函数 $\mathrm{~L(y,f(x))}$ ；
2.对于 $\mathrm{m}=0,1,\cdots,\mathrm{M}$

(1).计算负梯度：
$-\mathrm{g_m(x_i)=-\frac{\partial\left(L\bigl(y,f(x_i)\bigr)\right)}{\partial f(x_i)}_{f(x)=f_{m-1}(x)}}$

(2).以负梯度 $-\mathrm{g_{m}(x_{i})}$ 为预测值，训练一个回归树 $T(x;\theta_{m})$ ；

(3).更新 $f_{m}(x)=f_{m-1}(x)+\rho T(x;\theta_{m})$ ；

3.经过M次迭代后取得的模型即为
$f_M(x)=\sum_{m=1}^M\rho T(x;\theta_m)$
这里的 $\rho$ 为学习率，可用来防止过拟合。

此次实验用梯度提升树来实现多分类任务，在这种情况下输出模型经过softmax函数转化为每个类别的置信概率，从而实现分类目标。

2.代码

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 创建梯度提升树分类器
clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0, max_depth=1, random_state=42)# 训练模型
clf.fit(X_train, y_train)# 预测测试集
y_pred = clf.predict(X_test)# 打印预测结果
print(y_pred)

我们使用了鸢尾花数据集，这是一个常用的多类别分类数据集。我们首先加载数据，然后划分为训练集和测试集。然后，我们创建一个梯度提升树分类器，并使用训练集对其进行训练。最后，我们使用训练好的模型对测试集进行预测，并打印出预测结果。

GradientBoostingClassifier的参数n_estimators表示弱学习器的最大数量，learning_rate表示学习率，max_depth表示每个弱学习器（决策树）的最大深度，这些参数都可以根据需要进行调整。

模式识别与机器学习（十）：梯度提升树

1.原理

2.代码

相关文章：

模式识别与机器学习（十）：梯度提升树

《剑指offer》Java版--12.矩阵中的路径（DFS+剪枝）

AI智能体的介绍

Java设计模式-单例模式（Singleton）

若依vue如何展示一个HTML页面(或者展示Markdown文档)

优化for循环（js的问题）

如何更好的去理解源码

c# opencv 获取多边形中心点

Redis数据一致解决方案

安捷伦DSOX2024A示波器

Leetcode算法系列| 4. 寻找两个正序数组的中位数

Java整合APNS推送消息-IOS-APP（基于.p12推送证书）

C语言strcpy函数用法

汽车服务品牌网站建设的作用是什么

【iOS】UICollectionView

Linux poll 和 select 机制

【JVM基础】 JVM 如何加载一个类以及类加载机制

Android Studio使用Genymotion

Mysql sql_mode参数配置

SpringIOC之AbstractMessageSource

stm32G473的flash模式是单bank还是双bank？

ubuntu搭建nfs服务centos挂载访问

C++：std::is_convertible

day52 ResNet18 CBAM

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

苍穹外卖--缓存菜品

【单片机期末】单片机系统设计

Java 加密常用的各种算法及其选择

【git】把本地更改提交远程新分支feature_g

什么是EULA和DPA