当前位置：首页 > news >正文

《XGBoost算法的原理推导》12-14决策树复杂度的正则化项公式解析

news 2026/2/8 20:44:19

本文是将文章《XGBoost算法的原理推导》中的公式单独拿出来做一个详细的解析，便于初学者更好的理解。

我们定义一颗树的复杂度 $Ω$ ，它由两部分组成：

叶子结点的数量；
叶子结点权重向量的 $L 2$ 范数；

公式(12-14)是：

$\Omega(f_t) = \gamma T + \frac{1}{2} \lambda \sum_{j=1}^{T} w_j^2$

是在 XGBoost 中用于正则化的公式，它描述了第 $t$ 轮生成的树 $f_t$ 的复杂度惩罚项。XGBoost 的正则化项通过控制树的复杂度来防止过拟合，从而提高模型的泛化能力。

公式中的符号解释

$\Omega(f_t)$ ：表示第 $t$ 轮生成的树 $f_t$ 的正则化项，作为模型复杂度的惩罚。XGBoost 的目标函数包含损失项和正则化项，正则化项的目的是控制树的复杂度。
$T$ ：树的叶子节点总数。树的复杂度通常与叶子节点数量直接相关，更多的叶子节点通常意味着更复杂的树结构。
$\gamma$ ：控制叶子节点数的正则化参数。它决定了树的叶子节点数对模型复杂度的影响。较大的 $\gamma$ 值会增加每增加一个叶子节点的成本，从而限制树的生长。
$w_j$ ：第 $j$ 个叶子节点的权重值。每个叶子节点都有一个预测值（权重），用于预测所有落入该节点的样本的值。
$\lambda$ ：控制叶子节点权重大小的正则化参数。它用于限制叶子节点权重的大小，防止权重过大导致模型对训练数据的过拟合。

公式的分解与理解

公式可以分为两个部分：

第一部分：叶子节点数量惩罚项

$\gamma T$

这一部分表示树中叶子节点数量的惩罚， $\gamma$ 是正则化参数，控制每增加一个叶子节点的复杂度成本。
树的叶子节点越多，模型的表达能力越强，但也更容易出现过拟合。因此，通过增加叶子节点的成本，XGBoost 可以有效地限制树的复杂度。
较大的 $\gamma$ 值会让树的叶子节点数量减少，从而使模型更加简单，增强泛化能力。

第二部分：叶子节点权重惩罚项

$\frac{1}{2} \lambda \sum_{j=1}^{T} w_j^2$

这一部分是对叶子节点权重的正则化，通过惩罚权重的平方和来限制权重的大小。
$\lambda$ 是控制权重大小的正则化参数。较大的 $\lambda$ 值会对权重 $w_j$ 施加更大的惩罚，从而抑制每个叶子节点的输出值。
权重 $w_j$ 的平方和表示所有叶子节点的权重复杂度。通过限制权重的大小，XGBoost 可以防止某些叶子节点权重过大，以避免模型对训练样本的过拟合。

正则化项的作用

防止过拟合：正则化项通过限制叶子节点数量 $T$ 和叶子节点权重 $w_j$ 的大小，来控制树的复杂度，从而减少模型的过拟合风险。
增强泛化能力：通过控制模型的复杂度，XGBoost 可以更好地在新数据上表现。正则化项让模型不再过于依赖训练数据中的特定模式，而是更关注数据的整体结构。
控制模型复杂度： $\gamma$ 和 $\lambda$ 参数为用户提供了控制模型复杂度的手段，用户可以通过调整这两个超参数，来选择合适的树结构和节点权重，找到泛化能力和训练精度之间的最佳平衡。

总结

公式(12-14)

$\Omega(f_t) = \gamma T + \frac{1}{2} \lambda \sum_{j=1}^{T} w_j^2$

是 XGBoost 的正则化项，用于控制树的复杂度。第一部分 $\gamma T$ 惩罚树的叶子节点数量，防止模型过于复杂；第二部分 $\frac{1}{2} \lambda \sum_{j=1}^{T} w_j^2$ 惩罚叶子节点权重的大小，防止某些节点权重过大而导致的过拟合。通过正则化项，XGBoost 可以有效地控制模型的复杂度，从而在训练精度和泛化能力之间取得平衡。

《XGBoost算法的原理推导》12-14决策树复杂度的正则化项公式解析

本文是将文章《XGBoost算法的原理推导》中的公式单独拿出来做一个详细的解析，便于初学者更好的理解。我们定义一颗树的复杂度 Ω Ω Ω，它由两部分组成： 叶子结点的数量；叶子结点权重向量的 L 2 L2 L2范数； 公式(…...

编程日记 2024/11/12 12:01:11

昇思大模型平台打卡体验活动：项目4基于MindSpore实现Roberta模型Prompt Tuning

基于MindNLP的Roberta模型Prompt Tuning 本文档介绍了如何基于MindNLP进行Roberta模型的Prompt Tuning，主要用于GLUE基准数据集的微调。本文提供了完整的代码示例以及详细的步骤说明，便于理解和复现实验。环境配置在运行此代码前，请确保…...

编程日记 2024/11/12 12:00:10

hadoop 3.x 伪分布式搭建

hadoop 伪分布式搭建环境 CentOS 7jdk 1.8hadoop 3.3.6 1. 准备准备环境所需包上传所有压缩包到服务器 2. 安装jdk # 解压jdk到/usr/local目录下 tar -xvf jdk-8u431-linux-x64.tar.gz -C /usr/local先不着急配置java环境变量，后面和hadoop一起配置 3. 安装had…...

编程日记 2024/11/12 11:57:07

springboot 整合mybatis

一，引入MyBatis起步依赖 <dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>3.0.0</version></dependency> 二&a…...

编程日记 2024/11/12 11:55:05

餐饮门店收银系统源码、php收银系统源码

1. 系统开发语言核心开发语言: PHP、HTML5、Dart后台接口: PHP7.3后台管理网站: HTML5vue2.0element-uicssjs线下收银台（安卓/PC收银、安卓自助收银）: Dart3框架：Flutter 3.19.6移动店务助手: uniapp线上商城: uniapp 2.系统概况及适用行业…...

编程日记 2024/11/12 11:51:00

canal1.1.7使用canal-adapter进行mysql同步数据

重要的事情说前面，canal1.1.8需要jdk11以上，大家自行选择，我这由于项目原因只能使用1.1.7兼容版的文章参考地址： canal 使用详解_canal使用-CSDN博客使用canal.deployer-1.1.7和canal.adapter-1.1.7实现mysql数据同步_mysql更…...

编程日记 2024/11/12 11:47:57

揭秘文心一言，智能助手新体验

一、产品描述文心一言是一款集先进人工智能技术与自然语言处理能力于一体的智能助手软件。它采用了深度学习算法和大规模语料库训练，具备强大的语义理解和生成能力。通过简洁直观的用户界面，文心一言能够与用户进行流畅的对话交流，理解用户…...

编程日记 2024/11/12 11:45:53

良心无广，这5款才是你电脑上该装的神仙软件，很多人都不知道

图吧工具箱这是一款完全纯净的硬件检测工具包，体积小巧不足0.5MB，却全面整合了CPU、硬盘、内存、显卡等电脑大神常用的检测工具与压力测试软件。还特别为游戏爱好者们准备了直达平台官网的链接以及Directx修复工具，而且全部免费哦&#xf…...

编程日记 2024/11/12 11:43:51

Scala图书馆创建图书信息

图书馆书籍管理系统相关的练习。内容要求： 1.创建一个可变 Set，用于存储图书馆中的书籍信息（假设书籍信息用字符串表示，如 “Java 编程思想”“Scala 实战” 等），初始化为包含几本你喜欢的书籍。 2.添加两本…...

编程日记 2024/11/12 11:42:50

【Python】深入理解Python中的单例模式：用元类、装饰器和模块实现高效的单例设计

解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！单例模式是一种重要的设计模式，旨在确保一个类的实例在整个应用程序中仅存在一个。Python作为一种动态语言，为实现单例模式提供了多种方式…...

编程日记 2024/11/12 11:41:48

Flutter 小技巧之 Shader 实现酷炫的粒子动画

在之前的《不一样的思路实现炫酷 3D 翻页折叠动画》我们其实介绍过：如何使用 Shader 去实现一个 3D 的翻页效果，具体就是使用 Flutter 在 3.7 开始提供 Fragment Shader API ，因为每个像素都会过 Fragment Shader ，所以我们可以通…...

编程日记 2024/11/12 11:40:47

【LeetCode】【算法】42. 接雨水

LeetCode 42. 接雨水题目描述给定 n 个非负整数表示每个宽度为 1 的柱子的高度图，计算按此排列的柱子，下雨之后能接多少雨水。示例： 输入：height [0,1,0,2,1,0,1,3,2,1,2,1] 输出：6 解释：上面是由数…...

编程日记 2024/11/12 11:36:42

深⼊理解指针(5)[回调函数、qsort相关知识（qsort可用于各种类型变量的排序）】

目录 1. 回调函数 2. qsort相关知识（qsort可用于各种类型变量的排序） 一回调函数 1定义/作用:把函数的指针（地址）作为参数传递给另⼀个函数，当这个指针被⽤来调⽤其所指向的函数时，被调⽤的函数就…...

编程日记 2024/11/12 11:35:41

qt QRunnable 与 QThreadPool详解

1. 概述 QRunnable是所有runnable对象的基类，它表示一个任务或要执行的代码。开发者需要子类化QRunnable并重写其run()函数来实现具体的任务逻辑。而QThreadPool则是一个管理QThread集合的类，它帮助减少创建线程的成本，通过管理和循环使用单…...

编程日记 2024/11/12 11:29:36

博客摘录「 java三年工作经验面试题整理《精华》」2023年6月12日

JDK 和 JRE 有什么区别？JDK：java 开发工具包，提供了 java 的开发环境和运行环境。JRE：java 运行环境，为 java 的运行提供了所需环境。JDK 其实包含了 JRE，同时还包含了编译 java 源码的编译器 javac&#x…...

编程日记 2024/11/12 11:28:34

福禄克FLUKE5500A与fluke5520a校准仪的区别功能

FLUKE5500A是美国福禄克公司的一款高性能的多功能校准仪，能够对手持式和台式多用表、示波器、示波表、功率计、电子温度表、数据采集器、功率谐波分析仪、进程校准器等多种仪器进行校准。 FLUKE5500A多功能校准仪供给了GPIB（IEEE-488）、RS-2…...

编程日记 2024/11/12 11:21:27

量化交易系统开发-实时行情自动化交易-2.技术栈

2019年创业做过一年的量化交易但没有成功，作为交易系统的开发人员积累了一些经验，最近想重新研究交易系统，一边整理一边写出来一些思考供大家参考，也希望跟做量化的朋友有更多的交流和合作。本篇谈谈系统主要可以选择的技术栈&a…...

编程日记 2024/11/12 11:20:25

【逆向爬虫实战】--全方位分析+某某学堂登录(DES加密)

🤵‍♂️ 个人主页：rain雨雨编程 😄微信公众号：rain雨雨编程 ✍🏻作者简介：持续分享机器学习，爬虫，数据分析 🐋 希望大家多多支持，我们一起进步！ …...

编程日记 2024/11/12 11:17:22

第2关：装载问题 (最优队列法)

问题描述任务描述相关知识编程要求测试说明问题描述有一批共个集装箱要装上 2 艘载重量分别为 C1 和 C2 的轮船，其中集装箱i的重量为 Wi ，且装载问题要求确定是否有一个合理的装载方案可将这个集装箱装上这 2 艘轮船。如果有，找出一种…...

编程日记 2024/11/12 11:13:16

萤石设备视频接入平台EasyCVR海康私有化视频平台监控硬盘和普通硬盘有何区别？

在现代安防监控领域，对于数据存储和视频处理的需求日益增长，特别是在需要长时间、高稳定性监控的环境中，选择合适的存储设备和监控系统显得尤为重要。本文将深入探讨监控硬盘与普通硬盘的区别，并详细介绍海康私有化视频平台EasyCV…...

编程日记 2024/11/12 11:10:11

React Native 导航系统实战（React Navigation）

导航系统实战（React Navigation） React Navigation 是 React Native 应用中最常用的导航库之一，它提供了多种导航模式，如堆栈导航（Stack Navigator）、标签导航（Tab Navigator）和抽屉…...

编程新知 2025/10/15 5:04:46

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2026/1/21 18:20:51

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用，可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器，能够帮助开发者更好地管理复杂的依赖关系，而 GraphQL 则是一种用于 API 的查询语言，能够提…...

编程新知 2025/12/31 8:38:23

Qwen3-Embedding-0.6B深度解析：多语言语义检索的轻量级利器

第一章引言：语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进在人工智能领域，文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量，支撑着搜索引擎、推荐系统、…...

编程新知 2025/11/6 8:47:31

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（一）

宇树机器人多姿态起立控制强化学习框架论文解析论文解读：交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（一） 论文解读：交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化…...

编程新知 2025/8/27 0:58:09

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2026/2/2 2:49:11

ABAP设计模式之---“简单设计原则(Simple Design)”

“Simple Design”（简单设计）是软件开发中的一个重要理念，倡导以最简单的方式实现软件功能，以确保代码清晰易懂、易维护，并在项目需求变化时能够快速适应。其核心目标是避免复杂和过度设计，遵循“让事情保…...

编程新知 2026/1/27 18:13:23

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit（传感器服务）# 前言在运动类应用中，运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据，如配速、距离、卡路里消耗等，用户可以更清晰…...

编程新知 2026/2/2 7:49:59

【Elasticsearch】Elasticsearch 在大数据生态圈的地位实践经验

Elasticsearch 在大数据生态圈的地位 & 实践经验 1.Elasticsearch 的优势1.1 Elasticsearch 解决的核心问题1.1.1 传统方案的短板1.1.2 Elasticsearch 的解决方案 1.2 与大数据组件的对比优势1.3 关键优势技术支撑1.4 Elasticsearch 的竞品1.4.1 全文搜索领域1.4.2 日志分析…...

编程新知 2025/11/9 21:54:26

raid存储技术

1. 存储技术概念数据存储架构是对数据存储方式、存储设备及相关组件的组织和规划，涵盖存储系统的布局、数据存储策略等，它明确数据如何存储、管理与访问，为数据的安全、高效使用提供支撑。由计算机中一组存储设备、控制部件和管理信息调度的…...

编程新知 2025/12/15 13:40:52

公式中的符号解释

公式的分解与理解

第一部分：叶子节点数量惩罚项

第二部分：叶子节点权重惩罚项

正则化项的作用

总结

相关文章：