当前位置：首页 > news >正文

机器学习——集成学习

news 2026/2/9 6:37:30

引言

集成学习：让机器学习效果更好，单个不行，群殴走起。

分类

1. Bagging:训练多个分类器取平均（m代表树的个数）。

2.Boosting（提升算法）:从弱学习器开始加，通过加权来进行训练。（它与上面的不同在于它不是随机几颗树取平均，而是加入一棵树要比原来强）

3.Stacking：聚合多个分类或回归模型（可以分阶段来做）

介绍

Bagging全称（bootstrap aggregation）在其算法中训练每一棵树之间是没有影响的，说白了就是并行训练一堆分类器。

典型代表随机森林：随机代表数据采样随机，特征选择随机，为了避免重复，但算法已经固定为了增加多样性则就是数据的采样要随机。森林代表很多个决策树并行放在一起。

随机森林中分类和回归的做法：

在做分类任务的时候两个类别被分为A一个被分为B，那么则选择少数服从多数最后类别为A。

在做回归任务的时候分别为100、200、300，则最终结果为（100+200+300）/3

随机森林的优点：

1.可解释性强，便于分析。（对于神经网络、深度学习都是黑盒子，我们只能得到输入和输出内部很复杂看不到。）

2.在训练结束，它能够给出特征重要型排序，如下图：

3.并行化方法，速度快

软投票和硬投票

一、硬投票：直接用类别值，少数服从多数

（1）准备数据并且可视化

%matplotlib inline
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_moons
X,y=make_moons(n_samples=500,noise=0.30,random_state=42)
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=42)
plt.plot(X[:,0][y==0],X[:,1][y==0],'yo',alpha=0.6)#alpha 代表透明程度
plt.plot(X[:,0][y==0],X[:,1][y==1],'bs',alpha=0.6)

结果如图所示：

（2）硬投票

from sklearn.ensemble import RandomForestClassifier,VotingClassifier #随机森林和投票器
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
#进行实例化
log_clf=LogisticRegression()
rnd_clf=RandomForestClassifier()
svm_clf=SVC()
voting_clf=VotingClassifier(estimators=[('lr',log_clf),('rf',rnd_clf),('svc',svm_clf)],voting='hard')
voting_clf.fit(X_train,y_train)

（3）模型评价

from sklearn.metrics import accuracy_score
for clf in (log_clf,rnd_clf,svm_clf,voting_clf):clf.fit(X_train,y_train)y_pred=clf.predict(X_test)print(clf.__class__.__name__,accuracy_score(y_test,y_pred))

结果如下：

二、软投票：各自分类器的概率值进行加权平均

数据不变，只需要将上面代码进行修改。代码如下：

from sklearn.ensemble import RandomForestClassifier,VotingClassifier #随机森林和投票器
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
#进行实例化
log_clf=LogisticRegression()
rnd_clf=RandomForestClassifier()
svm_clf=SVC(probability=True)
voting_clf=VotingClassifier(estimators=[('lr',log_clf),('rf',rnd_clf),('svc',svm_clf)],voting='soft')
voting_clf.fit(X_train,y_train)
from sklearn.metrics import accuracy_score
for clf in (log_clf,rnd_clf,svm_clf,voting_clf):clf.fit(X_train,y_train)y_pred=clf.predict(X_test)print(clf.__class__.__name__,accuracy_score(y_test,y_pred))

模型评价结果如图：

明显比上一个效果好。

机器学习——集成学习

引言集成学习：让机器学习效果更好，单个不行，群殴走起。分类 1. Bagging:训练多个分类器取平均（m代表树的个数）。 2.Boosting（提升算法）:从弱学习器开始加，通过加权来进行训练。…...

编程日记 2023/2/27 14:54:46

VS编译系统实用调试技巧

目录什么是bug?调试是什么？有多重要？debug和release的介绍windows环境调试介绍、一些调试实例如何写出（易于调试）的代码编程常见的错误什么是bug?其实bug在英文翻译中有表示臭虫的含义，因为第一次被发现的导致计算机…...

编程日记 2023/2/27 14:53:39

【华为OD机试模拟题】用 C++ 实现 - GPU 调度（2023.Q1）

最近更新的博客【华为OD机试模拟题】用 C++ 实现 - 去重求和（2023.Q1）文章目录最近更新的博客使用说明GPU 调度题目输入输出示例一输入输出说明示例二输入输出说明Code使用说明参加华为od机试，一定要注意不要完全背诵代码，需要理解之后模仿写出，通过率才会高。...

编程日记 2023/2/27 14:52:34

腾讯前端必会react面试题合集

React-Router的路由有几种模式？ React-Router 支持使用 hash（对应 HashRouter）和 browser（对应 BrowserRouter） 两种路由规则， react-router-dom 提供了 BrowserRouter 和 HashRouter 两个组件来实现应用的…...

编程日记 2023/2/27 14:51:24

Linux搭建SVN服务器，并内网穿透实现公网远程访问

文章目录1. Ubuntu安装SVN服务2. 修改配置文件2.1 修改svnserve.conf文件2.2 修改passwd文件2.3 修改authz文件3. 启动svn服务4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射本地端口5. 测试公网访问6. 配置固定公网TCP端口地址6.1 保留一个固定的公网TCP端口地址6.2 配置…...

编程日记 2023/2/27 14:50:17

目录一.list准备二. iterator迭代器 1._list_iterator 2.begin()、end() 3.const_begin()、const_end() 4.!&& 5. && -- 6.operator* 7.operator-> 三.Modify(修改) 1.insert() 2.erase() 3.push_back() && push_front() 4.pop_bac…...

编程日记 2023/2/27 14:49:12

为什么硬件性能监控很重要

当今的混合网络环境平衡了分布式网络和现代技术的实施。但它们并不缺少一个核心组件：服务器。保持网络正常运行时间归结为监控和管理导致网络停机的因素。极有可能导致性能异常的此类因素之一是硬件。使用硬件监控器监控网络硬件已成为一项关键需求。硬件监视器是…...

编程日记 2023/2/27 14:48:05

HTTP缓存

HTTP缓存HTTP缓存引发的一个问题HTTP缓存的作用HTTP缓存的分类强制缓存协商缓存（解决强缓存下资源不更新问题）缓存策略HTTP缓存引发的一个问题有一次在开发移动端H5项目，UI提了几个UI问题，经过样式调试，android上没有…...

编程日记 2023/2/27 14:46:58

SPI设备树处理过程

SPI设备树处理过程文章目录SPI设备树处理过程参考资料：一、 spi_device结构体二、 SPI设备树格式2.1 SPI Master2.2 SPI Device2.3 设备树示例三、设备树实例3.1 使用GPIO模拟的SPI控制器3.2 IMX6ULL SPI控制器四、设备树处理过程致谢参考资料： 内核头…...

编程日记 2023/2/27 14:45:44

数据有哪些重要的作用？

我们正处在科技高速发展的时代，如今互联网已经与我们的生活息息相关，我们每天在互联网产生大量的数据，这些数据散落在网络中看似没有怎么作用，但是这些数据经过系统的处理整合起来确实非常有价值的。一、发展大数据技术可以提高…...

编程日记 2023/2/27 14:44:37

spring面试题总结

1、spring是什么？ spring是一个轻量级IOC和AOP容器框架，是为Java应用程序提供基础性服务的一套框架，目的是用于简化企业应用的开发，开发者只需要关注业务需求即可： core container 容器组件 spring context&#xff0c…...

编程日记 2023/2/27 14:43:29

使用MUI与H5+构建移动端app

前言通过mui构建APP 效果图： <!DOCTYPE html> <html> <head><meta charset...

编程日记 2023/2/27 14:42:22

第17篇：Java变量总结

目录 1.变量的概念 1.1 变量来源 1.2 计算机中的变量 1.3 变量如何在内存中存储 2.Java变量...

编程日记 2023/2/27 14:41:12

使用51单片机的GPIO输出占空比可调节的PWM波

一、前言在一些单片机或微控制器中，通用GPIO可以被配置为产生PWM信号。PWM即脉冲宽度调制，是一种用于模拟输出的技术。它可以通过改变输出信号的脉冲宽度来控制电路中的电平，从而实现对电路的控制。二、什么是PWM波？ PWM波&a…...

编程日记 2023/2/27 14:40:06

从产品经理的角度如何提升项目的交付质量？

提高交付质量 ，对于每个IT公司都是永恒的话题。交付质量其实包含2重意义， 一是交付的高质量（客户角度），即客户的满意度；二是高质量的交付（交付团队的角度），这里是指如何…...

编程日记 2023/2/27 14:37:56

JavaScript BOM【快速掌握知识点】

目录 Window对象的常用属性语法： Window对象的常用方法语法： open()和close()方法 History对象常用属性和方法示例 Location对象常用属性常用方法 Document对象的常用方法定时函数超时调用：setTimeout() 间歇调用&…...

编程日记 2023/2/27 14:36:50

【算法】哈希表

作者：指针不指南吗专栏：算法篇 🐾或许会很慢，但是不可以停下来🐾 文章目录1.定义2.优点3.数字哈希3.1拉链法3.2开放寻址法3.3 例题4.字符串哈希1.定义哈希表（Hash table），是根据键…...

编程日记 2023/2/27 14:35:41

彻底搞懂React-hook链表构建原理

写在前面的小结每一个 hook 函数都有对应的 hook 对象保存状态信息useContext是唯一一个不需要添加到 hook 链表的 hook 函数只有 useEffect、useLayoutEffect 以及 useImperativeHandle 这三个 hook 具有副作用，在 render 阶段需要给函数组件 fiber 添加对应的副…...

编程日记 2023/2/27 14:34:33

【数据挖掘实战】——应用系统负载分析与容量预测(ARIMA模型)

项目地址：Datamining_project: 数据挖掘实战项目代码目录一、背景和挖掘目标 1、问题背景 2、传统方法的不足 2、原始数据 3、挖掘目标二、分析方法与过程 1、初步分析 2、总体流程第一步：数据抽取第二步：探索分析第三步&a…...

编程日记 2023/2/27 14:33:24

【华为OD机试模拟题】用 C++ 实现 - 九宫格按键输入（2023.Q1）

最近更新的博客【华为OD机试模拟题】用 C++ 实现 - 去重求和（2023.Q1）文章目录最近更新的博客使用说明九宫格按键输入题目输入输出示例一输入输出说明示例二输入输出说明Code使用说明参加华为od机试，一定要注意不要完全背诵代码，需要理解之后模仿写出，通过率才会高…...

编程日记 2023/2/27 14:32:17

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

大家好，欢迎来到《云原生核心技术》系列的第七篇！ 在上一篇，我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在，我们就像一个拥有了一块崭新数字土地的农场主，是时…...

编程新知 2025/12/14 22:32:59

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

下面是一个完整的 Android 实现，展示如何创建和管理多个 OkHttpClient 实例，分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...

编程新知 2025/12/15 1:34:37

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中，我们会遇到使用 java 调用 dll文件的情况，此时大概率出现UnsatisfiedLinkError链接错误，原因可能有如下几种类名错误包名错误方法名参数错误使用 JNI 协议调用，结果 dll 未实现 JNI 协…...

编程新知 2025/10/6 16:38:04

深入理解JavaScript设计模式之单例模式

目录什么是单例模式为什么需要单例模式常见应用场景包括单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量惰性单例通用的惰性单例结语什么是单例模式单例模式（Singleton Pattern&#…...

编程新知 2026/1/31 17:09:43

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2026/1/25 9:08:41

算法笔记2

1.字符串拼接最好用StringBuilder，不用String 2.创建List<>类型的数组并创建内存 List arr[] new ArrayList[26]; Arrays.setAll(arr, i -> new ArrayList<>()); 3.去掉首尾空格...

编程新知 2026/1/27 12:17:05

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统实现kefu123登录，不允许匿名访问，kefu只能访问/data/kefu目录，不能查看其他目录创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...

编程新知 2026/1/25 9:03:19

CSS | transition 和 transform的用处和区别

省流总结： transform用于变换/变形，transition是动画控制器 transform 用来对元素进行变形，常见的操作如下，它是立即生效的样式变形属性。旋转 rotate(角度deg)、平移 translateX(像素px)、缩放 scale(倍数)、倾斜 skewX(角度…...

编程新知 2025/10/17 20:59:57

基于Springboot+Vue的办公管理系统

角色： 管理员、员工技术： 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能： 该办公管理系统是一个综合性的企业内部管理平台，旨在提升企业运营效率和员工管理水…...

编程新知 2026/1/31 8:55:37

Unity UGUI Button事件流程

场景结构测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...

编程新知 2026/2/1 14:51:21

机器学习——集成学习

引言

分类

介绍

软投票和硬投票

一、硬投票：直接用类别值，少数服从多数

二、软投票：各自分类器的概率值进行加权平均

相关文章：

机器学习——集成学习

VS编译系统实用调试技巧

【华为OD机试模拟题】用 C++ 实现 - GPU 调度（2023.Q1）

腾讯前端必会react面试题合集

Linux搭建SVN服务器，并内网穿透实现公网远程访问

C++STL之list的模拟实现

为什么硬件性能监控很重要

HTTP缓存

SPI设备树处理过程

数据有哪些重要的作用？

spring面试题总结

使用MUI与H5+构建移动端app

第17篇：Java变量总结

使用51单片机的GPIO输出占空比可调节的PWM波

从产品经理的角度如何提升项目的交付质量？

JavaScript BOM【快速掌握知识点】

【算法】哈希表

彻底搞懂React-hook链表构建原理

【数据挖掘实战】——应用系统负载分析与容量预测(ARIMA模型)

【华为OD机试模拟题】用 C++ 实现 - 九宫格按键输入（2023.Q1）

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

深入理解JavaScript设计模式之单例模式

Swagger和OpenApi的前世今生

算法笔记2

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

CSS | transition 和 transform的用处和区别

基于Springboot+Vue的办公管理系统

Unity UGUI Button事件流程