当前位置：首页 > news >正文

无涯教程-分类算法 - 随机森林

news 2026/5/17 9:57:11

随机森林是一种监督学习算法，可用于分类和回归，但是，它主要用于分类问题，众所周知，森林由树木组成，更多树木意味着更坚固的森林。同样，随机森林算法在数据样本上创建决策树，然后从每个样本中获取预测，最后通过投票选择最佳解决方案。它是一种集成方法，比单个决策树要好，因为它可以通过对输出求平均值来减少过度拟合。

随机森林算法

无涯教程可以通过以下步骤来了解随机森林算法的工作原理-

步骤1 - 首先，从给定的数据集中选择随机样本。
步骤2 - 接下来，该算法将为每个样本构造一个决策树。然后它将从每个决策树中获得预测输出。
步骤3 - 在此步骤中，将对每个预测输出进行投票。
步骤4 - 最后，选择投票最多的预测输出作为最终预测输出。

下图将说明其工作方式-

代码实现

首先，从导入必要的Python包开始-

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

接下来，如下所示从其网络链接下载iris数据集:

path="https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

接下来，需要为数据集分配列名称，如下所示:

headernames=[sepal-length, sepal-width, petal-length, petal-width, Class]

现在，需要将数据集读取为pandas数据框，如下所示:

dataset=pd.read_csv(path, names=headernames)
dataset.head()

	分隔长度	分隔宽度	花瓣长度	花瓣宽度	类
0	5.1	3.5	1.4	0.2	Iris-setosa
1	4.9	3.0	1.4	0.2	Iris-setosa
2	4.7	3.2	1.3	0.2	Iris-setosa
3	4.6	3.1	1.5	0.2	Iris-setosa
4	5.0	3.6	1.4	0.2	Iris-setosa

数据预处理将在以下脚本行的帮助下完成。

X=dataset.iloc[:, :-1].values
y=dataset.iloc[:, 4].values

接下来，无涯教程将数据分为训练和测试拆分。以下代码将数据集分为70％的训练数据和30％的测试数据-

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test=train_test_split(X, y, test_size=0.30)

接下来，借助sklearn的 RandomForestClassifier 类训练模型，如下所示:

from sklearn.ensemble import RandomForestClassifier
classifier=RandomForestClassifier(n_estimators=50)
classifier.fit(X_train, y_train)

最后，需要进行预测。可以在以下脚本的帮助下完成-

y_pred=classifier.predict(X_test)

接下来，按如下所示打印输出-

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
result = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:")
print(result)
result1 = classification_report(y_test, y_pred)
print("Classification Report:",)
print (result1)
result2 = accuracy_score(y_test,y_pred)
print("Accuracy:",result2)

运行上面代码输出

Confusion Matrix:
[[14 0 0][ 0 18 1][ 0 0 12]]
Classification Report:precision   recall   f1-score   supportIris-setosa    1.00     1.00       1.00        14
Iris-versicolor    1.00     0.95       0.97        19Iris-virginica    0.92     1.00       0.96        12micro avg    0.98     0.98        0.98       45macro avg    0.97     0.98        0.98       45weighted avg    0.98     0.98        0.98       45Accuracy: 0.9777777777777777

分类算法 - 随机森林 - 无涯教程网无涯教程网提供随机森林是一种监督学习算法，可用于分类和回归，但是，它主要用于分类问题，众所周知...https://www.learnfk.com/python-machine-learning/machine-learning-with-python-classification-algorithms-random-forest.html

无涯教程-分类算法 - 随机森林

随机森林算法

代码实现

相关文章：

无涯教程-分类算法 - 随机森林

c#常见的排序算法

Redis 持久化和发布订阅

k8s使用ECK（2.4）形式部署elasticsearch+kibana-http协议

[maven]关于pom文件中的＜relativePath＞标签

11. 网络模型保存与读取

新SDK平台下载开源全志V853的SDK

多图详解VSCode搭建Java开发环境

基于JavaWeb和mysql实现网上书城前后端管理系统(源码+数据库+开题报告+论文+答辩技巧+项目功能文档说明+项目运行指导)

Swift创建单例

问道管理：市盈率怎么计算？

Ansible File模块，Ansible File模块详解，文件管理的自动化利器

记录http与mqtt的区别

导入excel数据给前端Echarts实现中国地图-类似热力图可视化

【MySQL系列】MySQL复合查询的学习 _ 多表查询 | 自连接 | 子查询 | 合并查询

微信小程序使用本地图片在真机预览不显示的问题解决

Texlive2023与Texstudio2023卸载与安装（详细全程）

塞浦路斯公司注册塞浦路斯公司开户塞浦路斯公司年审

XSS盲打练习（简单认识反射型、存储型XSS和cookie欺骗）

Shell脚本：基础知识和使用指南

告别串口线！用STM32CubeMX配置USB-CDC虚拟串口，实现与电脑免驱动通信（附Win7驱动安装指南）

深部空间专属孪生，打造密闭硐室独有不可替代透明体系技术白皮书

3步掌握yfinance：从金融数据获取到智能分析的完整指南

Go语言缓存雪崩：防止缓存失效

仅限菲律宾本地团队使用的ElevenLabs隐藏功能：Tagalog重音标记语法（`[ˈba.ka]`）、连读规则注入与敬语语调开关（内测白名单已开放）

从零打造会“看”的电子眼：Teensy与OLED的嵌入式图形与传感器实践

【仅限前200名】Midjourney铂金印相专属Prompt库泄露：含17组经暗房验证的--v 6.2参数矩阵与胶片光谱校准模板

基于RAG与向量数据库的智能信息管理系统（IIMS）架构与实现

嵌入式事件驱动框架Curtroller：模块化设计提升开发效率

3分钟快速上手：ESP32 Arduino开发环境完整配置指南