当前位置：首页 > news >正文

机器学习8：在病马数据集上进行算法比较（ROC曲线与AUC）

news 2026/2/17 12:54:55

ROC曲线与AUC。使用不同的迭代次数（基模型数量）进行 Adaboost 模型训练，并记录每个模型的真阳性率和假阳性率，并绘制每个模型对应的 ROC 曲线，比较模型性能，输出 AUC 值最高的模型的迭代次数和 ROC 曲线。

使用Python的scikit-learn库来训练Adaboost模型，并记录每个模型的真阳性率和假阳性率，并绘制每个模型对应的ROC曲线。然后比较模型性能，并输出AUC值最高的模型的迭代次数和ROC曲线。

下面是一个示例代码，用于在病马数据集上进行Adaboost模型的训练、绘制ROC曲线和计算AUC值：

如果你的是csv文件

import numpy as np
import pandas as pd
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt# 加载数据集，这里假设数据已经存储在名为data的DataFrame中
# 请根据实际情况修改加载数据集的代码
data = pd.read_csv('your_dataset.csv')# 假设数据集中最后一列为标签，其余列为特征
X = data.iloc[:, :-1]
y = data.iloc[:, -1]# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 初始化基模型数量列表和对应的AUC值列表
n_estimators_list = [50, 100, 150, 200]
auc_list = []# 训练Adaboost模型，并计算每个模型的AUC值
for n_estimators in n_estimators_list:ada_model = AdaBoostClassifier(n_estimators=n_estimators, random_state=42)ada_model.fit(X_train, y_train)y_score = ada_model.decision_function(X_test)fpr, tpr, thresholds = roc_curve(y_test, y_score)roc_auc = auc(fpr, tpr)auc_list.append(roc_auc)# 绘制ROC曲线plt.plot(fpr, tpr, label='n_estimators = %d, AUC = %0.2f' % (n_estimators, roc_auc))# 找到AUC值最高的模型的迭代次数
best_n_estimators = n_estimators_list[np.argmax(auc_list)]# 设置图形参数
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve for Adaboost Model')
plt.legend(loc='lower right')
plt.show()# 输出AUC值最高的模型的迭代次数和ROC曲线
print("AUC值最高的模型的迭代次数：", best_n_estimators)

在病马数据集上进行算法比较（ROC曲线与AUC）

使用不同的迭代次数（基模型数量）进行 Adaboost 模型训练，并记录每个模型的真阳性率和假阳性率，并绘制每个模型对应的 ROC 曲线，比较模型性能，输出 AUC 值最高的模型的迭代次数和 ROC 曲线。
计算不同基模型数量下的AUC值，画出“分类器个数-AUC”关系图
讨论：随着弱分类器个数的增加，AUC的值会如何变化？为什么？如果AUC值随着弱分类器的增加而增加，是否表示弱分类器个数越多越好呢？
我们能否根据AUC的曲线图找到最优的弱分类器个数？怎么找？

数据集是horseColicTest.txt和horseColicTraining.txt，不是csv文件

使用不同的迭代次数（基模型数量）进行 Adaboost 模型训练，并记录每个模型的真阳性率和假阳性率，并绘制每个模型对应的 ROC 曲线，比较模型性能，输出 AUC 值最高的模型的迭代次数和 ROC 曲线。

import numpy as np
import pandas as pd
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt# 加载训练集和测试集
train_data = pd.read_csv('horseColicTraining.txt', delimiter='\t', header=None)
test_data = pd.read_csv('horseColicTest.txt', delimiter='\t', header=None)# 假设数据集中最后一列为标签，其余列为特征
X_train = train_data.iloc[:, :-1]
y_train = train_data.iloc[:, -1]
X_test = test_data.iloc[:, :-1]
y_test = test_data.iloc[:, -1]# 初始化基模型数量列表和对应的AUC值列表
n_estimators_list = [50, 100, 150, 200]
auc_list = []# 训练Adaboost模型，并计算每个模型的AUC值
for n_estimators in n_estimators_list:ada_model = AdaBoostClassifier(n_estimators=n_estimators, random_state=42)ada_model.fit(X_train, y_train)y_score = ada_model.decision_function(X_test)fpr, tpr, thresholds = roc_curve(y_test, y_score)roc_auc = auc(fpr, tpr)auc_list.append(roc_auc)# 绘制ROC曲线plt.plot(fpr, tpr, label='n_estimators = %d, AUC = %0.2f' % (n_estimators, roc_auc))# 找到AUC值最高的模型的迭代次数
best_n_estimators = n_estimators_list[np.argmax(auc_list)]# 设置图形参数
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve for Adaboost Model')
plt.legend(loc='lower right')
plt.show()# 输出AUC值最高的模型的迭代次数和ROC曲线
print("AUC值最高的模型的迭代次数：", best_n_estimators)

机器学习8：在病马数据集上进行算法比较（ROC曲线与AUC）

ROC曲线与AUC。使用不同的迭代次数（基模型数量）进行 Adaboost 模型训练，并记录每个模型的真阳性率和假阳性率，并绘制每个模型对应的 ROC 曲线，比较模型性能，输出 AUC 值最高的模型的迭代次数和 ROC 曲线。 …...

编程日记 2023/11/22 16:51:49

70. 爬楼梯 --力扣 --JAVA

题目假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢？ 解题思路通过对爬楼梯进行分解，爬到当前台阶的方式分为两种，即由上一个台阶通过爬1和上两个台阶爬2，同公…...

编程日记 2023/11/22 16:50:47

体感互动游戏VR游戏AR体感游戏软件开发

随着科技的不断发展，体感互动游戏正逐渐成为游戏行业的一个重要趋势。这类游戏通过利用传感器、摄像头和运动控制器等技术，使玩家能够通过身体动作与游戏进行实时互动，极大地提升了娱乐体验。 1. 游戏设计与互动元素体感互动游戏的核心在于…...

编程日记 2023/11/22 16:49:45

计算3个点的6种分布在平面上的占比

假设平面的尺寸是6*6，用11的方式构造2，在用21的方式构造3 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 3 3 3 x 3 3 2 2 2 1 2 2 2 2 2 1 2 2 在平面上有一个点x，11的操作吧平面分成了3部分2a1，2a…...

编程日记 2023/11/22 16:48:44

【香橙派】实战记录1——简介及烧录 Linux 镜像

文章目录一、简介1、参数2、结构3、其他配件4、下载资料二、基于 Windows PC 将 Linux 镜像烧写到 TF 卡的方法1、使用 balenaEtcher 烧录 Linux 镜像的方法2、效果一、简介 Orange Pi Zero 3 香橙派是一款开源的单板卡片电脑， 新一代的arm64开发板，…...

编程日记 2023/11/22 16:47:43

redis之高可用

（一）redis之高可用 1、在集群当中有一个非常重要的指标，提供正常服务的时间的百分比（365天）99.9% 2、redis的高可用的含义更加广泛，正常服务是指标之一，数据容量的扩展、数据的安全性 3、在r…...

编程日记 2023/11/22 16:46:42

使用 Core Tools 在本地开发 Azure Functions

学习模块使用 Core Tools 在本地创建和运行 Azure Functions - Training | Microsoft Learn 文档使用 Core Tools 在本地开发 Azure Functions | Microsoft Learn GitHub - Azure/azure-functions-core-tools: Command line tools for Azure Functions 其它安装适用于 A…...

编程日记 2023/11/22 16:45:41

Java零基础——Spring篇

1.Spring框架的介绍 1.1 传统的项目的架构在传统的项目中，一般遵循MVC开发模型。 (1) view层与用户进行交互，显示数据或者将数据传输给view层。 (2) 在controller层创建service层对象，调用service层中业务方法。 (3) 在service层创建dao…...

编程日记 2023/11/22 16:44:38

jenkins清理缓存命令

def jobName "yi-cloud-operation" //删除的项目名称 def maxNumber 300 // 保留的最小编号，意味着小于该编号的构建都将被删除 Jenkins.instance.getItemByFullName(jobName).builds.findAll { it.number < maxNumber }.each { it.delet…...

编程日记 2023/11/22 16:43:37

什么是深度学习

一、深度学习的发展历程 1.1 Turing Testing (图灵测试) 图灵测试是人工智能是否真正能够成功的一个标准，“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房…...

编程日记 2023/11/22 16:42:35

数字IC基础：有符号数和无符号数加、减法的Verilog设计

相关阅读数字IC基础https://blog.csdn.net/weixin_45791458/category_12365795.html?spm1001.2014.3001.5482 本文是对数字IC基础：有符号数和无符号数的加减运算一文中的谈到的有符号数加减法的算法进行Verilog实现，有关算法细节请阅读原文&#xff0…...

编程日记 2023/11/22 16:41:34

2023年11月25日(星期六）骑行三家村

2023年11月25日 (星期六) 骑行三家村(赏红杉林），早8:30到9:00， 大观公园门囗集合，9:30准时出发【因迟到者，骑行速度快者，可自行追赶偶遇。】偶遇地点:大观公园门口集合 ，家住东，南…...

编程日记 2023/11/22 16:39:32

.skip() 和 .only() 的使用

.skip() 和 .only() 的使用说明在做自动化测试中，跳过执行某些测试用例，或只运行某些指定的测试用例，这种情况是很常见的Cypress中也提供了这种功能如何跳过测试用例通过describe.skip() 或者 context.skip() 来跳过不需要执行的测试…...

编程日记 2023/11/22 16:37:29

如何证明特征值的几何重数不超过代数重数

设 λ 0 \lambda_0 λ0 是 A A A 的特征值，则 λ 0 \lambda_0 λ0 的代数重数 ≥ \geq ≥ 几何重数证明假设 A A A 的特征值 λ 0 \lambda_0 λ0 对应的特征向量有 q 维，记为 α 1 , . . . , α q \alpha_1, ... , \alpha_q α1,...,…...

编程日记 2023/11/22 16:36:28

Android修行手册-POI操作Excel文档

Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D学习专栏蓝桥系列ChatGPT和AIGC 👉关于作者专注于Android/Unity和各种游戏开发技巧，以及各种资源分…...

编程日记 2023/11/22 16:35:27

浅析教学型数控车床使用案例

教学型数控车床是一种专为教学和培训设计的机床，它具有小型化、高精度和灵活性的特点，可以作为学校和技术学院的培训机器。下面是一个使用案例，以展示教学型数控车床在教学实训中的应用。案例背景： 某职业技术学院的机械工程专业…...

编程日记 2023/11/22 16:34:26

图论 2023.11.20

次短路 P2829 大逃离题意：给定一个无向图，入口1，出口n,求第二短路的值一个节点所直接连接的地方小于k个（起点和终点除外），那么他就不敢进去。 n<5000，m<100000 思路：次短路…...

编程日记 2023/11/22 16:33:25

思福迪运维安全管理系统 test_qrcode_b 远程命令执行漏洞

思福迪运维安全管理系统 test_qrcode_b 远程命令执行漏洞一、漏洞描述二、漏洞影响三、网络测绘四、漏洞复现1.手动复现2.自动化复现3.python源代码免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息或者工具而造成的任…...

编程日记 2023/11/22 16:32:24

electron项目开机自启动

一、效果展示：界面控制是否需要开机自启动二、代码实现： 1、在渲染进程login.html中，画好界面，默认勾选； <div class"intro">开机自启动 <input type"checkbox" id"checkbox&quo…...

编程日记 2023/11/22 16:31:21

2023年约特干故城夜间演艺《万方乐奏有于阗》完美谢幕

11月19日，记者走进约特干故城看到演员在欢乐地跳着刀郎舞和古典舞，庆祝今年以来夜间演艺《万方乐奏有于阗》演出200场完美谢幕。 11月19日在约特干故城，演员正在表演迎宾乐舞。阿卜力克木依卜拉依木摄当天晚上，城楼上旌旗猎猎&am…...

编程日记 2023/11/22 16:29:18

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2026/2/17 8:42:52

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/2/10 4:35:17

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括：采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中，设置任务排序规则尤其重要，因为它让看板视觉上直观地体…...

编程新知 2026/2/12 11:53:42

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能，多端兼容

基于 UniApp + WebSocket实现多端兼容的实时通讯系统，涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能，适配微信小程序、H5、Android、iOS等终端目录技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...

编程新知 2026/1/22 16:15:42

使用分级同态加密防御梯度泄漏

抽象联邦学习 （FL） 支持跨分布式客户端进行协作模型训练，而无需共享原始数据，这使其成为在互联和自动驾驶汽车 （CAV） 等领域保护隐私的机器学习的一种很有前途的方法。然而，最近的研究表明&…...

编程新知 2026/1/24 6:22:43

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架，支持"一次开发，多端部署"，可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务，为旅游应用带来&#xf…...

编程新知 2026/2/5 20:33:43

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用，可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器，能够帮助开发者更好地管理复杂的依赖关系，而 GraphQL 则是一种用于 API 的查询语言，能够提…...

编程新知 2025/12/31 8:38:23

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

编程新知 2025/12/13 4:20:30

从零实现STL哈希容器：unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享希望也能为你带来些帮助~ 那咱们废话不多说，直接开始吧！ 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

编程新知 2026/1/31 12:47:25

【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分

一、项目背景回顾前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。本弹重点聚焦于服务端的模块划分与架构设计，提升代码结构的可维护性与扩展性。二、服务端模块设计目标高内聚低耦合：各模块职责清晰，便于独立开发…...

编程新知 2025/10/13 4:15:41

相关文章：