机器学习8:在病马数据集上进行算法比较(ROC曲线与AUC)
ROC曲线与AUC。使用不同的迭代次数(基模型数量)进行 Adaboost 模型训练,并记录每个模型的真阳性率和假阳性率,并绘制每个模型对应的 ROC 曲线,比较模型性能,输出 AUC 值最高的模型的迭代次数和 ROC 曲线。
使用Python的scikit-learn库来训练Adaboost模型,并记录每个模型的真阳性率和假阳性率,并绘制每个模型对应的ROC曲线。然后比较模型性能,并输出AUC值最高的模型的迭代次数和ROC曲线。
下面是一个示例代码,用于在病马数据集上进行Adaboost模型的训练、绘制ROC曲线和计算AUC值:
如果你的是csv文件
import numpy as np
import pandas as pd
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt# 加载数据集,这里假设数据已经存储在名为data的DataFrame中
# 请根据实际情况修改加载数据集的代码
data = pd.read_csv('your_dataset.csv')# 假设数据集中最后一列为标签,其余列为特征
X = data.iloc[:, :-1]
y = data.iloc[:, -1]# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 初始化基模型数量列表和对应的AUC值列表
n_estimators_list = [50, 100, 150, 200]
auc_list = []# 训练Adaboost模型,并计算每个模型的AUC值
for n_estimators in n_estimators_list:ada_model = AdaBoostClassifier(n_estimators=n_estimators, random_state=42)ada_model.fit(X_train, y_train)y_score = ada_model.decision_function(X_test)fpr, tpr, thresholds = roc_curve(y_test, y_score)roc_auc = auc(fpr, tpr)auc_list.append(roc_auc)# 绘制ROC曲线plt.plot(fpr, tpr, label='n_estimators = %d, AUC = %0.2f' % (n_estimators, roc_auc))# 找到AUC值最高的模型的迭代次数
best_n_estimators = n_estimators_list[np.argmax(auc_list)]# 设置图形参数
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve for Adaboost Model')
plt.legend(loc='lower right')
plt.show()# 输出AUC值最高的模型的迭代次数和ROC曲线
print("AUC值最高的模型的迭代次数:", best_n_estimators)
在病马数据集上进行算法比较(ROC曲线与AUC)
- 使用不同的迭代次数(基模型数量)进行 Adaboost 模型训练,并记录每个模型的真阳性率和假阳性率,并绘制每个模型对应的 ROC 曲线,比较模型性能,输出 AUC 值最高的模型的迭代次数和 ROC 曲线。
- 计算不同基模型数量下的AUC值,画出“分类器个数-AUC”关系图
- 讨论:随着弱分类器个数的增加,AUC的值会如何变化?为什么?如果AUC值随着弱分类器的增加而增加,是否表示弱分类器个数越多越好呢?
- 我们能否根据AUC的曲线图找到最优的弱分类器个数?怎么找?
数据集是horseColicTest.txt和horseColicTraining.txt,不是csv文件
使用不同的迭代次数(基模型数量)进行 Adaboost 模型训练,并记录每个模型的真阳性率和假阳性率,并绘制每个模型对应的 ROC 曲线,比较模型性能,输出 AUC 值最高的模型的迭代次数和 ROC 曲线。
import numpy as np
import pandas as pd
from sklearn.ensemble import AdaBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt# 加载训练集和测试集
train_data = pd.read_csv('horseColicTraining.txt', delimiter='\t', header=None)
test_data = pd.read_csv('horseColicTest.txt', delimiter='\t', header=None)# 假设数据集中最后一列为标签,其余列为特征
X_train = train_data.iloc[:, :-1]
y_train = train_data.iloc[:, -1]
X_test = test_data.iloc[:, :-1]
y_test = test_data.iloc[:, -1]# 初始化基模型数量列表和对应的AUC值列表
n_estimators_list = [50, 100, 150, 200]
auc_list = []# 训练Adaboost模型,并计算每个模型的AUC值
for n_estimators in n_estimators_list:ada_model = AdaBoostClassifier(n_estimators=n_estimators, random_state=42)ada_model.fit(X_train, y_train)y_score = ada_model.decision_function(X_test)fpr, tpr, thresholds = roc_curve(y_test, y_score)roc_auc = auc(fpr, tpr)auc_list.append(roc_auc)# 绘制ROC曲线plt.plot(fpr, tpr, label='n_estimators = %d, AUC = %0.2f' % (n_estimators, roc_auc))# 找到AUC值最高的模型的迭代次数
best_n_estimators = n_estimators_list[np.argmax(auc_list)]# 设置图形参数
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve for Adaboost Model')
plt.legend(loc='lower right')
plt.show()# 输出AUC值最高的模型的迭代次数和ROC曲线
print("AUC值最高的模型的迭代次数:", best_n_estimators)


相关文章:
机器学习8:在病马数据集上进行算法比较(ROC曲线与AUC)
ROC曲线与AUC。使用不同的迭代次数(基模型数量)进行 Adaboost 模型训练,并记录每个模型的真阳性率和假阳性率,并绘制每个模型对应的 ROC 曲线,比较模型性能,输出 AUC 值最高的模型的迭代次数和 ROC 曲线。 …...
70. 爬楼梯 --力扣 --JAVA
题目 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢? 解题思路 通过对爬楼梯进行分解,爬到当前台阶的方式分为两种,即由上一个台阶通过爬1和上两个台阶爬2,同公…...
体感互动游戏VR游戏AR体感游戏软件开发
随着科技的不断发展,体感互动游戏正逐渐成为游戏行业的一个重要趋势。这类游戏通过利用传感器、摄像头和运动控制器等技术,使玩家能够通过身体动作与游戏进行实时互动,极大地提升了娱乐体验。 1. 游戏设计与互动元素 体感互动游戏的核心在于…...
计算3个点的6种分布在平面上的占比
假设平面的尺寸是6*6,用11的方式构造2,在用21的方式构造3 2 2 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2 3 3 3 x 3 3 2 2 2 1 2 2 2 2 2 1 2 2 在平面上有一个点x,11的操作吧平面分成了3部分2a1,2a…...
【香橙派】实战记录1——简介及烧录 Linux 镜像
文章目录 一、简介1、参数2、结构3、其他配件4、下载资料 二、基于 Windows PC 将 Linux 镜像烧写到 TF 卡的方法1、使用 balenaEtcher 烧录 Linux 镜像的方法2、效果 一、简介 Orange Pi Zero 3 香橙派是一款开源的单板卡片电脑, 新一代的arm64开发板,…...
redis之高可用
(一)redis之高可用 1、在集群当中有一个非常重要的指标,提供正常服务的时间的百分比(365天)99.9% 2、redis的高可用的含义更加广泛,正常服务是指标之一,数据容量的扩展、数据的安全性 3、在r…...
使用 Core Tools 在本地开发 Azure Functions
学习模块 使用 Core Tools 在本地创建和运行 Azure Functions - Training | Microsoft Learn 文档 使用 Core Tools 在本地开发 Azure Functions | Microsoft Learn GitHub - Azure/azure-functions-core-tools: Command line tools for Azure Functions 其它 安装适用于 A…...
Java零基础——Spring篇
1.Spring框架的介绍 1.1 传统的项目的架构 在传统的项目中,一般遵循MVC开发模型。 (1) view层与用户进行交互,显示数据或者将数据传输给view层。 (2) 在controller层创建service层对象,调用service层中业务方法。 (3) 在service层创建dao…...
jenkins清理缓存命令
def jobName "yi-cloud-operation" //删除的项目名称 def maxNumber 300 // 保留的最小编号,意味着小于该编号的构建都将被删除 Jenkins.instance.getItemByFullName(jobName).builds.findAll { it.number < maxNumber }.each { it.delet…...
什么是深度学习
一、深度学习的发展历程 1.1 Turing Testing (图灵测试) 图灵测试是人工智能是否真正能够成功的一个标准,“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房…...
数字IC基础:有符号数和无符号数加、减法的Verilog设计
相关阅读 数字IC基础https://blog.csdn.net/weixin_45791458/category_12365795.html?spm1001.2014.3001.5482 本文是对数字IC基础:有符号数和无符号数的加减运算一文中的谈到的有符号数加减法的算法进行Verilog实现,有关算法细节请阅读原文࿰…...
2023年11月25日(星期六)骑行三家村
2023年11月25日 (星期六) 骑行三家村(赏红杉林),早8:30到9:00, 大观公园门囗集合,9:30准时出发 【因迟到者,骑行速度快者,可自行追赶偶遇。】 偶遇地点:大观公园门口集合 ,家住东,南…...
.skip() 和 .only() 的使用
.skip() 和 .only() 的使用 说明 在做自动化测试中,跳过执行某些测试用例,或只运行某些指定的测试用例,这种情况是很常见的Cypress中也提供了这种功能 如何跳过测试用例 通过describe.skip() 或者 context.skip() 来跳过不需要执行的测试…...
如何证明特征值的几何重数不超过代数重数
设 λ 0 \lambda_0 λ0 是 A A A 的特征值,则 λ 0 \lambda_0 λ0 的代数重数 ≥ \geq ≥ 几何重数 证明 假设 A A A 的特征值 λ 0 \lambda_0 λ0 对应的特征向量有 q 维,记为 α 1 , . . . , α q \alpha_1, ... , \alpha_q α1,...,…...
Android修行手册-POI操作Excel文档
Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D学习专栏蓝桥系列ChatGPT和AIGC 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分…...
浅析教学型数控车床使用案例
教学型数控车床是一种专为教学和培训设计的机床,它具有小型化、高精度和灵活性的特点,可以作为学校和技术学院的培训机器。下面是一个使用案例,以展示教学型数控车床在教学实训中的应用。 案例背景: 某职业技术学院的机械工程专业…...
图论 2023.11.20
次短路 P2829 大逃离 题意:给定一个无向图,入口1,出口n,求第二短路的值 一个节点所直接连接的地方小于k个(起点和终点除外),那么他就不敢进去。 n<5000,m<100000 思路:次短路…...
思福迪 运维安全管理系统 test_qrcode_b 远程命令执行漏洞
思福迪 运维安全管理系统 test_qrcode_b 远程命令执行漏洞 一、漏洞描述二、漏洞影响三、网络测绘四、漏洞复现1.手动复现2.自动化复现3.python源代码 免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任…...
electron项目开机自启动
一、效果展示:界面控制是否需要开机自启动 二、代码实现: 1、在渲染进程login.html中,画好界面,默认勾选; <div class"intro">开机自启动 <input type"checkbox" id"checkbox&quo…...
2023年约特干故城夜间演艺《万方乐奏有于阗》完美谢幕
11月19日,记者走进约特干故城看到演员在欢乐地跳着刀郎舞和古典舞,庆祝今年以来夜间演艺《万方乐奏有于阗》演出200场完美谢幕。 11月19日在约特干故城,演员正在表演迎宾乐舞。阿卜力克木依卜拉依木摄 当天晚上,城楼上旌旗猎猎&am…...
AISMM成熟度模型落地失效?SITS2026用“能力-流程-角色-度量”四维校准法,3周止血、6周建模、12周固化!
更多请点击: https://intelliparadigm.com 第一章:SITS2026案例:AISMM驱动的组织变革 在SITS2026国际航天信息系统技术峰会中,欧洲航天局(ESA)与德国航空航天中心(DLR)联合实施的AI…...
2026 年视频文字提取器免费好用对比,为什么我先推微信小程序方案
做视频内容运营的时候,经常卡在几个现实问题:本地视频文件怎么快速提文案、抖音或 B 站的公开视频文案想单独保存、会议或课程录音转文字总是慢得要死。这些需求看起来不复杂,但传统的"下载软件→上传→等待导出"流程着实费时间。 …...
深入拆解:FPGA处理IMX327 RAW12数据的完整ISP流水线(白平衡/色彩校正/伽马调校全都有)
FPGA图像处理引擎:从IMX327 RAW12到高质量输出的ISP全流程实战 在实时图像处理领域,FPGA凭借其并行计算能力和低延迟特性,成为构建高效ISP(Image Signal Processing)流水线的理想平台。本文将深入探讨如何基于Xilinx K…...
TIDAL无损音乐下载神器:tidal-dl-ng让你的音乐收藏永久化
TIDAL无损音乐下载神器:tidal-dl-ng让你的音乐收藏永久化 【免费下载链接】tidal-dl-ng TIDAL Media Downloader Next Generation! Up to HiRes / TIDAL MAX 24-bit, 192 kHz. 项目地址: https://gitcode.com/gh_mirrors/ti/tidal-dl-ng 你是否曾为流媒体音乐…...
如何用AI加速MRI扫描:FastMRI项目的完整入门指南
如何用AI加速MRI扫描:FastMRI项目的完整入门指南 【免费下载链接】fastMRI A large-scale dataset of both raw MRI measurements and clinical MRI images. 项目地址: https://gitcode.com/gh_mirrors/fa/fastMRI 想象一下,你正躺在MRI扫描仪中&…...
3步解锁《鸣潮》120帧性能飞跃:WaveTools工具箱完全指南
3步解锁《鸣潮》120帧性能飞跃:WaveTools工具箱完全指南 【免费下载链接】WaveTools 🧰鸣潮工具箱 项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 还在为《鸣潮》的卡顿和帧率限制烦恼吗?是否觉得60帧的游戏体验无法充分发挥…...
探索 MCP 协议:连接 AI 模型与外部工具的新标准
探索 MCP 协议:连接 AI 模型与外部工具的新标准 引言 在大型语言模型(LLM)快速发展的今天,如何让模型安全、高效地访问外部数据源和工具,成为了 AI Agent 落地应用中的关键挑战。Model Context Protocol (MCP) 的出现&…...
基于Cloudflare Workers构建企业级OpenClaw多用户托管平台
1. 项目概述:构建一个企业级的OpenClaw多用户托管平台最近在折腾AI应用部署,发现很多团队都想把类似OpenClaw这样的开源AI助手平台用起来,但直接部署原版会遇到几个头疼的问题:用户管理怎么办?不同团队的数据怎么隔离&…...
5步攻克ComfyUI-Manager部署难题:AI工作流管理的智能革命
5步攻克ComfyUI-Manager部署难题:AI工作流管理的智能革命 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various cu…...
办公自动化利器!OpenClaw无代码 完整部署教程
随着本地 AI 智能体的快速普及,私有化部署、数据安全、低门槛落地成为技术选型的核心关注点。开源轻量 AI 智能体 OpenClaw 2.6.6 版本,在环境适配、服务稳定性与模型集成能力上完成全面优化,支持 Windows 系统一键部署,全程免编译…...
