【机器学习系列】使用高斯贝叶斯模型进行数据分类的完整流程
目录
一、导入数据
二、选择特征
三、十折交叉验证
四、划分训练集和测试集
五、训练高斯贝叶斯模型
六、预测测试集
七、查看训练集和测试集上的分数
八、查看混合矩阵
九、输出评估指标
一、导入数据
# 根据商户数据预测其是否续约案例
import pandas
#读取数据到 data 变量中
data = pandas.read_csv('高斯贝叶斯.csv', encoding='ansi')

二、选择特征
features = [ '注册时长', '营收收入', '成本']
x=data[features]
y=data['是否续约']
三、十折交叉验证
#高斯贝叶斯
from sklearn.naive_bayes import GaussianNB
gaussianNB = GaussianNB()
from sklearn.model_selection import cross_val_score
#进行K折交叉验证
cvs = cross_val_score(gaussianNB, x, y, cv=10)
cvs.mean()
分数如下:
![]()
四、划分训练集和测试集
from sklearn.model_selection import train_test_split#把数据集分为训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
五、训练高斯贝叶斯模型
gaussianNB = gaussianNB.fit(x_train, y_train)
六、预测测试集
predict=gaussianNB.predict(x_test)
七、查看训练集和测试集上的分数
gaussianNB.score(x_train, y_train)
gaussianNB.score(x_test, y_test)
八、查看混合矩阵
gaussianNB = GaussianNB()
#使用所有数据训练模型
gaussianNB.fit(x, y)
#对所有的数据进行预测
data['预测是否续约'] = gaussianNB.predict(data[features])
from sklearn.metrics import confusion_matrix
#计算混淆矩阵,labels参数,可由 gaussianNB.classes_ 得到
confusion_matrix(data['是否续约'], data['预测是否续约'], labels=['不续约', '续约']
)

九、输出评估指标
from sklearn.metrics import classification_report
# 输出评估指标
print(classification_report(y_test, predict))
相关文章:
【机器学习系列】使用高斯贝叶斯模型进行数据分类的完整流程
目录 一、导入数据 二、选择特征 三、十折交叉验证 四、划分训练集和测试集 五、训练高斯贝叶斯模型 六、预测测试集 七、查看训练集和测试集上的分数 八、查看混合矩阵 九、输出评估指标 一、导入数据 # 根据商户数据预测其是否续约案例 import pandas #读取数据到 da…...
Python中的单例模式:原理、实现与应用
Python中的单例模式:原理、实现与应用 一、引言 在软件开发中,设计模式是一种用于解决常见问题的最佳实践。单例模式(Singleton Pattern)是这些设计模式中的一种,它确保一个类仅有一个实例,并提供一个全局…...
Linux基础(六):Linux 系统上 C 程序的编译与调试
本篇博客详细分析,Linux平台上C程序的编译过程与调试方法,这也是我们后续程序开发的基础。 目录 一、第一个hello world程序 1.1 创建.c文件 1.2 编译链接 运行可执行程序 二、编译链接过程 2.1 预编译阶段 2.2 编译阶段 2.3 汇编阶段 2.4 链…...
移动硬盘难题:不显示容量与无法访问的解决策略
在使用移动硬盘的过程中,有时会遇到一些棘手的问题,比如移动硬盘不显示容量且无法访问。这种情况让人十分头疼,因为它不仅影响了数据的正常使用,还可能导致重要数据的丢失。接下来,我们就来详细探讨一下这个问题及其解…...
基于springboot+vue的智慧外贸平台
开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…...
@Async详解,为什么生产环境不推荐直接使用@Async?
一、Async 注解介绍: Async 注解用于声明一个方法是异步的。当在方法上加上这个注解时,Spring 将会在一个新的线程中执行该方法,而不会阻塞原始线程。这对于需要进行一些异步操作的场景非常有用,比如在后台执行一些耗时的任务而不…...
LaTeX 2022软件安装教程(附软件下载地址)
软件简介: 软件【下载地址】获取方式见文末。注:推荐使用,更贴合此安装方法! LaTeX 2022是基于ΤΕΧ的一种排版系统,特别适用于生成科技和数学文档的高质量打印。它可用于各种文档类型,从简单信函到完整…...
纯干货分享 机器学习7大方面,30个硬核数据集
在刚刚开始学习算法的时候,大家有没有过这种感觉,最最重要的那必须是算法本身! 其实在一定程度上忽略了数据的重要性。 而事实上一定是,质量高的数据集可能是最重要的! 数据集在机器学习算法项目中具有非常关键的重…...
算法训练营day46
一、单词拆分 元素无重可复选 base case is.length return true,遍历到了最后, 因为ilen s.length,len初始值为1,那么i1 s.length,那么i s.lenth -1 也就是最后一个字符位置 dp(s,i)函数定义:返回 s[i…] 是否能够…...
推荐五个线上兼职,在家也能轻松日入百元,适合上班族和全职宝妈
在这个瞬息万变的时代,你是否也曾考虑过在繁忙的工作之外,寻找一份兼职副业来补贴家用,同时保持生活的多样性?别急,现在就让我为你揭秘五个可靠的日结线上兼职岗位,助你轻松迈向财务自由之路! 一…...
Python_文件操作_学习
目录 一、关于文件的打开和关闭 1. 文件的打开 2.文件的关闭 二、文件的读取 1. 文件的读_r 2. 使用readline 3.使用readlines 三、文件的写入 1. 文本的新建写入 2.文本的追加写入 四、文件的删除和重命名 1.文件的重命名 2.文件的删除 五、文件的定位读写 1.t…...
Leetcode 3154. Find Number of Ways to Reach the K-th Stair
Leetcode 3154. Find Number of Ways to Reach the K-th Stair 1. 解题思路2. 代码实现 题目链接:3154. Find Number of Ways to Reach the K-th Stair 1. 解题思路 这一题思路上就是一个动态规划,我们只需要确定一下运行的终止条件,然后写…...
Vue3/Vite引入EasyPlayer.js播放H265视频错误的问题
一、引入EasyPlayer.js github链接:GitHub - EasyDarwin/EasyPlayer.js: EasyPlayer.js H5播放器 将demo/html目录下的 EasyPlayer-element.min.js、EasyPlayer-lib.min.js、EasyPlayer.wasm、jquery.min.js 复制到vue3工程的public目录下,注意,vue3 vite的index.html文件…...
CentOS 7安装alertmanager
说明:本文介绍如何在CentOS 7安装alertmanager; Step1:下载安装包 访问Github仓库,下载对应版本的alertmanager安装包 https://github.com/prometheus/alertmanager/releases 如何查看自己系统的信息,可参考下图中的…...
YOLOv10详细解读 | 一文带你深入了解yolov10的创新点(附网络结构图 + 举例说明)
前言 Hello大家好,我是Snu77,继YOLOv9发布时间没有多久,YOLOv10就紧接着发布于2024.5.23号(不得不感叹YOLO系列的发展速度,但要纠正大家的观点就是不是最新的就一定最好)! 本文给大家带来的是…...
【openlayers系统学习】3.5colormap详解(颜色映射)
五、colormap详解(颜色映射) colormap 包是一个很好的实用程序库,用于创建颜色图。该库已作为项目的依赖项添加(1.7美化(设置style))。要导入它,请编辑 main.js 以包含以下行…...
Redis教程(十五):Redis的哨兵模式搭建
一、搭建Redis一主二从 分别复制三份Redis工作文件夹,里面内容一致 接着修改7002的配置文件,【redis.windows-service.conf】 port 7002 改成 port 7002 slaveof 127.0.0.1 7001 7003也同样修改 port 7003 slaveof 127.0.0.1 7001 这样就指定了700…...
【C语言】8.C语言操作符详解(3)
文章目录 10.操作符的属性:优先级、结合性10.1 优先级10.2 结合性 11.表达式求值11.1 整型提升11.2 算术转换11.3 问题表达式解析11.3.1 表达式111.3.2 表达式211.3.3 表达式311.3.4 表达式411.3.5 表达式5: 11.4 总结 10.操作符的属性:优先级、结合性 …...
离线初始化k8s
导出和导入所有必要的 Kubernetes 镜像,使用阿里云作为源。 在能访问外网的机器上拉取镜像 首先,在有外网访问的机器上运行以下命令来拉取所有 Kubernetes v1.29.5 版本需要的镜像: kubeadm config images pull --image-repository regist…...
C++字符编码 cppp-reiconv库使用详解
经常写一些控制台小程序,常常会遇到输出中文乱码的问题,在windwos下可以使用MultiByteToWideChar转换字符编码,但跨平台就需要cppp-reiconv这样的第三方字符编码处理库,且开源。 一、下载cppp-reiconv库的源码和静/动态库 GitHu…...
FLUX.1-dev像素艺术生成器教程:提示词工程与16-bit风格关键词库
FLUX.1-dev像素艺术生成器教程:提示词工程与16-bit风格关键词库 1. 像素幻梦工坊简介 像素幻梦(Pixel Dream Workshop)是基于FLUX.1-dev扩散模型构建的新一代像素艺术生成工具。它采用明亮的16-bit像素风格界面设计,为创作者提供…...
IndexTTS2快速搭建指南:最新V23镜像,情感语音合成效果展示
IndexTTS2快速搭建指南:最新V23镜像,情感语音合成效果展示 1. 引言 1.1 为什么选择IndexTTS2 V23 IndexTTS2 V23版本是目前最先进的语音合成工具之一,特别适合需要高质量、情感丰富的语音生成场景。这个版本最大的亮点在于情感控制能力的全面…...
容器安全扫描:镜像漏洞检测与运行时保护
容器安全扫描:镜像漏洞检测与运行时保护 随着容器技术的广泛应用,其安全性问题日益凸显。容器安全扫描成为保障云原生环境安全的关键环节,涵盖镜像构建阶段的漏洞检测与运行时的动态防护。本文将深入探讨容器安全的核心实践,帮助…...
AI原生语音交互已进入临界点:2026奇点大会透露的7项技术拐点与你的团队适配时间表
第一章:AI原生语音交互已进入临界点:2026奇点大会核心洞察 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点大会上,来自DeepMind、Meta AI与中科院自动化所的联合实证表明:端到端语音大模型(如Whisper-XL、…...
如何用c# 做 mcp/ChatGPT app胃
简介 AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。 AI Agent 功能 根据查阅的资料,agent的…...
穿戴式设备:生理信号采集与健康状态分析
**穿戴式设备:生理信号采集与健康状态分析** 在科技飞速发展的今天,穿戴式设备已成为健康管理的重要工具。它们通过实时采集心率、血氧、体温等生理信号,结合智能算法分析用户的健康状态,为疾病预防和健康干预提供科学依据。无论…...
从零打造一个丝滑的 Vue 3 返回顶部组件
从零打造一个丝滑的 Vue 3 返回顶部组件 这个组件具备以下特性: 智能显示:滚动超过指定距离(默认 300px)后自动出现。丝滑动画:使用 Vue 内置的 <Transition> 实现淡入上滑的出现 / 消失效果。平滑滚动ÿ…...
轻量级分布式日志管理方案选型指南:Graylog、Loki与ELK的核心差异与应用场景
1. 为什么企业需要轻量级日志管理系统? 当你的业务从单机部署扩展到10台服务器时,用SSH登录每台机器grep日志还能勉强应付。但当集群规模达到上百节点,特别是采用Kubernetes编排的容器化环境,每天产生GB级日志时,传统方…...
XLR8Servo_vhdl:FPGA硬件加速的高精度伺服控制方案
1. XLR8Servo_vhdl 加速伺服控制库深度解析1.1 项目定位与工程痛点XLR8Servo_vhdl 是专为 Alorium Technology XLR8 开发板设计的硬件加速型伺服电机控制库,其核心目标是彻底解决传统 Arduino Servo 库在实时性、资源占用和功能冲突三大维度上的固有缺陷。该库并非软…...
Three.js 3D热力图实现全解析(从原理到实战)
1. 3D热力图的核心原理与实现思路 第一次接触3D热力图时,我也被那些酷炫的立体数据可视化效果惊艳到了。这种技术本质上是通过颜色和高度两个维度来呈现数据密度分布,比传统的2D热力图多了Z轴信息。在Three.js中实现这个效果,关键要理解三个核…...
