当前位置：首页 > news >正文

基于朴素贝叶斯分类器的钞票真伪识别模型

news 2026/5/20 7:34:10

基于朴素贝叶斯分类器的钞票真伪识别模型

内容

本实验通过实现钞票真伪判别案例来展开学习朴素贝叶斯分类器的原理及应用。

本实验的主要技能点：

1、朴素贝叶斯分类器模型的构建

2、模型的评估与预测

3、分类概率的输出

源码下载

环境

操作系统：Windows10、Ubuntu18.04
工具软件：Anaconda3 2019、Python3.7
硬件环境：无特殊要求
核心库：
- numpy 1.19.4
- ipython 7.16.2
- scikit-learn 0.24.2
- pandas 1.1.5
- mglearn 0.1.9

原理

1、数据集

钞票数据集包括1371行、5列，前四列是钞票的四个光学图像指标（即样本的特征），最后一列是钞票的真伪（0-真币，1-假币，即样本的标签）。因为训练数据是有标签的，因此本实验是监督学习中的一个分类问题。

请添加图片描述

本任务涉及以下几个环节：

a）加载、查看数据集

b）获取样本的特征数组和标签数组

d）将数据集拆分为训练集和测试集

e）构建模型拟合数据、评估并做出预测

2、分割测训练集和测试集

sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.25, random_state=0)

在机器学习中，我们通常将原始数据按照比例分割为“测试集”和“训练集”，从 sklearn.model_selection 中调用train_test_split 函数 ,参数列表如下

train_data：被划分的样本特征集
train_target：被划分的样本标签
test_size：如果是浮点数，在0-1之间，表示样本占比；如果是整数的话就是样本的数量
random_state：是随机数的种子
- 若为None时，每次生成的数据都是随机，可能不一样
- 若为整数时，每次生成的数据都相同

步骤

打开notebook 开发环境，新建ipynb文件，命名为实验一：基于朴素贝叶斯分类器的钞票真伪识别模型.ipynb保存在当前项目根目录下的code文件夹中。

步骤一加载、查看数据集

我们使用pandas读取数据集文件，增加列名。

from sklearn.naive_bayes import GaussianNB # 引入高斯朴素贝叶斯分类器
from sklearn.model_selection import train_test_split # 数据集拆分
from IPython.display import display	# 显示import pandas as pd
import numpy as np# 读取钞票数据文件
banknote = pd.read_csv('../dataset/banknote.csv')# 添加列名
banknote.columns=['feature0', 'feature1','feature2','feature3','class']# 显示数据框
display(banknote)

显示结果：

请添加图片描述

钞票的四个特征分别对应其光学图像检测参数：

feature0-小波变换图像指标
feature1-小波偏斜变换图像指标
feature2-小波峰度变换图像指标
feature3-图像熵

共1371条数据，4个特征列，1个标签列。

步骤二将数据集拆分为训练集和测试集

# 获得样本特征数组data（前4列）
data = banknote.values[:,0:4]# 获得样本标签数组target(最后一列)
target = banknote.values[:,-1]print(data.shape) # 查看样本特征数组形状
print(target.shape) # 查看样本标签数组形状# 数据集拆分，辅助函数可以很快地将实验数据集划分为任何训练集（training sets）和测试集（test sets）。
X_train, X_test, y_train, y_test = train_test_split(data, target, test_size=0.25, random_state=0)print(X_train.shape, X_test.shape) # 查看拆分结果

显示结果：

(1371, 4)
(1371,)
(1028, 4) (343, 4)

步骤三创建模型，评估并预测

# 创建贝叶斯分类器
model = GaussianNB().fit(X_train, y_train) # 训练# 输出模型在训练集和测试集上的准确率
train_score = model.score(X_train, y_train) # 得分
test_score = model.score(X_test, y_test)
print(train_score, test_score)# 在测试集上预测钞票真伪
num = 10 # 显示的样本数量
y_pred = model.predict(X_test) # 预测
print('y_pred:', y_pred[:num]) # 预测结果
print('y_true:', y_test[:num]) # 实际结果
y_proba = model.predict_proba(X_test[:num]) # 预测结果的概率（每个样本为真钞和假钞的概率）
print(np.around(y_proba, decimals=3))

输出结果：

0.8424124513618677 0.8542274052478134
# 预测结果（0-真币，1-假币）
y_pred: [0. 0. 1. 0. 0. 0. 0. 0. 1. 1.]
y_true: [1. 0. 1. 0. 0. 0. 0. 0. 1. 1.]
# 预测结果个概率
[[0.588 0.412][0.998 0.002][0.    1.   ][0.998 0.002][0.998 0.002][0.953 0.047][0.681 0.319][0.994 0.006][0.    1.   ][0.054 0.946]]

贝叶斯分类器除可以输出预测结果外，还可以输出样本属于每个类别的可能性概率，可以通过predict_proba方法来输出。

基于朴素贝叶斯分类器的钞票真伪识别模型

基于朴素贝叶斯分类器的钞票真伪识别模型内容本实验通过实现钞票真伪判别案例来展开学习朴素贝叶斯分类器的原理及应用。本实验的主要技能点： 1、朴素贝叶斯分类器模型的构建 2、模型的评估与预测 3、分类概率的输出源码下载环境操作系统&#xf…...

编程日记 2023/4/18 16:14:43

【Python】【进阶篇】二十二、Python爬虫的BS4解析库

目录二十二、Python爬虫的BS4解析库22.1 BS4下载安装22.2 BS4解析对象22.3 BS4常用语法1) Tag节点22.4 遍历节点22.5 find_all()与find()1) find_all()2) find()22.6 CSS选择器二十二、Python爬虫的BS4解析库 Beautiful Soup 简称 BS4（其中 4 表示版本号&#xff0…...

编程日记 2023/4/18 16:09:42

UDS统一诊断服务【五】诊断仪在线0X3E服务

文章目录前言一、诊断仪在线服务介绍二、数据格式2.1，请求报文2.2，子功能2.3，响应报文前言本文介绍UDS统一诊断服务的0X3E服务，希望能对你有所帮助一、诊断仪在线服务介绍诊断仪在线服务比较简单，其功能就是告诉服…...

编程日记 2023/4/18 16:04:41

我的创作纪念日:Unity CEO表示生成式AI将是Unity近期发展重点，发布神秘影片预告

PICK 未来的AI技术将会让人类迎来下一个生产力变革，这其中也包括生成型AI的突破性革新。各大公司也正在竞相推出AIGC工具，其中微软的Copilot、Adobe的Firefly、Github的chatGPT等引起了人们的关注。然而，游戏开发领域似乎还没有一款真正针对性…...

编程日记 2023/4/18 15:59:40

秩亏自由网平差的直接解法

目录一、原理概述二、案例分析三、代码实现四、结果展示一、原理概述 N = B T P B N=B^TPB N=<...

编程日记 2023/4/18 15:54:38

大数据开发必备面试题Spark篇合集

1、Hadoop 和 Spark 的相同点和不同点？ Hadoop 底层使用 MapReduce 计算架构，只有 map 和 reduce 两种操作，表达能力比较欠缺，而且在 MR 过程中会重复的读写 hdfs，造成大量的磁盘 io 读写操作，所以适合高时…...

编程日记 2023/4/18 15:49:37

潜意识编程：揭秘C Lambda表达式的神秘面纱 Subconscious Programming: Unveiling the Mystery of C Lambda Expressions 引言：Lambda表达式的魅力 (The Charm of C Lambda Expressions)Lambda表达式简介与基本概念 (Introduction and Basic Concepts of …...

编程日记 2023/4/18 15:44:35

AOP使用场景记录总结(缓慢补充更新中)

测试项目结构: 目前是测试两个日志记录和代码的性能测试后面如果有其他的应用场景了在添加.其实一中就包括了二,但是没事,多练一遍 1. 日志记录比如说对service层中的所有增加,删除,修改方法添加日志, 记录内容包括操作的时间操作的方法, 方法的参数, 方法所在的类, 方法…...

编程日记 2023/4/18 15:39:34

FPGA基于XDMA实现PCIE X4的HDMI视频采集提供工程源码和QT上位机程序和技术支持

目录1、前言2、我已有的PCIE方案3、PCIE理论4、总体设计思路和方案5、vivado工程详解6、驱动安装7、QT上位机软件8、上板调试验证9、福利：工程代码的获取1、前言 PCIE（PCI Express）采用了目前业内流行的点对点串行连接，比起 PCI …...

编程日记 2023/4/18 15:34:33

ArcGIS、ENVI、InVEST、FRAGSTATS等多技术融合提升环境、生态、水文、土地、土壤、农业、大气等领域的数据分析

查看原文>>>ArcGIS、ENVI、InVEST、FRAGSTATS等多技术融合提升环境、生态、水文、土地、土壤、农业、大气等领域的数据分析目录专题一、空间数据获取与制图专题二、ArcGIS专题地图制作专题三、空间数据采集与处理专题四、遥感数据处理与应用专题五、DEM数据…...

编程日记 2023/5/31 20:50:53

怎么找回回收站里已经删除的文件

作为忙忙碌碌的打工人，电脑办公是在所难免的，而将使电脑存储着大量的数据文件，不少小伙伴都养成了定期清理电脑的习惯。而清理简单快捷的方法，无疑是直接把文件拖进回收站里。再一键清空，清理工作就完成了。但如果发现…...

编程日记 2023/4/18 15:24:30

Spring Boot、Cloud、Alibaba 版本说明

Spring Boot、Cloud、Alibaba 版本说明一、毕业版本依赖关系(推荐使用) 由于 Spring Boot 3.0，Spring Boot 2.7~2.4 和 2.4 以下版本之间变化较大，目前企业级客户老项目相关 Spring Boot 版本仍停留在 Spring Boot 2.4 以下，为了同时满足存…...

编程日记 2023/4/18 15:19:29

软件测试入门第一步：编写测试报告

什么是测试报告？ 1、说明：是指把测试的过程和结果写成文档，对发现的问题和缺陷进行分析，为纠正软件的存在的质量问题提供依据，同时为软件验收和交付打下基础。 ps. 【测试过程和测试结果的分析报告，以及上线…...

编程日记 2023/4/18 15:14:27

【Vue】vue中的路由导航守卫(路由的生命周期)

文章目录全局前置守卫可选的第三个参数 next全局解析守卫router.beforeResolve全局后置钩子路由独享的守卫组件内的守卫可用的配置 API使用组合 API完整的导航解析流程正如其名，vue-router 提供的导航守卫主要用来通过跳转或取消的方式守卫导航。这里有很多方式植入…...

编程日记 2023/4/18 15:09:26

NumPy 基础知识：6~10

原文：Numpy Essentials 协议：CC BY-NC-SA 4.0 译者：飞龙六、NumPy 中的傅立叶分析除其他事项外，傅立叶分析通常用于数字信号处理。这要归功于它在将输入信号（时域）分离为以离散频率（频域&am…...

编程日记 2023/4/18 15:04:25

实现vue的条件渲染

我的需求是根据设备不同的状态渲染不同的标签。设备状态用device_State表示。在线上面是一个vue的标签，我有一个数据state ，如何让这个标签根据数据的取值 ，修改内容，如state1时，标签修改为离线要根据数据的取值动态…...

编程日记 2023/4/18 14:59:23

第四章 word2vec 的高速化

目录4.1 word2vec 的改进①4.1.1 Embedding 层4.1.2 Embedding 层的实现4.2 word2vec 的改进②4.2.1 中间层之后的计算问题4.2.2 从多分类到二分类4.2.3 sigmoid 函数和交叉熵误差4.2.4 多分类到二分类的实现4.2.5 负采样4.2.6 负采样的采样方法4.2.7 负采样的实现4.3 改进版 w…...

编程日记 2023/6/1 5:14:18

【四】3D Object Model之创建Creation——clear_object_model_3d()/copy_object_model_3d()算子

😊😊😊欢迎来到本博客😊😊😊 🌟🌟🌟 Halcon算子太多，学习查找都没有系统的学习查找路径，本专栏主要分享Halcon各类算子含义及用法，有…...

编程日记 2023/4/18 14:49:20

第三十一章配置镜像 - 删除镜像成员时删除镜像数据库属性

文章目录第三十一章配置镜像 - 删除镜像成员时删除镜像数据库属性删除镜像成员时删除镜像数据库属性编辑或删除异步成员第三十一章配置镜像 - 删除镜像成员时删除镜像数据库属性删除镜像成员时删除镜像数据库属性当从镜像中删除成员时，始终可以选择从属于该镜…...

编程日记 2023/4/18 14:44:19

自动写作ai-自动写作神器

自动生成文章自动生成文章是指使用自然语言处理和人工智能技术，通过算法来自动生成文章的过程。一些自动生成文章的工具可以使用大量数据，学习数据背后的语言规范和知识结构，从而生成高质量和有用的文章。这种技术能够减少写作时间和人力成…...

编程日记 2023/4/18 14:39:16

像素空间解算赋能，跳出UWB硬件受限技术天花板——四无架构+孪生定位重构行业格局

像素空间解算赋能，跳出UWB硬件受限技术天花板——四无架构孪生定位重构行业格局镜像视界浙江科技有限公司，以像素空间解算技术为核心突破点，彻底跳出传统UWB有源定位的硬件受限技术天花板，独创“四无架构”轻量化落地体系&#xf…...

编程新知 2026/5/20 7:18:55

Grounding DINO：从零解析跨模态开放集检测的架构革新与实战

1. 开放集检测的革命：为什么需要Grounding DINO？ 当你在手机相册里搜索"海边日落"时，传统视觉模型只能匹配预设的"沙滩""太阳"等标签，而Grounding DINO却能真正理解语义——这就是开放集检测的魅力…...

编程新知 2026/5/20 5:41:43

AzurLaneAutoScript：解放双手的碧蓝航线智能自动化脚本

AzurLaneAutoScript：解放双手的碧蓝航线智能自动化脚本【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研，全自动大世界项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript 还在为《…...

编程新知 2026/5/20 3:06:33

【Perplexity商业新闻搜索实战指南】：2024年最高效情报获取法，3步锁定竞对动态与市场拐点

更多请点击： https://codechina.net 第一章：Perplexity商业新闻搜索的核心价值与定位 Perplexity 商业新闻搜索并非传统聚合型RSS阅读器，而是一个以语义理解与实时可信信源协同驱动的智能情报引擎。它专为投资者、企业战略团队与合规分析师设…...

编程新知 2026/5/20 2:23:01

The import xxx.xxx.xxx is never used

The import xxx.xxx.xxx is never used List is a raw type. References to generic type List<E> should be parameterized Dead code The value of the local variable d is not used代码洁癖啊，为啥这些这么多黄色警告都不处理呢。没有用的代码&#xff0…...

编程新知 2026/5/20 1:47:14

中兴光猫深度管理终极指南：一键开启工厂模式与永久Telnet服务

中兴光猫深度管理终极指南：一键开启工厂模式与永久Telnet服务【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 在当今家庭和企业网络中，中兴光猫设备扮演着至关重…...

编程新知 2026/5/20 1:08:21

Sub-agent 协同失效的 3 类边界场景：Claude Code 8.1 机制原理解析

1. Sub-agent 协同失效不是 Bug，是机制在“按说明书执行” 大多数人第一次遇到 Sub-agent 返回空响应、反复循环调用主 Agent、或在多轮协作后突然“忘记”前序任务时，第一反应是：配置错了？网络不稳定？模型退化了？我试过把 claude-code 从 8.0.3 升到 8.1.1，又降回 8.0…...

编程新知 2026/5/20 1:08:14