当前位置：首页 > news >正文

机器学习-朴素贝叶斯之多项式模型

news 2026/2/9 11:54:00

多项式模型：

记住一定用于离散的对象，不能是连续的
于高斯分布相反，多项式模型主要适用于离散特征的概率计算，切sklearn的多项式模型不接受输入负值
因为多项式不接受负值的输入，所以样本数据的特征为数值型数据，必须归一化处理保证数据里没有负数
其中需要用到贝叶斯概率公式：如下
当分子出现0时候，需要用到拉普拉斯平滑系数

贝叶斯概率公式，来自Wang’s Blog的原创

模型构建与训练：

需要用到的api是：from sklearn.naive_bayes import MultinomialNB
我们还需要对文章内容进行提取需要用到的api是：from sklearn.feature_extraction.text import TfidfVectorizer
英文的可以用这种方法进行分词中文的需要自己进行分词

实验如下：

导入贝叶斯多项式模型

from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
import sklearn.datasets as datasets
data = datasets.fetch_20newsgroups(data_home='./datasets',subset='all')
feature = data['data']#初始未进行特征值化
target = data['target']
# 分别创建模型，数据统计的实例对象
nb = MultinomialNB()
tf = TfidfVectorizer()
tf_feature = tf.fit_transform(feature)# 进行了特征值化
# 进行数据集切分
x_train, x_test, y_train, y_test = train_test_split(tf_feature,target,test_size=0.1,random_state=2023)
# 将训练集放入模型中进行训练模型
nb.fit(x_train,y_train)
# 输出训练后的模型里放入测试集的准确率
print(nb.score(x_test,y_test))
print(target)
print(feature)

输出结果：
显示的没办法爬数据，我又换了一组数据

# 导入贝叶斯多项式模型
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
import sklearn.datasets as datasets
# data = datasets.fetch_20newsgroups(data_home='./datasets', subset='all')
data = datasets.load_iris()
feature = data['data']#初始未进行特征值化
target = data['target']
# 分别创建模型，数据统计的实例对象
nb = MultinomialNB()
# tf = TfidfVectorizer()
# feature = tf.fit_transform(feature)# 进行了特征值化
# 进行数据集切分
x_train, x_test, y_train, y_test = train_test_split(feature,target,test_size=0.1,random_state=2023)
# 将训练集放入模型中进行训练模型
nb.fit(x_train,y_train)print(target)
print(feature)
# 输出训练后的模型里放入测试集的准确率
print(nb.score(x_test,y_test))

此时输出结果：

	[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 22 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 22 2]
[[5.1 3.5 1.4 0.2][4.9 3.  1.4 0.2][4.7 3.2 1.3 0.2][4.6 3.1 1.5 0.2][5.  3.6 1.4 0.2][5.4 3.9 1.7 0.4][4.6 3.4 1.4 0.3][5.  3.4 1.5 0.2][4.4 2.9 1.4 0.2][4.9 3.1 1.5 0.1][5.4 3.7 1.5 0.2][4.8 3.4 1.6 0.2][4.8 3.  1.4 0.1][4.3 3.  1.1 0.1][5.8 4.  1.2 0.2][5.7 4.4 1.5 0.4][5.4 3.9 1.3 0.4][5.1 3.5 1.4 0.3][5.7 3.8 1.7 0.3][5.1 3.8 1.5 0.3][5.4 3.4 1.7 0.2][5.1 3.7 1.5 0.4][4.6 3.6 1.  0.2][5.1 3.3 1.7 0.5][4.8 3.4 1.9 0.2][5.  3.  1.6 0.2][5.  3.4 1.6 0.4][5.2 3.5 1.5 0.2][5.2 3.4 1.4 0.2][4.7 3.2 1.6 0.2][4.8 3.1 1.6 0.2][5.4 3.4 1.5 0.4][5.2 4.1 1.5 0.1][5.5 4.2 1.4 0.2][4.9 3.1 1.5 0.2][5.  3.2 1.2 0.2][5.5 3.5 1.3 0.2][4.9 3.6 1.4 0.1][4.4 3.  1.3 0.2][5.1 3.4 1.5 0.2][5.  3.5 1.3 0.3][4.5 2.3 1.3 0.3][4.4 3.2 1.3 0.2][5.  3.5 1.6 0.6][5.1 3.8 1.9 0.4][4.8 3.  1.4 0.3][5.1 3.8 1.6 0.2][4.6 3.2 1.4 0.2][5.3 3.7 1.5 0.2][5.  3.3 1.4 0.2][7.  3.2 4.7 1.4][6.4 3.2 4.5 1.5][6.9 3.1 4.9 1.5][5.5 2.3 4.  1.3][6.5 2.8 4.6 1.5][5.7 2.8 4.5 1.3][6.3 3.3 4.7 1.6][4.9 2.4 3.3 1. ][6.6 2.9 4.6 1.3][5.2 2.7 3.9 1.4][5.  2.  3.5 1. ][5.9 3.  4.2 1.5][6.  2.2 4.  1. ][6.1 2.9 4.7 1.4][5.6 2.9 3.6 1.3][6.7 3.1 4.4 1.4][5.6 3.  4.5 1.5][5.8 2.7 4.1 1. ][6.2 2.2 4.5 1.5][5.6 2.5 3.9 1.1][5.9 3.2 4.8 1.8][6.1 2.8 4.  1.3][6.3 2.5 4.9 1.5][6.1 2.8 4.7 1.2][6.4 2.9 4.3 1.3][6.6 3.  4.4 1.4][6.8 2.8 4.8 1.4][6.7 3.  5.  1.7][6.  2.9 4.5 1.5][5.7 2.6 3.5 1. ][5.5 2.4 3.8 1.1][5.5 2.4 3.7 1. ][5.8 2.7 3.9 1.2][6.  2.7 5.1 1.6][5.4 3.  4.5 1.5][6.  3.4 4.5 1.6][6.7 3.1 4.7 1.5][6.3 2.3 4.4 1.3][5.6 3.  4.1 1.3][5.5 2.5 4.  1.3][5.5 2.6 4.4 1.2][6.1 3.  4.6 1.4][5.8 2.6 4.  1.2][5.  2.3 3.3 1. ][5.6 2.7 4.2 1.3][5.7 3.  4.2 1.2][5.7 2.9 4.2 1.3][6.2 2.9 4.3 1.3][5.1 2.5 3.  1.1][5.7 2.8 4.1 1.3][6.3 3.3 6.  2.5][5.8 2.7 5.1 1.9][7.1 3.  5.9 2.1][6.3 2.9 5.6 1.8][6.5 3.  5.8 2.2][7.6 3.  6.6 2.1][4.9 2.5 4.5 1.7][7.3 2.9 6.3 1.8][6.7 2.5 5.8 1.8][7.2 3.6 6.1 2.5][6.5 3.2 5.1 2. ][6.4 2.7 5.3 1.9][6.8 3.  5.5 2.1][5.7 2.5 5.  2. ][5.8 2.8 5.1 2.4][6.4 3.2 5.3 2.3][6.5 3.  5.5 1.8][7.7 3.8 6.7 2.2][7.7 2.6 6.9 2.3][6.  2.2 5.  1.5][6.9 3.2 5.7 2.3][5.6 2.8 4.9 2. ][7.7 2.8 6.7 2. ][6.3 2.7 4.9 1.8][6.7 3.3 5.7 2.1][7.2 3.2 6.  1.8][6.2 2.8 4.8 1.8][6.1 3.  4.9 1.8][6.4 2.8 5.6 2.1][7.2 3.  5.8 1.6][7.4 2.8 6.1 1.9][7.9 3.8 6.4 2. ][6.4 2.8 5.6 2.2][6.3 2.8 5.1 1.5][6.1 2.6 5.6 1.4][7.7 3.  6.1 2.3][6.3 3.4 5.6 2.4][6.4 3.1 5.5 1.8][6.  3.  4.8 1.8][6.9 3.1 5.4 2.1][6.7 3.1 5.6 2.4][6.9 3.1 5.1 2.3][5.8 2.7 5.1 1.9][6.8 3.2 5.9 2.3][6.7 3.3 5.7 2.5][6.7 3.  5.2 2.3][6.3 2.5 5.  1.9][6.5 3.  5.2 2. ][6.2 3.4 5.4 2.3][5.9 3.  5.1 1.8]]
0.9333333333333333

输出的效果还挺不错

机器学习-朴素贝叶斯之多项式模型

多项式模型： 记住一定用于离散的对象，不能是连续的于高斯分布相反，多项式模型主要适用于离散特征的概率计算，切sklearn的多项式模型不接受输入负值因为多项式不接受负值的输入，所以样本数据的特征为数值型数据&…...

编程日记 2023/10/30 21:05:00

下载的nginx证书转换成tomcat证书格式

1、下载的nginx证书格式 XXX.crt private.key 2、转换成JKS格式证书步骤 #crt格式证书转pem openssl x509 -in xxx.crt -out xxx.pem#先转成p12格式，此时注意，如果有别名，需要设置 openssl pkcs12 -export -in xxx.crt -inkey private.key…...

编程日记 2023/10/30 21:03:58

计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战

✨作者主页：IT毕设梦工厂✨ 个人简介：曾从事计算机专业培训教学，擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…...

编程日记 2023/10/30 21:01:56

ES6中数值扩展

目录二进制和八进制表示法 Number.isFinite() Number.isNaN() Number.parseInt()和Number.parseFloat() Number.isInteger() Math.trunc() Math.sign() Math.cbrt()： Math.clz32()： Math.imul()： Math.fround()： ES6中…...

编程日记 2023/10/30 20:59:52

sql-50练习题11-15

sql-50练习题11-15 前言数据库表结构介绍学生表课程表成绩表教师表 1-1 查询没有学全所有课程的同学的信息1-2 查询至少有一门课与学号为01的同学所学相同的同学的信息1-3 查询和1号的同学学习的课程完全相同的其他同学的信息1-4 查询没学过张三老师讲授的任一门课程的学生姓名…...

编程日记 2023/10/30 20:57:49

【多线程面试题十九】、公平锁与非公平锁是怎么实现的？

文章底部有个人公众号：热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享？ 踩过的坑没必要让别人在再踩，自己复盘也能加深记忆。利己利人、所谓双赢。面试官： 公平锁与非公平锁是怎么…...

编程日记 2023/10/30 20:55:47

LabVIEW背景颜色设为和其他程序或图像中一样

LabVIEW背景颜色设为和其他程序或图像中一样有时候LabVIEW背景色要和其他程序或者图片的颜色保持一致，如果要求不高可以大致设置一下。如果要求较高，那可以按照如下的方式。先用PS打开标准图像，之后用吸管工具选择图像上中的点&#xff0…...

编程日记 2023/10/30 20:52:43

图表参考线，数据对比一目了然_三叠云

参考线路径仪表盘 >> 仪表盘设计功能简介新增「参考线」功能。参考线是在单个图表组件中添加的一条水平虚线，也可以配置两条线形成的参考区间，它表示该水平线上纵坐标值的大小。使用场景： 通过辅助线的设置，可…...

编程日记 2023/10/30 20:51:43

【深度学习】Transformer、GPT、BERT、Seq2Seq什么区别？

请看vcr：https://transformers.run/back/transformer/...

编程日记 2023/10/30 20:50:41

数据结构与算法之LRU: 实现 LRU 缓存算法功能 (Javascript版)

关于LRU缓存 LRU - Lease Recently Used 最近使用如果内存优先，只缓存最近使用的，删除 ‘沉睡’ 数据核心 api: get set 分析使用哈希表来实现, O(1)必须是有序的，常用放在前面，沉睡放在后面, 即：有序&#xff0…...

编程日记 2023/10/30 20:49:39

Matlab | 基于二次谱提取地震数据的地震子波

本文通过地震数据二次谱求取地震子波谱，具体方法如下： MATLAB代码实现如下： function w SndSpecExtWavelet(x, M) % 功能：基于二次谱提取输入地震数据data的地震子波wavelet % Extracting Wavelet from Input Seismic Dat…...

编程日记 2023/10/30 20:48:37

利用远程IO模块，轻松驾驭食品包装生产的自动化

常见的自动化包装系统，它的核心部分通常由一系列高端设备组成，包括自动开箱机、自动封箱机、自动捆扎机、装箱机器人、码垛机器人等。这些设备协同工作，形成一条高效运转的生产线，从开箱到装箱，再到码垛，每…...

编程日记 2023/10/30 20:47:36

华为OD机考算法题：计算最大乘积

题目部分题目计算最大乘积难度易题目说明给定一个元素类型为小写字符串的数组，请计算两个没有相同字符的元素长度乘积的最大值。如果没有符合条件的两个元素，返回 0。输入描述输入为一个半角逗号分隔的小写字符串的数组，2< 数组长度<…...

编程日记 2023/10/30 20:46:36

用友 GRP-U8 存在sql注入漏洞复现

0x01 漏洞介绍用友 GRP-U8 license_check.jsp 存在sql注入，攻击者可利用该漏洞执行任意SQL语句，如查询数据、下载数据、写入webshell、执行系统命令以及绕过登录限制等。 fofa：app”用友-GRP-U8” 0x02 POC: /u8qx/license_check.jsp?kj…...

编程日记 2023/10/30 20:45:35

vue页面el-tab控件标签栏加入按钮功能

vue页面el-tab控件标签栏加入按钮功能显示效果为： <el-tabs v-model"activeName" type"border-card" style"margin-right:5px"><el-tab-pane label"模型管理" name"first"><span slot"l…...

编程日记 2023/10/30 20:44:34

vue3使用ref和reactive

Vue 3引入了两个新的API，ref和reactive，用于创建响应式对象。这两个方法都位于Vue.prototype上，因此可以在组件实例中直接使用。 ref ref函数用于创建一个响应式引用对象。这个函数可以接受一个普通的变量或对象作为参数，并返回…...

编程日记 2023/10/30 20:42:31

7 款用于解锁iPhone密码的苹果解锁软件

无法访问您的 iPhone 一定是最烦人的情况之一。即使您以前从未遇到过这种情况，做好准备总是一个好主意，而不是在它发生时感到无助。事实上，这种情况经常发生并且可能有很多实例，例如忘记密码或购买锁定的二手 iPhone。牢记 Ap…...

编程日记 2023/10/30 20:41:30

.jnlp

首先配置电脑的java环境。百度搜索jre下载，会有很多结果，一般选择官网进行下载。下载正确的jre版本。我的电脑是windows 64位，根据你自己电脑的情况选择版本进行下载。不懂自己电脑是多少位的可以看下一步。查看电脑是64位还是32…...

编程日记 2023/10/30 20:40:29

Linux启动之uboot分析

Linux启动之uboot分析 uboot是什么？一、补充存储器概念1.存储器种类1.norflash - 是非易失性存储器（也就是掉电保存）2.nandflash - 是非易失性存储器（也就是掉电保存）3.SRAM - 静态随机访问存储器 - Static Random Acc…...

编程日记 2023/10/30 20:39:28

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/11/30 15:33:36

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2025/10/5 19:58:27

工业自动化时代的精准装配革新：迁移科技3D视觉系统如何重塑机器人定位装配

AI3D视觉的工业赋能者迁移科技成立于2017年，作为行业领先的3D工业相机及视觉系统供应商，累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成，通过稳定、易用、高回报的AI3D视觉系统，为汽车、新能源、金属制造等行…...

编程新知 2025/11/25 4:59:47

k8s业务程序联调工具-KtConnect

概述原理工具作用是建立了一个从本地到集群的单向VPN，根据VPN原理，打通两个内网必然需要借助一个公共中继节点，ktconnect工具巧妙的利用k8s原生的portforward能力，简化了建立连接的过程，apiserver间接起到了中继节…...

编程新知 2026/2/1 4:14:14

OpenLayers 分屏对比(地图联动)

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能，和卷帘图层不一样的是，分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

编程新知 2025/12/25 18:22:43

音视频——I2S 协议详解

I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议，专门用于在数字音频设备之间传输数字音频数据。它由飞利浦（Philips）公司开发，以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...

编程新知 2026/2/1 2:08:53

android RelativeLayout布局

<?xml version"1.0" encoding"utf-8"?> <RelativeLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_parent"android:gravity&…...

编程新知 2026/2/6 13:49:41

学习一下用鸿蒙DevEco Studio HarmonyOS5实现百度地图

在鸿蒙（HarmonyOS5）中集成百度地图，可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API，可以构建跨设备的定位、导航和地图展示功能。 1. 鸿蒙环境准备开发工具：下载安装 De…...

编程新知 2025/11/13 2:37:01

Elastic 获得 AWS 教育 ISV 合作伙伴资质，进一步增强教育解决方案产品组合

作者：来自 Elastic Udayasimha Theepireddy (Uday), Brian Bergholm, Marianna Jonsdottir 通过搜索 AI 和云创新推动教育领域的数字化转型。我们非常高兴地宣布，Elastic 已获得 AWS 教育 ISV 合作伙伴资质。这一重要认证表明，Elastic 作为 …...

编程新知 2026/2/7 16:38:17

面试高频问题

文章目录 🚀 消息队列核心技术揭秘：从入门到秒杀面试官1️⃣ Kafka为何能"吞云吐雾"？性能背后的秘密1.1 顺序写入与零拷贝：性能的双引擎1.2 分区并行：数据的"八车道高速公路"1.3 页缓存与批量处理…...

编程新知 2025/11/17 0:00:05

机器学习-朴素贝叶斯之多项式模型

多项式模型：

模型构建与训练：

实验如下：

导入贝叶斯多项式模型

此时输出结果：

相关文章：

机器学习-朴素贝叶斯之多项式模型

下载的nginx证书转换成tomcat证书格式

计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战

ES6中数值扩展

sql-50练习题11-15

【多线程面试题十九】、公平锁与非公平锁是怎么实现的？

3.4每日一题（变量可分离方程通解）

LabVIEW背景颜色设为和其他程序或图像中一样

图表参考线，数据对比一目了然_三叠云

【深度学习】Transformer、GPT、BERT、Seq2Seq什么区别？

数据结构与算法之LRU: 实现 LRU 缓存算法功能 (Javascript版)

Matlab | 基于二次谱提取地震数据的地震子波

利用远程IO模块，轻松驾驭食品包装生产的自动化

华为OD机考算法题：计算最大乘积

用友 GRP-U8 存在sql注入漏洞复现

vue页面el-tab控件标签栏加入按钮功能

vue3使用ref和reactive

7 款用于解锁iPhone密码的苹果解锁软件

.jnlp

Linux启动之uboot分析

RestClient

leetcodeSQL解题：3564. 季节性销售分析

工业自动化时代的精准装配革新：迁移科技3D视觉系统如何重塑机器人定位装配

k8s业务程序联调工具-KtConnect

OpenLayers 分屏对比(地图联动)

音视频——I2S 协议详解

android RelativeLayout布局

学习一下用鸿蒙DevEco Studio HarmonyOS5实现百度地图

Elastic 获得 AWS 教育 ISV 合作伙伴资质，进一步增强教育解决方案产品组合

面试高频问题