当前位置：首页 > news >正文

朴素贝叶斯法_naive_Bayes

news 2026/2/10 17:30:51

朴素贝叶斯法（naive Bayes）是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入输出的联合概率分布；然后基于此模型，对给定的输入 $x$ ，利用贝叶斯定理求出后验概率最大的输出 $y$ 。

基本方法：

设输入空间 $X\subseteq R^n$ 为 $n$ 维向量的集合，输出空间为类标记集合 $Y=\{c_1,c_2,...,c_k\}$ 。输入为特征向量 $x\in X$ ，输出为类标记 $y\in Y$ 。 $X$ 是定义在输入空间 $X$ 上的随机向量， $Y$ 是定义在输出空间 $Y$ 上的随机变量。 $P (X, Y)$ 是 $X$ 和 $Y$ 的联合概率分布。训练集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ 由 $P (X, Y)$ 独立同分布产生。

朴素贝叶斯算法就是通过训练数据集学习联合概率分布 $P (X, Y)$ 。

具体地，学习以下先验概率分布及条件概率分布。
先验概率分布： $P(Y=C_k), \quad k=1,2,...,K$ ；
条件概率分布： $P(X=x|Y=C_k)=P(X^{(1)}=x^{(1)},...,X^{(n)}=x^{(n)}|Y=C_k),\quad k=1,2,...,K$ 。

由于条件概率分布 $P(X=x|Y=C_k)$ 由指数级数量的参数，其估计实际是不可能的。事实上，假设特征 $X^{(j)}$ 可能的取值有 $S_j$ 个， $j = 1, 2, ..., n$ ， $Y$ 可能取值有 $K$ 个，那么参数个数为 $K\prod_{j=1}^{n}S_j$ 个。

于是朴素贝叶斯算法对条件概率分布作出了条件独立性的假设。这是一个非常强的假设，等于是说用于分类的特征在类确定的条件下都是条件独立的，具体地，条件独立性假设是
$P(X=x|Y=C_k)=P(X^{(1)}=x^{(1)},...,X^{(n)}=x^{(n)}|Y=C_k)$
$\qquad \quad =\prod_{j=1}^{n}P(X^{(j)}=x^{(j)}|Y=C_k)$

朴素贝叶斯算法在进行分类时，对给定的输入 $x$ ，通过学习到的模型计算后验概率分布 $P(Y=C_k|X=x)$ ，然后将后验概率最大的类作为 $x$ 的输出。后验概率计算根据贝叶斯定理进行：
$P(Y=C_k|X=x)=\frac{P(X=x|Y=C_k)P(Y=C_k)}{\sum_{k}P(X=x|Y=C_k)P(Y=C_k)}$
$\qquad \qquad \qquad \qquad=\frac{P(Y=C_k)\prod_{j}P(X^{(j)}=x^{(j)}|Y=C_k)}{\sum_{k}P(Y=C_k)\prod_{j}P(X^{(j)}=x^{(j)}|Y=C_k)}$

于是，朴素贝叶斯分类器可表示为
$y=f(x)=arg\max_{C_k}\frac{P(Y=C_k)\prod_{j}P(X^{(j)}=x^{(j)}|Y=C_k)}{\sum_{k}P(Y=C_k)\prod_{j}P(X^{(j)}=x^{(j)}|Y=C_k)}$

由于分母对所有的类都是相同的，所以
$y=f(x)=arg\max_{C_k}P(Y=C_k)\prod_{j}P(X^{(j)}=x^{(j)}|Y=C_k)$

算法：
输入：训练集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，其中 $x_i=(x_i^{(1)},x_i^{(2)},...,x_i^{(n)})^T$ ， $x_i^{(j)}$ 是第 $i$ 个样本的第 $j$ 个特征， $x_i^{(j)} \in \{a_{j1},a_{j2},...,a_{jS_j}\}$ ， $a_{jl}$ 是第 $j$ 个特征可能取的第 $l$ 个值， $j = 1, 2, ..., n$ ， $l=1,2,...,S_j$ ， $y_i \in \{C_1,C_2,...,C_k\}$ ；实例 $x$ 。
输出：实例 $x$ 的分类。

计算先验概率及条件概率
$P(Y=C_k)=\frac{\sum_{i=1}^{N}I(y_i=C_k)}{N}, \qquad k=1,2,...,k$
$P(X^{(j)}=a_{jl}|Y=C_k)=\frac{\sum_{i=1}^{N}I(x^{(j)}=a_{jl},y_i=C_k)}{\sum_{i=1}^{N}I(y_i=C_k)}$
$\qquad j=1,2,...,n; \quad l=1,2,...,S_j; \quad k=1,2,...,K$
对于给定实例 $x={(x^{(1)},x^{(2)},...,x^{(n)})}^T$ ，计算(这里用到了特征条件独立假设)
$P(Y=C_k)\prod_{j=1}^{n}P(X^{(j)}=x^{(j)}|Y=C_k),\qquad k=1,2,...,K$
确定实例 $x$ 的分类
$y=arg\max_{C_k}P(Y=C_k)\prod_{j=1}^{n}P(X^{(j)}=x^{(j)}|Y=C_k)$

朴素贝叶斯法_naive_Bayes

相关文章：

朴素贝叶斯法_naive_Bayes

Windows下安装MongoDB实践总结

华为云Stack 8.X 流量模型分析（二）

rk3588 之启动

ARM GIC （五）gicv3架构-LPI

sql-labs服务器结构

【小沐学写作】Docsify制作在线电子书、技术文档（Docsify + Markdown + node）

电脑完全重装教程——原版系统镜像安装

【智慧办公】如何让智能会议室的电子标签实现远程、批量更新信息？东胜物联网硬件网关让解决方案更具竞争力

面向对象设计与分析40讲（16）静态工厂方法模式

【贪心】买卖股票的最佳时机含手续费

Altium Designer入门到就业【目录】

cmake 查看编译命令，以及在vscode中如何使用cmke

玩转 Scrapy 框架 (一)：Scrapy 框架介绍及使用入门

node.js mongoose index（索引）

谷歌推大语言模型VideoPoet：文本图片皆可生成视频和音频

ES-mapping

Centos 7.9安装Oracle19c步骤亲测可用有视频

.NET中的Swagger使用

结构屈曲分析

Python爬虫实战：研究MechanicalSoup库相关技术

【大模型RAG】拍照搜题技术架构速览：三层管道、两级检索、兜底大模型

安宝特方案丨XRSOP人员作业标准化管理平台：AR智慧点检验收套件

Linux相关概念和易错知识点（42）（TCP的连接管理、可靠性、面临复杂网络的处理）

云原生玩法三问：构建自定义开发环境

PAN/FPN

力扣热题100 k个一组反转链表题解

算法打卡第18天

医疗AI模型可解释性编程研究：基于SHAP、LIME与Anchor

前端工具库lodash与lodash-es区别详解