当前位置：首页 > news >正文

03.C1W2.Sentiment Analysis with Naïve Bayes

news 2025/7/7 16:28:31

Probability and Bayes’ Rule
- Introduction
- Probabilities
- Probability of the intersection
Bayes’ Rule
- Conditional Probabilities
- Bayes’ Rule
- Quiz: Bayes’ Rule Applied
Naïve Bayes Introduction
- Naïve Bayes for Sentiment Analysis
- $P(w_i|class)$
- Naïve Bayes
Laplacian Smoothing
- Laplacian Smoothing
- Introducing $P(w_i|class)$ with smoothing
Log Likelihood
- Ratio of probabilities
- Naïve Bayes’ inference
- Log Likelihood, Part1
- Calculating Lambda
- Summary
Log Likelihood, Part 2
Training Naïve Bayes
Testing Naïve Bayes
- Predict using Naïve Bayes
- Testing Naïve Bayes
Applications of Naïve Bayes
Naïve Bayes Assumptions
Error Analysis
- Punctuation
- Removing Words
- Adversarial attacks

Probability and Bayes’ Rule

概率与条件概率及其数学表达
贝叶斯规则（应用于不同领域，包括 NLP）
建立自己的 Naive-Bayes 推文分类器

Introduction

假设我们有一个推文语料库，里面包含正面和负面情感的推文：
在这里插入图片描述
某个单词例如：happy，可能出现在正面或负面情感的推文中：

下面我们用数学公式来表示上面的概率描述。

Probabilities

$A$ 表示正面的推文，则正面的推文发生的概率可以表示为：
$P(A)=P(Positive)=N_{pos}/N$
以上图为例：
$P(A)=N_{pos}/N=13/20=0.65$
而负面推文发生的概率可以表示为：
$P (N e g a t i v e) = 1 - P (P os i t i v e) = 0..35$
happy可能出现在正面或负面情感的推文中可以表示为 $B$ ：
在这里插入图片描述
则 $B$ 发生概率可以表示为：
$P(B) = P(happy) = N_{happy}/N\\ P(B) =4/20=0.2$

Probability of the intersection

下面表示正面推文且包含单词happy可图形化表示为：
在这里插入图片描述
也可以用交集的形式表示：
$P(A\cap B)=P(A,B)=\cfrac{3}{20}=0.15$
语料库中有20条推文，其中有3条被标记为积极且同时包含单词happy

Bayes’ Rule

Conditional Probabilities

如果我们在三亚，并且现在是冬天，你可以猜测天气如何，那么你的猜测比只直接猜测天气要准确得多。
用推文的例子来说：
如果只考虑包含单词happy的推文（4条），而不是整个语料库，考虑这个里面包含正面推文的概率：
在这里插入图片描述
$P(A|B)=P(Positive|“happy")\\ P(A|B)=3/4=0.75$

反过来说，只考虑正面推文，看其出现happy单词的推文概率：

$\\ P(B | A) = 3 / 13 = 0.231$

从上面例子可以看到：条件概率可以被解释为已知事件A已经发生的情况下，结果B发生的概率，或者从集合A中查看一个元素，它同时属于集合B的概率。
Probability of B, given A happened
Looking at the elements of set A, the chance that one also belongs to set B
在这里插入图片描述
$P(Positive|“happy")=\cfrac{P(Positive\cap “happy")}{P(“happy")}$

Bayes’ Rule

使用条件概率推导贝叶斯定理
同理：
$P(Positive|“happy")=\cfrac{P(Positive\cap “happy")}{P(“happy")}$
$P(“happy"|Positive)=\cfrac{P( “happy"\cap Positive)}{P(Positive)}$
上面两个式子的分子表示的数量是一样的。
有了以上公式则可以推导贝叶斯定理。
$P(Positive|“happy")=P(“happy"|Positive)\times\cfrac{P(Positive)}{P(“happy")}$
通用形式为：
$P(X|Y)=P(Y|X)\times \cfrac{P(X)}{P(Y)}$

Quiz: Bayes’ Rule Applied

Suppose that in your dataset, 25% of the positive tweets contain the word ‘happy’. You also know that a total of 13% of the tweets in your dataset contain the word ‘happy’, and that 40% of the total number of tweets are positive. You observe the tweet: '‘happy to learn NLP’. What is the probability that this tweet is positive?
A: P(Positive | “happy” ) = 0.77
B: P(Positive | “happy” ) = 0.08
C: P(Positive | “happy” ) = 0.10
D: P(Positive | “happy” ) = 1.92
答案：A

Naïve Bayes Introduction

学会使用Naïve Bayes来进行二分类（使用概率表）

Naïve Bayes for Sentiment Analysis

假设有以下语料：
在这里插入图片描述
按C1W1中提到方法提取词库，并统计正负面词频：

$P(w_i|class)$

将类别中每个单词的频率除以它对应的类别中单词的总数。
例如：对于单词"I"，正面类别的条件概率将是3/13：
$p(I|Pos)=\cfrac{3}{13}=0.24$
对于负面类别中的单词"I"，可以得到3/12：
$p(I|Neg)=\cfrac{3}{12}=0.25$
将以上内容保存为表（because的Neg概率不太对，应该是0）：
在这里插入图片描述
可以看到有很多单词（中性词）在表中的Pos和Neg的值大约相等（Pos≈Neg），例如：I、am、learning、NLP。
这些具有相等概率的单词对情感没有任何贡献。
而单词happy、sad、not的Pos和Neg的值差异很大，这些词对于确定推文的情感具有很大影响，绿色是积极影响，紫色是负面影响。
对于单词because，其 $p(I|Neg)=\cfrac{0}{12}=0$

在这里插入图片描述
这情况在计算贝叶斯概率的时候会出现分母为0的情况，为避免这个情况发生，可以引入平滑处理。

Naïve Bayes

假如有以下推文：
I am happy today; I am learning.
按上面的计算方式得到词表以及其Pos和Neg的概率值：
在这里插入图片描述
使用以下公式计算示例推文的情感：
$\prod_{i=1}^m\cfrac{P(w_i|pos)}{P(w_i|neg)}$
就是计算推文每个单词的第二列比上第三列，然后连乘。
示例推文today不在词表中，忽略，其他单词带入公式：
$\cfrac{0.20}{0.20}\times\cfrac{0.20}{0.20}\times\cfrac{0.14}{0.10}\times\cfrac{0.20}{0.20}\times\cfrac{0.20}{0.20}\times\cfrac{0.10}{0.10}=\cfrac{0.14}{0.10}=1.4>1$
可以看到，中性词对预测结果没有任何作用，最后结果大于1，表示示例推文是正面的。

Laplacian Smoothing

Laplacian Smoothing主要用于以下目的：
避免零概率问题：在统计语言模型中，某些词或词序列可能从未在训练数据中出现过，导致其概率为零。拉普拉斯平滑通过为所有可能的事件分配一个非零概率来解决这个问题。
概率分布估计：拉普拉斯平滑提供了一种简单有效的方法来估计概率分布，即使在数据不完整或有限的情况下。
平滑处理：它通过为所有可能的事件添加一个小的常数（通常是1），来平滑概率分布，从而减少极端概率值的影响。
提高模型的泛化能力：通过避免概率为零的情况，拉普拉斯平滑有助于提高模型对未见数据的泛化能力。
简化计算：拉普拉斯平滑提供了一种简单的方式来调整概率，使得计算和实现相对容易。

Laplacian Smoothing

计算给定类别下一个词的条件概率的表达式是词在语料库中出现的频率：
$P(w_i|class)=\cfrac{freq(w_i,class)}{N_{class}}\quad class\in\{Positive,Negative\}$
其中 $N_{class}$ 是frequency of all words in class
加入平滑项后公式写为：
$P(w_i|class)=\cfrac{freq(w_i,class)+1}{N_{class}+V_{class}}$

$V_{class}$ 是number of unique words in class
分子项+1避免了概率为0的情况，但是会导致总概率不等于1的情况，为了避免这个情况，在分母中加了 $V_{class}$

Introducing $P(w_i|class)$ with smoothing

使用之前的例子。
在这里插入图片描述
上表中共有8个不同单词， $V = 8$
对于单词I则有：
$P(I|Pos)=\cfrac{3+1}{13+8}=0.19\\ P(I|Neg)=\cfrac{3+1}{12+8}=0.20$
同理可以计算出其他单词平滑厚度结果：

虽然结果已经四舍五入，但是两列概率值总和还是为1

Log Likelihood

Ratio of probabilities

根据之前讲的内容，我们知道每个单词可以按其Pos和Neg的值的差异分为三类，正面、负面和中性词。
我们把这个差异用下面公式表示：
在这里插入图片描述
然后，我们可以计算上面概率表中的ratio（吐槽一下，这里because的概率不知道怎么搞的老是变来变去）

在这里插入图片描述
ratio取值与分类的关系很简单：

Naïve Bayes’ inference

下面给出完整的朴素贝叶斯二元分类公式：
$\cfrac{P(pos)}{P(neg)}\prod_{i=1}^m\cfrac{P(w_i|pos)}{P(w_i|neg)}>1\quad class\in\{pos,neg\}\quad w\rightarrow\text{Set of m words in a tweet}$
左边一项其实是先验概率，如果数据集中正负样本差不多，则该项比值为1，可以忽略。这个比率可以看作是模型在没有任何其他信息的情况下，倾向于认为推文是正面或负面情感的初始信念。；
右边一项之前已经推导过。这是条件概率的乘积。对于推文中的每个词 $w_i,i=1,2,\cdots,m$ (m 是推文中的词的数量），这个乘积计算了在正面情感条件下该词出现的概率与在负面情感条件下该词出现的概率的比值。这个乘积考虑了推文中所有词的证据
如果这个乘积大于1，那么模型认为推文更可能是正面情感；如果小于1，则更可能是负面情感。

Log Likelihood, Part1

上面的朴素贝叶斯二元分类公式使用了连乘的形式，对于计算上说，小数的连乘会使得计算出现underflow，根据对数性质：
$\log(a*b)=\log(a)+\log(b)$
可以将连乘转化成为连加的形式，同样对公式求对数得到：
$\log\left(\cfrac{P(pos)}{P(neg)}\prod_{i=1}^m\cfrac{P(w_i|pos)}{P(w_i|neg)}\right)=\log\cfrac{P(pos)}{P(neg)}+\sum_{i=1}^m\log\cfrac{P(w_i|pos)}{P(w_i|neg)}$
也就是：log prior + log likelihood
我们将第一项成为： $\lambda$

Calculating Lambda

根据上面的内容计算实例推文的lambda：
tweet: I am happy because I am learning.
先计算出概率表：
在这里插入图片描述
然后根据公式计算出每个单词的 $\lambda$ ：
$\lambda(w)=\log\cfrac{P(w|pos)}{P(w|neg)}$
例如对于第一个单词：
$\lambda(I)=\log\cfrac{0.05}{0.05}=\log(1)=0$
happy:
$\lambda(happy)=\log\cfrac{0.09}{0.01}=\log(9)=2.2$
以此类推：

可以看到，这里我们也可以根据 $\lambda$ 值来判断正负面和中性词。

Summary

对于正负面、中性词，这里给出两种判断方式（Word sentiment）：
$ratio(w)=\cfrac{P(w|pos)}{P(w|neg)}$
$\lambda(w)=\log\cfrac{P(w|pos)}{P(w|neg)}$
这里要明白，为什么要使用第二种判断方式：避免underflow（下溢）

Log Likelihood, Part 2

有了 $\lambda$ 值，接下来可以计算对数似然，对于以下推文：
I am happy because I am learning.
其每个单词 $\lambda$ 值在上面的图中，整个推文的对数似然值就是做累加：
$0 + 0 + 2.2 + 0 + 0 + 0 + 1.1 = 3.3$
从前面我们可以知道，概率比值以及对数似然的值如何区分正负样本：
在这里插入图片描述

这里的推文对数似然的值为3.3，是一个正面样本。

Training Naïve Bayes

这里不用GD，只需简单五步完成训练模型。

Step 0: Collect and annotate corpus
在这里插入图片描述

Step 1: Preprocess
包括：
Lowercase
Remove punctuation, urls, names
Remove stop words
Stemming
Tokenize sentences
在这里插入图片描述

Step 2: Word count
在这里插入图片描述

Step 3: $P (w ∣ c l a ss)$
这里 $V_{class}=6$
根据公式：
$\cfrac{freq(w,class)+1}{N_{class}+V_{class}}$
计算概率表：
在这里插入图片描述

Step 4: Get lambda
根据公式：
$\lambda(w)=\log\cfrac{P(w|pos)}{P(w|neg)}$
得到：
在这里插入图片描述

Step 5: Get the log prior
估计先验概率，分别计算：
$D_{pos}$ = Number of positive tweets
$D_{neg}$ = Number of negative tweets
$\text{log prior}=\log\cfrac{D_{pos}}{D_{neg}}$
注意：
If dataset is balanced, $D_{pos}=D_{neg}$ and $\text{log prior}=0$ .
对应正负样本不均衡的数据库，先验概率不能忽略

总的来看是六步：

Get or annotate a dataset with positive and negative tweets
Preprocess the tweets: $process\_tweet(tweet) ➞ [w_1 , w_2 , w_3 , ...]$
Compute freq(w, class)，注意要引入拉普拉斯平滑
Get P(w | pos), P(w | neg)
Get λ(w)
Compute log prior = log(P(pos) / P(neg))

Testing Naïve Bayes

Predict using Naïve Bayes

进行之前的步骤，我们完成了词典中每个单词对数似然λ(w)的计算，并形成了字典。
在这里插入图片描述
假设我们数据集中正负样本基本均衡，可以忽略对数先验概率（ $\text{log prior}=0$ ）
对于推文：
[I, pass, the , NLP, interview]
计算其对数似然为：
$-0.01+0.5-0.01+0+\text{log prior}=0.48$
其中interview为未知词，忽略。
也就是是预测值为0.48>0，该推文是正面的。

Testing Naïve Bayes

假设有验证集数据： $X_{val}$ 和标签 $Y_{val}$
计算 $\lambda$ 和log prior，对于未知词要忽略（也就相当于看做是中性词）
计算 $score=predict(X_{val},\lambda,\text{log prior})$
判断推文情感： $p re d = score > 0$
在这里插入图片描述

计算模型正确率：
$\cfrac{1}{m}\sum_{i=1}^m(pred_i==Y_{val_i})$
在这里插入图片描述

Applications of Naïve Bayes

除了Sentiment analysis
Naïve Bayes常见应用还包括：
● Author identification
如果有两个大型文集，分别由不同的作者撰写，可以训练一个模型来识别新文档是由哪一位写的。
例如：你手头上有一些莎士比亚的作品和海明威的作品，你可以计算每个词的Lambda值，以预测个新词被莎士比亚使用的可能性，或者被海明威使用的可能性。
在这里插入图片描述
●Spam filtering:

● Information retrieval
朴素贝叶斯最早的应用之一是在数据库中根据查询中的关键字将文档筛选为相关和不相关的文档。
这里只需要计算文档的对数似然，因为先验是未知的。

在这里插入图片描述
然后根据阈值判断是否查询文档：

● Word disambiguation
假设单词在文中有两种含义，词义消岐可以判断单词在上下文的含义。
在这里插入图片描述
bank有河岸和银行两种意思。

Naïve Bayes Assumptions

朴素贝叶斯是一个非常简单的模型，它不需要设置任何自定义参数，因为它对数据做了一些假设。
● Independence
● Relative frequency in corpus
对于独立性，朴素贝叶斯假设文本中的词语是彼此独立的。看下面例子：
“It is sunny and hot in the Sahara desert.”
单词sunny 和hot 是有关联性的，两个词语在一起可能与其所描述的事物有关，例如：海滩、甜点等。
朴素贝叶斯独立性的假设可能会导致对个别词语的条件概率估计不准确。
在这里插入图片描述
例如上图中，winter的概率明显要高于其他单词，但朴素贝叶斯则认为四个单词概率一样。
另外一个问题是依赖于训练数据集的分布。
理想的数据集中应该包含与随机样本相同比例的积极和消极推文，但是实际的推文中，正面推文要比负面推文出现频率要更高。这样训练出来的模型会被戴上有色眼镜。

Error Analysis

造成预测失败的原因有三种：
● Removing punctuation and stop words
● Word order
● Adversarial attacks

Punctuation

Tweet: My beloved grandmother : (
经过标点处理后：processed_tweet: [belov, grandmoth]
我亲爱的祖母，本来是正面推文，但是后面代表悲伤的emoj被过滤掉了。如果换成感叹号那就不一样。

Removing Words

Tweet: This is not good, because your attitude is not even close to being nice.
去掉停用词后：processed_tweet: [good, attitude, close, nice]

Tweet: I am happy because I do not go.
Tweet: I am not happy because I did go.
上面一个是正面的（I am happy），后面一个是负面的（I am not happy）
否定词和词序会导致预测错误。

Adversarial attacks

主要是Sarcasm, Irony and Euphemisms（讽刺、反讽和委婉语），天才Sheldon都不能李姐！！！
Tweet: This is a ridiculously powerful movie. The plot was gripping and I cried right through until the ending!
processed_tweet: [ridicul, power, movi, plot, grip, cry, end]
原文表达是正面的：这是一部震撼人心的电影。情节扣人心弦，我一直哭到结局！
但处理后的单词却是负面的。

03.C1W2.Sentiment Analysis with Naïve Bayes

目录 Probability and Bayes’ RuleIntroductionProbabilitiesProbability of the intersection Bayes’ RuleConditional ProbabilitiesBayes’ RuleQuiz: Bayes’ Rule Applied Nave Bayes IntroductionNave Bayes for Sentiment Analysis P ( w i ∣ c l a s s ) P(w_i|clas…...

编程日记 2024/7/4 17:26:00

一个强大的分布式锁框架——Lock4j

一、简介 Lock4j是一个分布式锁组件，它提供了多种不同的支持以满足不同性能和环境的需求，基于Spring AOP的声明式和编程式分布式锁，支持RedisTemplate、Redisson、Zookeeper。二、特性 • 简单易用，功能强大，扩展性…...

编程日记 2024/7/4 17:24:58

HarmonyOS - 通过.p7b文件获取fingerprint

1、查询工程所对应的 .p7b 文件通常新工程运行按照需要通过 DevEco Studio 的 Project Structure 勾选 Automatically generate signature 自动生成签名文件，自动生成的 .p7b 文件通常默认在系统用户目录下. 如：C:/Users/zhangsan/.ohos/config/default…...

编程日记 2024/7/4 17:23:57

vue3实现echarts——小demo

版本： 效果： 代码： <template><div class"middle-box"><div class"box-title">检验排名TOP10</div><div class"box-echart" id"chart1" :loading"loading1"&…...

编程日记 2024/7/4 17:22:55

Python 项目依赖离线管理 pip + requirements.txt

背景项目研发环境不支持联网，无法通过常规 pip install 来安装依赖，此时需要在联网设备下载依赖，然后拷贝到离线设备进行本地安装。两台设备的操作系统、Python 版本尽可能一致。离线安装依赖 # 在联网设备上安装项目所需的依赖 # -d …...

编程日记 2024/7/4 17:21:54

jdk动态代理代码实现

1、jdk动态代理代码实现 1、接口 public interface IUserService {void save();void delete();}2、接口实现 Service public class UserServiceImpl implements IUserService {Overridepublic void save() {System.out.println("UserServiceImpl.save");}Override…...

编程日记 2024/7/4 17:20:53

mybatis的xml如何使用java枚举

mybatis的xml如何使用java枚举使用方式 ${com.haier.baseManage.enums.LoganUploadTaskTypeEnumLOG_TYPE.type} 例子 <?xml version"1.0" encoding"UTF-8"?> <!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" &quo…...

编程日记 2024/7/4 17:19:52

SQL Server中设置端口号

在SQL Server中设置端口号可以通过SQL Server配置管理器进行。以下是具体步骤： 使用SQL Server 配置管理器设置端口打开SQL Server配置管理器： 在Windows开始菜单中搜索“SQL Server 配置管理器”，然后打开它。配置SQL Server网络配置&…...

编程日记 2024/7/4 17:16:49

CSS Border(边框)

CSS Border(边框) 引言在网页设计中，边框是增强元素视觉效果和页面布局的重要工具。CSS 提供了丰富的边框样式属性，允许开发者自定义边框的宽度、颜色、样式等。本文将详细介绍 CSS 边框的相关属性，包括基本用法和高级技巧，帮助…...

编程日记 2024/7/4 17:15:48

【鸿蒙学习笔记】@Prop装饰器：父子单向同步

官方文档：Prop装饰器：父子单向同步 [Q&A] Prop装饰器作用 Prop装饰的变量可以和父组件建立单向的同步关系。Prop装饰的变量是可变的，但是变化不会同步回其父组件。 [Q&A] Prop装饰器特点 １・Prop装饰器不能在Entry装饰的…...

编程日记 2024/7/4 17:14:47

设计模式(实战项目)-状态模式

需求背景：存在状态流转的预约单一.数据库设计 CREATE TABLE appointment (id bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT 主键id,appoint_type int(11) NOT NULL COMMENT 预约类型(0:线下查房...),appoint_user_id bigint(20) NOT NULL COMMENT 预约人…...

编程日记 2024/7/4 17:13:46

【python】OpenCV—Color Map

文章目录 cv2.applyColorMapcv2.putText小试牛刀自定义颜色参考学习来自 OpenCV基础（21）使用 OpenCV 中的applyColorMap实现伪着色 cv2.applyColorMap cv2.applyColorMap() 是 OpenCV 中的一个函数，用于将灰度图像或单通道图像应用一个颜色…...

编程日记 2024/7/4 17:12:44

MySQL：表的内连接和外连接、索引

文章目录 1.内连接2.外连接2.1 左外连接2.2 右外连接 3.综合练习4.索引4.1见一见索引4.2 硬件理解4.3 MySQL 与磁盘交互基本单位(软件理解)4.4 (MySQL选择的数据结构)索引的理解4.5 聚簇索引 VS 非聚簇索引 5.索引操作5.1 创建索引5.2 查询索引5.3 删除索引 1.内连接内连接实…...

编程日记 2024/7/4 17:11:43

Chrome备份数据

Chrome备份数据 1、导出谷歌浏览器里的历史记录参考：https://blog.csdn.net/qq_32824605/article/details/127504219 在资源管理器中找到History文件，文件路径： C:\Users\你的电脑用户名\AppData\Local\Google\Chrome\User Data\Default …...

编程日记 2024/7/4 17:10:42

visual studio远程调试

场景一（被远程调试的电脑） 确定系统位数我这里是x64的找到msvsmon.exe msvsmon.exe目录位置解释： “F:\App\VisualStudio\an\Common7\IDE\”是visual studio所在位置、 “Remote Debugger\”是固定位置、 “x64”是系统位数。拼起来就是…...

编程日记 2024/7/4 17:09:41

if name == “main“

在Python中，if __name__ "__main__": 这行代码非常常见，它用于判断当前运行的脚本是否是主程序。这里的 __name__ 是一个特殊变量，当Python文件被直接运行时，__name__ 被自动设置为字符串 "__main__"。但是&…...

编程日记 2024/7/4 17:07:39

数据识别概述

数据识别场景数据识别确实可以分为两种主要类型：直接识别和间接识别（或称为从文本中发现）。下面我将详细解释这两种类型： 直接识别： 定义：直接识别是指直接判断某个数据是否符合特定的标准或条件。应用场…...

编程日记 2024/7/4 17:06:38

pytorch统计学分布

1、pytorch统计学函数 import torcha torch.rand(2,2) print(a) print(torch.sum(a, dim0)) print(torch.mean(a, dim0)) print(torch.prod(a, dim0))print(torch.argmax(a, dim0)) print(torch.argmin(a, dim0)) print(torch.std(a)) print(torch.var(a)) print(torch.median…...

编程日记 2024/7/4 17:05:37

目录

Probability and Bayes’ Rule

Introduction

Probabilities

Probability of the intersection

Bayes’ Rule

Conditional Probabilities

Bayes’ Rule

Quiz: Bayes’ Rule Applied

Naïve Bayes Introduction

Naïve Bayes for Sentiment Analysis

P ( w i ∣ c l a s s ) P(w_i|class) P(wi​∣class)

Naïve Bayes

Laplacian Smoothing

Laplacian Smoothing

Introducing P ( w i ∣ c l a s s ) P(w_i|class) P(wi​∣class) with smoothing

Log Likelihood

Ratio of probabilities

Naïve Bayes’ inference

Log Likelihood, Part1

Calculating Lambda

Summary

Log Likelihood, Part 2

Training Naïve Bayes

Testing Naïve Bayes

Predict using Naïve Bayes

Testing Naïve Bayes

Applications of Naïve Bayes

Naïve Bayes Assumptions

Error Analysis

Punctuation

Removing Words

Adversarial attacks

相关文章：

$P(w_i|class)$

Introducing $P(w_i|class)$ with smoothing