当前位置：首页 > news >正文

【OCR 学习笔记】二值化——全局阈值方法

news 2026/2/10 21:00:18

二值化——全局阈值方法

固定阈值方法
Otsu算法
在OpenCV中的实现
- 固定阈值
- Otsu算法

图像二值化（Image Binarization）是指将像素点的灰度值设为0或255，使图像呈现明显的黑白效果。二值化一方面减少了数据维度，另一方面通过排除原图中噪声带来的干扰，可以凸显有效区域的轮廓结构。OCR效果很大程度上取决于该步骤，高质量的二值图像可以显著提升识别的准确率。目前，二值化的方法主要分为全局阈值方法（Global Binarization）、局部阈值方法（Local Binarization）、基于深度学习的方法和其他方法。

固定阈值方法

该方法对输入图像中的所有像素点统一使用同一个固定阈值。其算法如下：
$g(x,y)=\begin{cases} 255, & 若f(x,y)\geq T \\ 0, & 否则 \end{cases}$

$T$ 为全局阈值

不同的阈值 $T$ 会产生不同的二值化效果。对于不同的输入图像，最佳的阈值 $T$ 也不一样，这也是固定阈值方法的主要缺陷。
于是，解决这一缺陷的相应算法也随之而出现；下面的几种方法均采用了根据输入图像计算最佳阈值的思想。

Otsu算法

Ostu算法¹又称最大类间方差法，由日本学者Nobuyuki Ostu于1979年提出，是一种在自适应的阈值确定方法。
Ostu算法将输入图像分为 $L$ 个灰度级， $n_i$ 表示灰度级为 $i$ 的像素个数，则像素总数 $N=n_1+n_2+ \cdots +n_L$ 。为了简化讨论，这里使用归一化的灰度直方图，并将其视为输入图像的概率分布：
$p_i=n_i/N, p_i>0, \sum_{i=1}^{L}p_i=1$
现假设在第 $k$ 个灰度级设置阈值，将图像分为 $C_0$ 和 $C_1$ （背景和目标物体）， $C_0$ 表示灰度级为 $\cdots, k]$ 的像素点， $C_1$ 表示灰度级为 $\cdots, L]$ 的像素点，那么两类出现的概率以及类内灰度级的均值分别为：
$\omega_0=Pr(C_0)=\sum_{i=1}^{k}p_i=\omega(k) \\ \omega_1=Pr(C_1)=\sum_{i=k+1}^{L}p_i=1-\omega(k) \\ \mu_0=\sum_{i=1}^{k}i Pr(i|C_0)=\sum_{i=1}^{k}ip_i/\omega_0=\mu(k)/\omega(k) \\ \mu_1=\sum_{i=k+1}^{L}i Pr(i|C_1)=\sum_{i=k+1}^{k}ip_i/\omega_1=\frac{\mu_T-\mu(k)}{1-\omega(k)}$

$\omega(k)$ 和 $\mu(k)$ 分别为灰度级从1到 $k$ 的累计出现概率和平均灰度级;
$\mu_T$ 为整张图像的平均灰度级。

容易证得，对于任意 $k$ 值均有：
$\omega_0\mu_0+\omega_1\mu_1=\mu_T, \omega_0+\omega_1=1$
这两类得类内方差也可以算得：
$\sigma_0^2=\sum_{i=1}^{k}(i-\mu_0)^2Pr(i|C_0)=\sum_{i=1}^{k}(i-\mu_0)^2p_i/\omega_0 \\ \sigma_1^2=\sum_{i=k+1}^{L}(i-\mu_1)^2Pr(i|C_0)=\sum_{i=k+1}^{L}(i-\mu_1)^2p_i/\omega_1$
为了评价阈值 $k$ 的好坏，需要引入判别式：
$\lambda=\sigma_B^2/\sigma_W^2, \kappa=\sigma_T^2/\sigma_W^2, \eta=\sigma_B^2/\sigma_T^2 \qquad (1)$

其中

$\sigma_W^2=\omega_0\sigma_0^2+\omega_1\sigma_1^2$ ，即类内方差
$\sigma_B^2=\omega_0(\mu_0-\mu_T)^2+\omega(\mu_1-\mu_T)^2=\omega_0\omega_1(\mu_1-\mu_0)^2$ ，即类间方差
$\sigma_T^2=\sum_{i=1}^{L}(i-\mu_T)^2p_i$ ，即灰度级的总方差

由于 $\sigma_W^2+\sigma_B^2=\sigma_T^2$ 始终成立，而对同一张图片来说 $\sigma_T^2$ 是确定的，所以 $\sigma_W^2$ 和 $\sigma_B^2$ ，一个越大，另一个就会越小。这样的话，(1)式中的三个目标值 $\lambda, \kappa, \eta$ 就总是同向运动的。
但是从计算简单程度上来说，因为 $\sigma_T^2$ 与 $k$ 无关，且 $\sigma_B^2$ 只涉及均值的运算。因此， $\eta$ 是判别 $k$ 取值好坏的最简单的衡量标准：
$\eta = \sigma_B^2(k)/\sigma_T^2$
因此，最佳的 $k$ 值选择（ $k^*$ ）满足：
$\sigma_B^2(k^*)=\max_{1\leq k \leq L}\sigma_B^2(k)$

在OpenCV中的实现

固定阈值

固定阈值可以在OpenCV中用adptiveThreshold()函数来实现，其函数原型如下：

void cv::adptiveThreshold(	InputArray	src,OutputArray	dst,double		maxValue,int			adaptiveMethod,int			thresholdType,int			blockSize,double		C)

将其中的第5个参数thresholdType指定为THRESH_BINARY就是固定阈值方法。

Otsu算法

Otsu算法可以在OpenCV中用threshold()函数来实现，其函数原型如下：

double cv::threshold(	InputArray	src,OutputArray	dst,double		thresh,double		maxval,int			type)

将其中的第5个参数type指定为THRESH_OTSU就是Otsu算法。
这个函数也可以用来通过将该参数指定为THRESH_BINARY来使用固定阈值的方法。
以下是Otsu算法的一个结果示例(上：原图，中：直方图，下：二值化后的结果）：
Otsu算法示例
直方图中的红色竖线为Otsu算法找出的最佳阈值。

Otsu N. A Threshold Selection Method From Gray-Level Histogram. IEEE Transactions On Systems Man Cybernetics, 1979, 9(1): 62-66. ↩︎

【OCR 学习笔记】二值化——全局阈值方法

二值化——全局阈值方法

固定阈值方法

Otsu算法

在OpenCV中的实现

固定阈值

Otsu算法

相关文章：

【OCR 学习笔记】二值化——全局阈值方法

Java - IDEA开发

Oracle（62）什么是内存优化表（In-Memory Table）？

#window家庭版安装hyper-v#

【云原生】Pass容器研发基础——汇总篇

【Py/Java/C++三种语言详解】LeetCode743、网络延迟时间【单源最短路问题Djikstra算法】

交替输出

JS（三）——更改html内数据

CSS小玩意儿：文字适配背景

C++:平衡二叉搜索树之红黑树

CentOS 7 系统优化

扫雷游戏——附源代码

Vue3列表（List）

HarmonyOS NEXT - Navigation组件封装BaseNavigation

浅看MySQL数据库

Pytorch常用训练套路框架(CPU)

C++ | Leetcode C++题解之第338题比特位计数

智慧校园云平台电子班牌系统源码，智慧教育一体化云解决方案

数据库系统第17节数据仓库案例赏析

硬件面试经典 100 题（71~90 题）

接口测试中缓存处理策略

K8S认证|CKS题库+答案| 11. AppArmor

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

java 实现excel文件转pdf | 无水印 | 无限制

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

智能AI电话机器人系统的识别能力现状与发展水平

Netty从入门到进阶（二）

【LeetCode】3309. 连接二进制表示可形成的最大数值（递归|回溯|位运算）

解析奥地利 XARION激光超声检测系统：无膜光学麦克风 + 无耦合剂的技术协同优势及多元应用

uniapp 小程序学习（一）