数字图像处理考研考点(持续更新)
一、数字图像基本概念
1、人眼视觉特性
(1)眼睛上有两类光感受器:锥状体和杆状体
锥状体(锥细胞):约 700 万个,对颜色高度敏感,每个锥状体都连接到神经末梢,人可以充分地分辨图像细节。锥细胞视觉称为明视觉、 亮光视觉、白昼视觉、彩色视觉。
杆状体(柱细胞):约 1 亿 4000 万个,分辨率比较低,对低照度较敏感,它们没有色彩感觉,不感受颜色,几个杆状体才连到一个神经末梢,所以不感知事物的细节,只感知一般的总体图像,主要提供视野的整体视像。柱细胞视觉称为暗视觉、微光视觉、单色夜视。
(2)由于数字图像以客观亮度显示图像,人眼以主观亮度感受取得视觉,所以人眼的亮度适应性影响了图像处理的结果。
(3)人眼的视觉系统能适应的光亮度等级:最强的光照强度是最弱的
(4)亮度适应现象:人眼并不能同时在整个范围内工作,而是利用改变灵敏度来实现大的动态范围内的变动;
(5)当平均亮度适中时,能分辨的最大亮度和最小亮度之比为 1000:1;当平均亮度很低时,这个比值只有 10:1;
(6)当背景光保持恒定时,改变其他光源亮度,从不能察觉到可察觉,一般观察者可辨别 12 到 24 级不同强度的变化;
(7)主观亮度是进入人眼的光强度的对数函数;
(8)人眼视觉系统对亮度的对比度敏感而非对亮度本身敏感;
(9)两种现象表明:感知亮度不是实际灰度的简单函数(用来回答:人眼出入亮度差别很大的环境为什么要一个缓冲过程?)
马赫带效应:视觉系统往往会在不同灰度区域的边界处出现“下冲”或“上冲”现象;
同时对比:即一个区域的感知亮度并不只是取决于其灰度(背景的颜色会影响我们所感知的颜色,黑中白更亮,白中黑更暗)
2、图像数字化
(1)由模拟图像到数字图像的过程
目的:便于计算机处理
方法:空间采样与幅度量化
采样:是将在空间上连续的图像转换成离散的采样点(即像素)集的操作。即:空间坐标的离散化
量化:把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。即:灰度的离散化。
(2)坐标
(3)图像类型
二值图像:1bit(1位);
灰度图像:8bit(1B/一个字节);
彩色图像:3*8bit;
(4)图像分辨率
1k=1920*1080
2k=2560*1440
4k=3840*2160;4k=4096*2160
(5)边界处理(补零;重复;对称;循环)
补零:补一圈0,有黑边
重复:重复外边界的值来扩展图像
对称(镜像):通过镜像反射外边界的值
循环:在图像边界外围将图像看成二维周期函数的一个周期来扩展(比如说处理图像最下面边缘,结构元十字中心对齐后下面一行缺了,就要吧最上面边缘那行像素抄过去)
二、图像空间域处理:灰度变换与空间滤波
灰度变换在图像的单个像素上操作,主要以对比度和阈值处理为目的;
空间滤波设计改善性能的操作,如通过图像中每个像素的邻域处理来锐化图像
1、灰度变换函数(线性变换;对数变换;指数变换)
线性变换:反转和恒等变换
对数变换:对数和反对数变换
指数变换:n次幂和n次根变换
(1)图像反转
灰度级范围为[0,L-1],s=L−1−r
类似于照片底片,可用于增强图像暗色区域中的白色或灰色细节,暗色区域的尺寸很大时这种增强效果更好。(负片相片)
(2)对数变换
s = c log(1+r),c是一个常数,并假设r≥0
这个变换将输入中范围较窄的低灰度值映射为输出中范围较宽的灰度级。我们使用这类变换来扩展图像中的暗像素值,同时压缩高灰度级值。(反对数(指数)变换的功能正好相反)
(3)幂律(伽马)变换
s=c r的γ次方,c和γ是正常数
幂律曲线用分数值γ将较窄范围的暗输入值映射为较宽范围的输出值,将高输人值映射为较窄范围的输出值。改变γ值就能得到一族变换曲线。γ>1时生成的曲线与γ<1时生成的曲线效果正好相反。c=γ=1时,简化为恒等变换。
当γ<1 时,该变换将低灰度值(暗值)进行拉伸,例如,γ=0.4 时,该变换将动态范围从[0,L/5]扩展到[0.L/2]。
当γ>1 时,该变换将高灰度值(亮值)进行拉伸。
除伽马校正外,幂律变换对于普通目的的对比度处理也是有用的。
2、对比度拉伸(分段线性变换函数)
通过将k以下的灰度级变暗,并将高于k的灰度级变亮,产生比原图像对比度更高的一幅图像。小于k值的r值,减小(变暗)s的值,倾向于黑色;大于k值的r值,增大(变亮)s的值,倾向于白色。注意观察灰度值是如何映射以便得到对应的s值的。在图 3.2(b)所示的极限情况下,T(r)产生一幅二级(二值)图像。这种形式的映射称为阈值处理函数。
光照不足、成像传感器的动态范围偏小、图像获取过程中镜头孔径的设置错误等,都可能产生低对比度图像。对比度拉伸可以扩展图像中的灰度级范围,使其覆盖记录介质或显示设备的整个理想灰度范围。
3、直方图概念
灰度直方图是表示一幅图像灰度分布情况的统计表。灰度级的直方图描述了一幅图像的概貌。
直方图:
h() =
其中: ∈[0,L-1]——灰度级;
—灰度级为
的像素个数
归一化直方图:
其中:n:像素总数(MN),(
)为原始图像灰度分布的概率密度函数
如果将归一化到[0 1]之间,则
可以看作区间[0 1]的随机变量
图(a)的大多数像素灰度值取在较暗的区域,图像偏暗。图(b)图像的像素灰度值集中在亮区,因此图像的特性偏亮。图(c)图像的像素灰度值集中在某个较小的范围内,信息都集中在一个小灰度范围,图像对比度较差。
直方图反映了图像的清晰程度,当直方图均匀分布时,图像最清晰。由此可以利用直方图来达到使图像清晰的目的。
4、直方图均衡
将原始图像的直方图变换为均匀分布的形式,从而增加像素灰度值的动态范围,达到增强提高图像整体对比度的效果。指图像经灰度变换后,使灰度的概率密度分布变为常数,即均匀分布。
直方图均衡化是将原图像的直方图通过变换函数修正为均匀的直方图,然后按均衡直方图修正原图像。经图像均衡化处理后,图像的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图像看起来就更清晰了。
首先假定连续灰度级的情况,推导直方图均衡化变换公式,令 r 代表灰度级,P(r)为概率密度函数。r 值己归一化,最大灰度值为 1。
直方图均衡化处理的计算步骤:
直方图均衡化实质上是减少图像的灰度级以换取对比度的加大。在均衡过程中,原来的直方图上频数较小的灰度级被归入很少几个或一个灰度级内,故得不到增强。如若这些灰度级所构成的图像细节比较重要,则需采用局部区域直方图均衡。
注意:
因为直方图是近似的概率密度函数,所以用离散灰度级进行变换时很少得到完全平坦的结果;
变换后灰度级减少,即出现灰度“简并”现象,造成一些灰度层次的损失。
优点:直方图均衡能自动增强整个图像的对比度
缺点:具体的增强效果不易控制,处理的结果总是得到全局均衡化的直方图。不能够用于交互方式的图像增强应用,因为直方图均衡化只能产生唯一一个结果。
ps:取整扩展和上图中的四舍五入计算结果是一样的,用哪个都可以
直方图规定化 vs 直方图均衡化
直方图均衡化:自动增强;效果不易控制:总得到全图增强的结果
直方图规定化:有选择地增强;须给定需要的直方图:特定增强的结果
5、图像空间滤波概念及实现
利用像素本身以及其邻域像素的灰度关系进行增强的方法常称为滤波。
在图像空间借助模板进行邻域操作。
图像的平滑、锐化都是利用掩模操作来完成的。通过掩模操作实现一种邻域运算,待处理像素点的结果由邻域的图像像素以及相应的与邻域有相同维数的子图像得到。这些子图像被称为滤波器、掩模、核、模板或窗口;
掩模运算的数学含义是卷积(或互相关)运算;
掩模子图像中的值是系数值,而不是灰度值;
都是利用模板卷积运算,
空间滤波步骤:
①将模板在图中漫游,并将模板中心与图中某个像素位置重合
②将模拟上系数与模板下对应像素相乘
③将所有乘积相加
④将和(模板的输出响应)赋给图中对应模板中心位置的像素
根据技术分类:线性滤波(如邻域平均);非线性滤波(如中值滤波)
根据功能分类:平滑滤波(减弱和消除高频分量;使图像灰度平滑,模糊,消除噪声)锐化滤波(减弱和消除低频分量,使图像反差增大增强边缘的细节)
平滑空间滤波器
其作用有两个:①消除或减少噪声,改善图像质量;②模糊图像,使图像看起来柔和自然。
平滑滤波器分类:
线性滤波(和为1,均为正数) ——邻域平均、加权平均
邻域平均
实现过程为:①模板游走整个图像;②将模板下对应的灰度值相加,求平均值;③用均值代替邻域中心像素 f(x,y)
缺点:当模板尺寸增大时,对噪声消除的效果增强,但图像变得模糊,即边缘细节减少
加权平均
一般认为:离模板中心近的像素对滤波的贡献大。所以中心系数大,而周围系数小。
系数的实用取值:最外周边系数为 1,内部系数成正比例增加,中间系数最大。
为了保持平滑处理后的图像的平均值不变,模板内各元素之和为 1。有时,为了突出原点(i,j)本身的重要性,以便尽量抑制图像中的模糊效应,在模板中心和较近的元素,可以赋以大的加权值(如模板 3)。
可见,3×3 均值滤波处理是以图像模糊为代价来换取噪声的减小的,且面积(即模板大小)越大,噪声减少越显著。如果 f(i,j)是噪声点,其邻近像素灰度与之相差很大,一旦用简单邻域平均法,即邻近像素的平均值来置换它,能明显地将噪声点压制下去,使邻域中灰度接近均匀,起到平滑灰度的作用。因此,邻域平均法具有显著地平滑噪声的效果,邻域平均法是一种平滑技术。
作用:前面的邻域平滑滤波在消除噪声的同时,会将图像中的一些细节变模糊,如果既要消除噪声,又要保持图像的细节(不模糊)。
中值滤波(椒盐噪声)
非线性滤波器,它的响应基于图像滤波器包围的图像区域中像素的排序,再由统计排序结果决定的值代替中心像素的值,又称序统计滤波器。
算法:先将掩模窗口内欲求的像素及其领域的像素值排序(升序或降序),确定出中值,并将中值赋予为该像素点灰度值。
主要功能:使拥有不同灰度的点看起来更接近于它的邻近值。
主要用途:去除“椒盐”噪声。
百分比滤波器:最大值滤波器(椒噪声)、最小值滤波器(盐噪声)
中点滤波器:最大灰度值和最小灰度值的均值(高斯和均匀分布随机噪声)
均值、中值对比
均值滤波的特点:使数字信号变“平坦”,可在图像中消除或抑制噪声,同时,图像中景物边缘也会不同程度地变得模糊。
中值滤波的特点:可以消除杂散噪声点而不会或较小程度地造成边缘模糊。
邻域平均与中值滤波的比较:邻域平均滤波器在去掉孤立脉冲时模糊了图像,中值滤波器在去掉孤立脉冲时不影响图像。但是,中值滤波不能去掉服从高斯分布的噪音。
锐化空间滤波器
利用计算机进行图像锐化处理有两个目的:一是与柔化处理相反,增强图像边缘,使模糊的图像变得更加清晰起来,颜色变得鲜明突出,图像的质量有所改善,产生更适合人观察和识别的图像;二是希望经过锐化处理,目标物体的边缘鲜明,以便于计算机提取目标物体边界、对图像进行分割、目标区域识别、区域形状提取等,为图像理解和分析打下基础。
图像边缘锐化的基本方法:微分运算;梯度锐化;边缘检测
图像平滑是通过削弱高频成分突出低频成分来达到滤除噪声、模糊图像的目的。锐化与平滑相反,主要是加强高频或者减弱低频,图像锐化加强了细节和边缘,对图像有去模糊的作用。
从数学上看,图像的模糊相当于图像被平均或积分,为实现图像的锐化,必需用它的反运算“微分”一加强高频分量作用,使轮廓清晰。
拉普拉斯算子——基于二阶微分的图像增强
和为0,有正有负
拉普拉斯微分算子强调图像中灰度的突变,弱化灰度慢变化的区域。这将产生一幅把浅灰色边线、突变点叠加到暗背景中的图像
将原始图像和拉普拉斯图像叠加在-起的简单方法可以保护拉普拉斯锐化处理的效果,同时又能复原背景信息。因此拉普拉斯算子用于图像增强的基本方法如下:
微分(梯度算子)原理
其导数在边缘方向取得极值
最常用的微分方法是梯度法。设图像函数为 f (xy),它的梯度(Gradient)是一个向量,定义为:
在(x,y)点处的梯度,方向是f(x,y)在这点变化率最大的方向,而其长度(记G[f (x,y)])则 等 于 f(x,y)的 最 大 变 化 率 , 即
𝐺[𝑓(𝑥,𝑦)] =
典型梯度算法
罗伯茨(Roberts) 梯度算法
上述二算法运算较费时。为更适合计算机实现,实际运算时使用的数字梯度采用绝对差分算法:
梯度的近似值和相邻像素的灰度差成正比,因此,在图像变化缓慢区域,其值很小,而在线条轮廓等变化快的部分其值很大,梯度运算可使细节清晰,从而达到锐化的目的。
某像素上的梯度值是该像素与相邻像素的灰度差值的单调递增函数。
①图像轮廓上,像素灰度有陡然变化,梯度值很大。
②图像灰度变化平缓区域,梯度值很小。
③等灰度区域,梯度值为零。
Robert 交叉梯度算子
Roberts 边缘算子采用的是对角方向相邻的两个像素之差。从图像处理的实际效果来看,边缘定位准,对噪声敏感。
梯度计算由两个模板组成,第一个求得梯度的第一项,第二个求得梯度的第二项,然后求和,得到梯度。
两个模板称为 Roberts 交叉梯度算子:(水平,垂直)
Sobel 梯度算子
3x3 的梯度模板:
Sobel 边缘检测算子是先做成加权平均,再微分,然后求梯度
使用权重 2 的目的:突出中心点的作用以达到平滑的目的。
加权平均,对靠近中心(x,y)的点权值为对角线方向邻点的权值的 2 倍。
有时为了检测特定方向上的边缘也采用特殊的方向算子,如检测 45°或135°边缘的 Sobel 方向算子
Prewitt 梯度算子
3x3 的梯度模板
Prewitt 边缘检测算子为:
Prewittl 边缘检测效果图:
微分算子小结:
一阶微分算子(梯度算子)能用来:①突出小缺陷:②去除慢变化背景;
二阶微分算子(Laplace 算子)能用来:①增强灰度突变处的对比度;
注:对 NxN 数字图像,不可能在最后一行(x=N)和最后一列(y=N)像素上计算梯度值。一种补救办法:用前一行(x=N-1)和前一列(y=N-1)对应像素的梯度值。
三、图像频率域处理:傅里叶变换与频率滤波
1、傅里叶级数与傅里叶变换
欧拉公式:
傅里叶级数:
傅里叶变换:
傅里叶反变换:
利用欧拉公式变形:
冲激串:
冲激串的傅里叶变换:
卷积:
上面卷积的傅里叶变换: 在上式使用:
可得(其中H(
)是h(t)的傅里叶变换):
如果将 t 的域称为空间域,将的域称为频率域,那么上式告诉我们,空间域中两个函数的卷积的傅里叶变换,等于频率域中两个函数的傅里叶变换的乘积。反过来如果有两个变换的乘积,那么可以通过计算傅里叶反变换得到空间域的卷积。
取样后的函数:
取样后的函数的傅里叶变换:
冲激串的傅里叶变换:
由一维卷积的定义,可直接得到F()和S(
)的卷积:
最后一步由冲激的取样性质得到:
取样定理:
一级离散傅里叶变换
正变换(DFT):
反变换:
x和y表示图像坐标变量;u和v表示频率变量
二维离散傅里叶变换
傅里叶频谱和相角
离散傅里叶变换的重要性质
(1)可分离性
(2)平移性
(3)周期性
(4)共轭对称性
(5)旋转不变性
(6)比例性
(7)旋转性
(8)卷积定理
2、取样定理的时域表示与频域表示
时域采样定理(香农定理):
对于频谱受限的信号x(t),如果其最高频率分量为,为了保留原信号的全部信息,或能无失真地恢复原信号,在通过采样得到离散信号时,其采样频率应满足
≥2
。通常把最低允许的采样频率
=2
称为奈奎斯特(Nyquist)频率。
频域采样定理:
对于一个长度为2的时限信号,为了能够从频域样本集合完全恢复原信号的频谱,其频域的采样间隔必须满足
≤
/
。
3、图像频域滤波
频率域中的滤波过程如下:首先修改傅里叶变换以达到特定目的,然后计算 IDFT(反变换)返回到空间域。
频域滤波基本步骤:
平滑(低通)滤波器(理想低通、巴特沃斯低通、高斯低通)
图像的平滑除了在空间域中进行外,也可以在频率域中进行。图像中,噪声或者物体边缘处灰度的变化剧烈,对应频谱的高频分量,物体内部灰度分布均匀,变化平稳,对应频谱的低频分量。为了去除噪声改善图像质量,可采用低通滤波器来去除或削弱抑制高频成分,通过低频成分,后再进行傅立叶逆变换获得滤波图像,从而实现消除或抑制噪声,达到平滑图像的目的。
能够利用低通滤波器去除噪声,处理图像的主要原因:
①90%以上的功率(能量)集中在低频成分中;
②随滤波器半径的增加,越来越少的功率被滤除掉,使模糊减弱。
理想低通滤波器(ILPF)振铃!!!
优点:在截频半径为 D0 的圆内的所有频率都能没有衰减无损地通过滤波器,在此截频半径圆之外的所有频率分量完全被衰减掉。
缺点:理想低通滤波器平滑处理的概率清晰,但在处理过程中会产生较严重的模糊和振铃现象,D0 越小,这种现象越严重。
巴特沃斯低通滤波器(BLPF)
巴特沃斯低通滤波器又被称为最大平坦滤波器。它与理想低通滤波器不同,它的特性是连续性衰减,H(u,v)不是陡峭的截止特性,它的通带和阻带之间无明显得不连续性,有一个平滑过渡带,无陡峭变化。通常把 H(u,v)下降到某一值得那点定位截止频率 。它的尾部会包含大量的高频成分。与理想低通滤波器的处理结果相比,采用该滤波器滤波处理的图像,在抑制噪声的同时,图像边缘的模糊程度大大减小,没有振铃效应产生。
通常,BLPF 的平滑效果好于 ILPF(振铃现象)。
注:对于 BLPF 滤波器,n=2 是临界值,当 n 大于 2 时,会有明显振铃现象。
高斯低通滤波器(GLPF)
采 用 该 滤 波 器 滤 波 在 抑 制 噪 声 的 同 时 , 图 像 边 缘 的 模 糊 程 度 较 用Butterworth 滤波产生的大些,无明显的振铃效应。
低通滤波器举例—模糊,平滑
字符识别:通过模糊图像,桥接断裂字符的裂缝
印刷和出版业:从尖锐的原始图像产生平滑、柔和的外观,如人脸,减少皮肤细纹的锐化程度和小斑点
处理卫星和航空图像:尽可能模糊细节,而保留大的可识别特征。低通滤波通过消除不重要的特征来简化感兴趣特征的分析
锐化(高通)滤波器增强图像(理想高通、巴特沃斯高通、高斯高通)
图像锐化目的:加强图像轮廓,使图像看起来比较清晰。
图像中的边缘和线条等细节对应图像中的高频成分,然而图象只有很少的能量集中在高频,所以需要增强这些细节。
锐化就是进行频域高通滤波,为了消除模糊,突出边缘。使图像低频成分削弱,高频加强,边缘或线条变得更清楚,从而实现了图像的锐化。
使高频通过而使低频衰减的滤波器:
①被高通滤波过的图像比原始图像少了灰度级的平滑过渡而突出了边缘等细节部分
②类比空间域的梯度算子、拉普拉斯算子
高通与低通对称,对照前面说的低通滤波器,高通滤波器转移函数
四、图像复原
1、图像复原模型
2、常用噪声模型
高斯噪声
瑞利噪声
伽马(爱尔兰)噪声
指数分布噪声
均匀分布噪声
脉冲噪声(椒盐噪声)
几种噪声的运用
高斯噪声用于描述源于电子电路噪声和由低照明度或者高温带来的传感器噪声;
瑞利噪声用于在图像范围内特征化噪声现象;
伽马分布和指数分布用于描述激光成像噪声;
均匀密度分布作为模拟随机数产生器的基础;
脉冲噪声用于描述成像中的短暂停留(例如错误的开关操作);
3、图像去噪
噪声均值滤波(算术均值滤波器、几何均值滤波器、谐波均值滤波器、逆谐波均值滤波器)
算术均值滤波器
几何均值滤波器
谐波均值滤波器(盐、高斯噪声)
逆谐波均值滤波器(Q为正:胡椒;Q为负:盐)
统计排序滤波器(中值滤波器、最大值滤波器、最小值滤波器、中点滤波器、修正后的阿尔法均值滤波器)
中值滤波器
最大值滤波器(胡椒)
最小值滤波器(盐)
中点滤波器(高斯、均匀)
修正后的阿尔法均值滤波器
去噪滤波器总结
高斯噪声——平均滤波、高斯滤波、中点滤波
均匀噪声——均值滤波、中点滤波
椒盐噪声——中值滤波
胡椒噪声——最大值滤波器
盐噪声——最小值滤波器
五、图像几何变换与配准
图像的几何变换包括了图像的形状变换和图像的位置变换。
图像的形状变换是指图像的放大、缩小与错切。
图像的位置变换是指图像的平移、镜像与旋转。
图像的仿射变换是采用通用的数学影射变换公式,来表示几何变换。
图像的几何变换不改变像素的值,只改变像素的位置。
1、几何变换原理
几何变换改变图像中像素的空间排列,这些变换通常称为橡皮膜变换,因为它们类似于在一块橡皮膜上“打印”图像,然后根据预定义的一组规则来拉伸或收缩橡皮膜。
几何变换可分为:坐标的空间变换、灰度插值(即为空间变换后的像素赋灰度值)
坐标变换可表示为:
2、图像的仿射变换及表示
详解可参考以下文章:
【数字图像处理】第4章 图像的几何变换_数字图像处理对图片的几何处理-CSDN博客
矩阵-图形学:Transform矩阵(3维 2维) 平移,旋转,缩放_游戏逆向|游戏安全|yxfzedu.com
图像算法原理与实践——图像校正之 几何变换 - 知乎
3、图像的投影变换及表示
详解可参考下面的文章:
计算机图形学入门05:投影变换-CSDN博客
基本图像变换:线性变换,仿射变换,投影变换_线性变换有哪几种-CSDN博客
10-geometry-transformation-notes.pdf
4、图像配准问题
配准是指将两张或多张图像对齐的过程。对于平面图像的配准,通常使用的是仿射变换或透视变换。
仿射变换:适用于平移、旋转、缩放和剪切,矩阵有6个自由度,需要至少3对匹配点(提供6个方程)。
透视变换:适用于更复杂的视角变化,矩阵有8个自由度,需要至少4对匹配点(提供8个方程)。
5、几何变换中的内插处理:最近邻内插、双线性内插、双三次插值
内插是用已知数据来估计未知位置的值的过程
最近邻内插
将原图中最近邻的灰度赋给了每个位置。
在原图像中寻找最接近的像素,并把该像素的灰度赋给加想要创建大小的网格中的新像素。当我们完成对网格中覆盖的所有点的灰度赋值后,就把图像扩展到原来规定的大小,得到放大后的图像。
本方法不常用是因为会产生不希望的人为缺陷的倾向(如某些直边缘的严重失真)。
双线性内插
报据投影点周围4个相邻像素灰度值,按权重计算输出像素灰度值
详情可参考以下文章:
一篇文章为你讲透双线性插值 - 知乎
双三次插值
它包括16个最近邻点,4个方程组
六、彩色图像处理
1、颜色模型、颜色通道
RGB 彩色模型(面向硬件)
红绿蓝,针对彩色显示器和彩色摄像机
HSI 模型
色调、饱和度、亮度,针对人们描述和解释颜色的方式,它能够解除图像中颜色和灰度级信息的联系
CMY 和 CMYK 彩色空间
青、深红、黄、黑,针对彩色打印
设备无关彩色模型
2、彩色分割
七、图像形态学图像处理
二值图像:膨胀与腐蚀、开闭运算、形态学重建
腐蚀
概念
每当在目标图像 A 中找到一个与结构元素 B 相同的子图像时,就把该子图像中与 B 的原点位置对应的那个像素位置标注为 1,图像 A上标注出的所有这样的像素组成的集合,即为腐蚀运算的结果,简而言之,腐蚀运算的实质就是在目标图像中标出那些与结构元素相同的子图像的原点位置的像素。
注意,结构元素中的原点位置可以不为 1,但要求目标图像中的子图像与结构元素 B 的原点对应的那个位置的像素值是 1。
当结构元素在目标图像上平移时,结构元素中的任何元素不能超出目标图像的范围。
结构元素形状对腐蚀运算结果的影响
腐蚀运算的结果不仅与结构元素的形状(矩形、圆形、菱形等)选取有关,而且还与原点位置的选取有关。
腐蚀运算在物体识别中的应用
膨胀
概念
先对结构元素 B 做关于其原点的反射得到反射集合,然后再在目标图像 A 上将
平移 y,则那些
平移后与目标图像 A 至少有 1 个非零公共元素相交时对应的
的原点位置所组成的集合,就是膨胀运算的结果。
膨胀运算的基本过程是:
(1)求结构元素 B 关于其原点的反射集合
(2)每当结构元素B在目标图像 A 上平移后,结构元素与其覆盖的子图像中至少有一个元素相交时,就将目标图像中与结构元素
的原点对应的那个位置的像素值置为“1”,否则置为 0
注意:
(1)当结构元素中原点位置的值是 0 时,仍把它看作是 0; 而不再把它看作是 1。
(2)当结构元素在目标图像上平移时,允许结构元素中的非原点像素超出目标图像范围。
结构元素形状对膨胀运算结果的影响
当目标图像不变,但所给的结构元素的形状改变时;或结构元素的形状不变,而其原点位置改变时,膨胀运算的结果会发生改变。
膨胀运算的应用
腐蚀运算与膨胀运算的对偶性
也即对目标图像的膨胀运算,相当于对图像背景的腐蚀运算操作;对目标图像的腐蚀运算,相当于对图像背景的膨胀运算操作。
开运算(先腐蚀后膨胀)
闭运算(先膨胀后腐蚀)
开运算与闭运算对比
开运算通常平滑物体的轮廓、断开狭窄的狭颈、消除细长的突出物;闭运算同样平滑轮廓,但与开运算相反,它通常弥合狭窄的断裂和细长的沟壑,消除小孔,并填补轮廓中的缝隙。
开运算与闭运算的对偶性
闭运算可以使物体的轮廓线变得光滑,闭运算具有磨光物体内边界的作用,而开运算具有磨光图像外边界的作用。
形态学重建
灰度图像:膨胀与腐蚀、开闭运算、形态学重建
膨胀
取模版内值最大的那个(不平坦结构元还要与模版的值相加再比较)
效果:被暗区包围的亮区,区域变大,而被亮区包围的暗区,区域变小
腐蚀
取模版内值最小的那个(不平坦结构元还要与版的值相减再比较)
效果:原始图像中,被暗色域包围的亮色域的区域大小会收缩,而被亮色域包围的暗色域的区域大小会扩张
开运算
效果:去除局部高亮区域
闭运算
效果:去除局部暗淡区域(“阴闭”)
形态学重建
详解请参考以下文章:
8、灰度图的腐蚀、膨胀、开闭运算、顶帽底帽_灰度腐蚀-CSDN博客形态学之灰度形态学-CSDN博客
相关文章:

数字图像处理考研考点(持续更新)
一、数字图像基本概念 1、人眼视觉特性 (1)眼睛上有两类光感受器:锥状体和杆状体 锥状体(锥细胞):约 700 万个,对颜色高度敏感,每个锥状体都连接到神经末梢,人可以充分地分辨图像细节。锥细胞…...

Spring Cloud Alibaba:一站式微服务解决方案
Spring Cloud Alibaba介绍 在当今的软件开发领域,微服务架构因其灵活性、可扩展性和独立性等优势而备受青睐。Spring Cloud Alibaba 作为一款强大的一站式微服务解决方案,为开发者提供了丰富的工具和组件,帮助他们轻松构建和管理复杂的微服务…...
ubuntu16.04部署dify教程
文章目录 1、克隆 Dify 源代码至本地环境2、加速Dify镜像文件下载3、启动 Dify4、访问 Dify5、更新 Dify6、常见问题及解决方案(1)容器restarting(2)日志文件上限(3)重置管理员密码(4࿰…...

JavaWeb文件上传
文件上传总览 文件上传主要是指将本地文件(包括但不限于图片、视频、音频等)上传到服务器,提供其他用户浏览或下载的过程。在日常生活中,我们在很多情况下都需要使用文件上传功能,比如:发微博、发朋友圈等…...

软件工程——期末复习(3)
一、题目类(老师重点提到过的题目) 1、高可靠性是否意味着高可用性?试举例证明自己的观点? 答:高可靠性不意味着高可用性 可靠性说明系统已经准备好,马上可以使用;可用性是系统可以无故障的持续运行,是一…...
apache的BeanUtils的Converter被相互污染覆盖问题
问题描述 apache的BeanUtils工具集中用来把map对象转换为java对象的BeanUtils#populate方法会因为单例的原因其转换器Converter被相互污染覆盖问题 maven依赖 <dependency><groupId>commons-beanutils</groupId><artifactId>commons-beanutils</…...

TCP的“可靠性”(上)
目录 TCP的“可靠性”(上)确认应答(可靠性传输的基础)超时重传连接管理(三次握手,四次挥手) TCP的“可靠性”(上) 想必大家都或多或少的听说过TCP的特性:有连…...

超标量处理器设计笔记(5)虚拟存储器、地址转换、page fault
虚拟存储器 概述地址转换单级页表多级页表案例最好情况:虚拟地址是连续的最差情况:每个第二级 PT 都装有一项 增加级数 Page Fault 程序保护 概述 当程序比物理内存空间更大时,无法全部装在物理内存中,需要对程序进行切片 虚拟…...

SparkSQL 读写数据攻略:从基础到实战
目录 一、输入Source 1)代码演示最普通的文件读取方式: 2) 通过jdbc读取数据库数据 3) 读取table中的数据【hive】 二、输出Sink 实战一:保存普通格式 实战二:保存到数据库中 实战三:将结果保存在h…...
react 使用状态管理调用列表接口渲染列表(包含条件查询,统一使用查询按钮,重置功能),避免重复多次调用接口的方法
react开发调用api接口一般使用useEffect来监听值的变化,通过值的变化与否来进行接口调用。 比如我们要进行一个查询接口 const [pageParams, setPage] useState({name: ,id: ,});const [dataList, setDataList] useState([]);const getList async () > {const…...

Stable Audio Open模型部署教程:用AI打造独家节拍,让声音焕发新活力!
Stable Audio Open 是一个开源的文本到音频模型,允许用户从简单的文本提示中生成长达 47 秒的高质量音频数据。该模型非常适合创建鼓点、乐器即兴演奏、环境声音、拟音录音和其他用于音乐制作和声音设计的音频样本。用户还可以根据他们的自定义音频数据微调模型&…...
加油站-(贪心算法)
题目描述 在一条环路上有 n 个加油站,其中第 i 个加油站有汽油 gas[i] 升。 你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发,开始时油箱为空。 给定两个整数数组 gas…...
k8s-持久化存储PV与PVC(1)
1、概述 为什么 kubernetes 要持久化存储? 在 kubernetes 中部署应用都是以 Pod 的容器运行的,而 Pod 是有生命周期,一旦 Pod 被删除或重启后,这些数据也会随着丢失,则需要对这些数据进行持久化存储。 PV࿱…...

Linux Red Hat Enterprise
下载 https://developers.redhat.com/products/rhel/download 安装...

《中型 Vue 项目:挑战与成长》
一、引言 在当今的前端开发领域,Vue 作为一款渐进式 JavaScript 框架,以其强大的功能和灵活性备受开发者青睐。对于中型 Vue 项目而言,其重要性不言而喻。中型 Vue 项目通常在功能复杂度和规模上介于小型项目和大型项目之间,既需要…...

配置 DNS over HTTPS阻止DNS污染
概念介绍 DOH简介 DNS(域名系统)的主要功能是将域名解析成IP地址,域名的解析工作由DNS服务器完成。从安全角度来看,域名解析的请求传输时通常不进行任何加密,这导致第三方能够很容易拦截用户的DNS,将用…...

Facebook广告文案流量秘诀
Facebook 广告文案是制作有效 Facebook 广告的关键方面。它侧重于伴随广告视觉元素的文本内容。今天我们的博客将深入探讨成功的 Facebook 广告文案的秘密! 一、广告文案怎么写? 正文:这是帖子的正文,出现在您姓名的正下方。它可…...

22. 五子棋小游戏
文章目录 概要整体架构流程技术名词解释技术细节小结 1. 概要 🔊 JackQiao 对 米粒 说:“今天咱们玩个五子棋小游戏,电脑与你轮流在一个 nn 的网格上放置棋子(X 或 O),网格由你输入的正整数n决定࿰…...
fastadmin框架同时使用 阿里云oss和阿里云点播
背景 项目的实际需求中既要用到阿里云oss产品又用到阿里云点播系统,实现完美的统一。设置两个地址downUrl,thirdCode。分别代表阿里云oss上传路径和阿里云点播系统vId。 实现 默认框架你已经集成好阿里云oss集成工作,前端html页面实现 <…...
Java-JMX 组件架构即详解
JMX架构由三个主要组件构成: MBeans(Managed Beans):代表可管理的资源,是JMX的核心。MBean可以是Java类或接口,提供了管理操作的接口,如获取系统信息、设置参数等。MBeanServer&#x…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

定时器任务——若依源码分析
分析util包下面的工具类schedule utils: ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类,封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz,先构建任务的 JobD…...

Redis数据倾斜问题解决
Redis 数据倾斜问题解析与解决方案 什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中,部分节点存储的数据量或访问量远高于其他节点,导致这些节点负载过高,影响整体性能。 数据倾斜的主要表现 部分节点内存使用率远高于其他节…...
Web 架构之 CDN 加速原理与落地实践
文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 …...
Typeerror: cannot read properties of undefined (reading ‘XXX‘)
最近需要在离线机器上运行软件,所以得把软件用docker打包起来,大部分功能都没问题,出了一个奇怪的事情。同样的代码,在本机上用vscode可以运行起来,但是打包之后在docker里出现了问题。使用的是dialog组件,…...
JavaScript基础-API 和 Web API
在学习JavaScript的过程中,理解API(应用程序接口)和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能,使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...

macOS 终端智能代理检测
🧠 终端智能代理检测:自动判断是否需要设置代理访问 GitHub 在开发中,使用 GitHub 是非常常见的需求。但有时候我们会发现某些命令失败、插件无法更新,例如: fatal: unable to access https://github.com/ohmyzsh/oh…...

PH热榜 | 2025-06-08
1. Thiings 标语:一套超过1900个免费AI生成的3D图标集合 介绍:Thiings是一个不断扩展的免费AI生成3D图标库,目前已有超过1900个图标。你可以按照主题浏览,生成自己的图标,或者下载整个图标集。所有图标都可以在个人或…...

多模态大语言模型arxiv论文略读(112)
Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models ➡️ 论文标题:Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models ➡️ 论文作者:Jea…...