【科研小小白】灰度化处理、阈值、反色、二值化、边缘检测;平滑;梯度计算;双阈值检测;非极大值抑制
什么是灰度化处理?
灰度化处理是将彩色图像转换为灰度图像的过程。在彩色图像中,每个像素通常由红(R)、绿(G)、蓝(B)三个通道组成。每个通道的取值范围通常在0到255之间。通过灰度化处理,我们把图像从RGB三通道降维为单通道,每个像素值表示该像素的亮度。
在灰度图像中,像素值范围从0到255,其中0代表黑色,255代表白色,介于两者之间的值则表示不同深浅的灰度级。
灰度化的计算方法:
通常采用以下公式将RGB值转换为灰度值:

这个公式是基于人眼对不同颜色的敏感度确定的,绿光对亮度的贡献最大,蓝光最小。
什么是阈值?
阈值是指在图像处理中的一个数值界限,用于将图像的像素划分为不同的类别。
在阈值分割中,阈值用于区分前景和背景。例如,将灰度图像的像素值与一个预设的阈值进行比较,大于阈值的像素被标记为前景,反之则标记为背景。
阈值的作用:
- 全局阈值:全局设置一个固定的阈值,用于对整个图像进行分割。
- 局部阈值:根据图像的局部信息动态调整阈值,适合光照不均的场景。
- Otsu阈值法:自动选择最佳阈值的算法,最大化前景和背景之间的方差差异。
二值化(Binarization)
一种图像处理技术,将图像中的像素值转换为0或1,也就是将图像转变为仅有黑白两种颜色的形式。这通常用于简化图像数据,尤其是在处理灰度图像或其他多色图像时。
主要过程:
- 选择阈值:对于每个像素,比较其灰度值(通常为0到255之间的数值)与指定的阈值。如果像素的值大于阈值,将其设为1(白);否则设为0(黑)。
- 生成二值图像:通过遍历整个图像,对每个像素进行比较,并将结果存储在新的二值图像中
应用场景:
- 文本提取: 用于扫描文档的文字识别(OCR)。
- 物体识别: 在计算机视觉中将背景与前景区分开。
- 边缘检测: 在某些算法中,通过二值化来简化图像内容,从而更容易进行边缘、轮廓的检测。
示例: 假设有一个灰度图像像素矩阵如下:
[ 50, 200, 150, 220 ]
[ 30, 100, 180, 210 ]
[ 60, 90, 130, 240 ]
[ 10, 80, 170, 190 ]
给定阈值 150,应用二值化后,将得到二值矩阵:
[ 0, 1, 0, 1 ]
[ 0, 0, 1, 1 ]
[ 0, 0, 0, 1 ]
[ 0, 0, 1, 1 ]
这样,原图像中的灰度信息被简化为黑白图像,方便进一步分析和处理。
反色(Negative Image)和轮廓描绘(Edge
Detection)是数字图像处理中的两种常见技术,通常用于增强图像的视觉特征,或进行更深入的分析与处理。
反色(Negative Image)
反色是一种将图像的颜色或灰度值反转的技术,它可以应用于彩色图像或灰度图像中。
操作原理:
- 对于灰度图像,反色是将每个像素的灰度值变成其最大值(通常为255)减去当前值。
- 如果像素值是 I(x, y),那么反色后的像素值 I’(x, y) 计算公式为:

对于彩色图像,反色会对每个颜色通道(RGB中的每一个通道)分别进行上述运算。
**应用场景:
视觉增强:**有时反色可以突出图像中的某些细节。
医学影像:X光图像和显微镜图像经常采用反色效果,以增强对比度。
示例: 假设灰度图像像素值为 150,则反色后的像素值为 255 - 150 = 105。
轮廓描绘(Edge Detection)
轮廓描绘,也称为**边缘检测,**是用于识别图像中强烈变化区域的技术,特别是像素亮度的急剧变化区域。轮廓通常对应于物体的边界或图像中的显著变化区域。
操作原理:
- 梯度计算: 通过计算图像中的亮度变化率(即梯度),来识别图像中的边缘。常见的边缘检测算法包括:
- Sobel算子: 计算水平和垂直方向的梯度。
- Canny边缘检测器: 一种更加复杂且效果良好的边缘检测算法,包含平滑、梯度计算、非极大值抑制和双阈值检测等步骤。
应用场景:
- 物体识别与分割:在图像中识别物体的轮廓,以便进行分割和识别。
- 形状分析:通过轮廓描绘获得物体的形状特征。
示例: 使用Sobel算子进行边缘检测的图像,可以得到这样的结果:
原始图像中某物体的边缘会变成高亮的白色,而背景则被滤除,变成黑色。
补充:
1. 平滑(Smoothing)
平滑是减少图像中的噪声,使得边缘检测过程更加准确的预处理步骤。通常通过卷积滤波器(如高斯滤波)来进行平滑处理。
使用方法: 使用高斯滤波器来对图像进行平滑处理,以减少图像中的噪声,同时保留重要的边缘信息。典型实现方式是通过OpenCV的 cv2.GaussianBlur 函数。
# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)# 使用高斯滤波进行平滑处理
smoothed_image = cv2.GaussianBlur(image, (5, 5), 1.4)
- 解释:
(5, 5):高斯核的大小,即滤波器的尺寸。1.4:高斯核的标准差,决定平滑的强度
2. 梯度计算(Gradient Calculation)
梯度计算是检测图像中像素值变化的程度和方向。
边缘通常出现在像素值急剧变化的区域,因此通过计算图像的梯度,可以识别这些变化。
使用方法: 梯度通常通过Sobel算子或Prewitt算子来计算,分别计算X方向和Y方向的梯度。
# Sobel算子计算X方向和Y方向的梯度
sobel_x = cv2.Sobel(smoothed_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(smoothed_image, cv2.CV_64F, 0, 1, ksize=3)# 计算梯度幅度
gradient_magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
- 解释:
1, 0 和 0, 1:分别计算X方向和Y方向的梯度。ksize:高斯核的标准差,决定平滑的强度
3.非极大值抑制(Non-Maximum Suppression, NMS)
非极大值抑制是一种细化边缘的技术,用于去除非边缘点。即在局部区域内,只有梯度值最大的点被保留为边缘,其他点则被抑制。
-
使用方法: 在实现Canny边缘检测时,通常在计算梯度后应用非极大值抑制来消除梯度幅度不强的边缘。
实现思路: 对每个像素,通过比较其梯度值与邻域内的梯度值,保留局部最大值,将其他像素设置为0。具体的OpenCV实现已内置在Canny边缘检测算法中,不需要手动实现。
4. 双阈值检测(Double Thresholding)
双阈值检测通过设置两个阈值,将边缘点分为强边缘、弱边缘和非边缘。强边缘直接保留,弱边缘会根据与强边缘的连接性来决定是否保留,而非边缘则被去除。
使用方法: 在Canny边缘检测中,双阈值检测是关键步骤之一,用来区分强边缘和弱边缘。
# Canny边缘检测,使用双阈值
edges = cv2.Canny(smoothed_image, 100, 200)
- 解释:
100:低阈值,定义弱边缘。200:高阈值,定义强边缘
。
双阈值的目的是保留强边缘,同时在弱边缘之间进行更精细的处理,防止过多噪声影响结果。
总结
平滑:减少噪声,常用高斯滤波。
梯度计算:通过Sobel等算子计算X和Y方向的像素变化。
非极大值抑制:细化边缘,仅保留局部最大梯度的点。
双阈值检测:根据强边缘和弱边缘进行分类处理,保留重要的边缘信息。
相关文章:
【科研小小白】灰度化处理、阈值、反色、二值化、边缘检测;平滑;梯度计算;双阈值检测;非极大值抑制
什么是灰度化处理? 灰度化处理是将彩色图像转换为灰度图像的过程。在彩色图像中,每个像素通常由红(R)、绿(G)、蓝(B)三个通道组成。每个通道的取值范围通常在0到255之间。通过灰度化…...
数字经济时代,零售企业如何实现以消费者为中心的数字化转型?
在数字经济时代,零售企业正面临着前所未有的挑战与机遇。随着消费者行为的数字化和多样化,传统的零售模式已难以满足市场需求。为了在激烈的市场竞争中立于不败之地,零售企业必须实现以消费者为中心的数字化转型。这一转型不仅仅是技术的升级…...
微积分复习笔记 Calculus Volume 1 - 1.5 Exponential and Logarithmic Functions
1.5 Exponential and Logarithmic Functions - Calculus Volume 1 | OpenStax...
代码随想录 刷题记录-24 图论 (1)理论基础 、深搜与广搜
一、理论基础 参考: 图论理论基础 深度优先搜索理论基础 广度优先搜索理论基础 dfs dfs搜索可一个方向,并需要回溯,所以用递归的方式来实现是最方便的。 有递归的地方就有回溯,例如如下代码: void dfs(参数) {…...
MyBatis 缓存机制详解:原理、应用与优化策略
一、MyBatis 缓存概述 1.1 什么是缓存? 缓存是一种提高系统性能的技术,通过将常用的数据保存在内存中,减少对底层数据源(如数据库)的访问次数,从而加快数据读取速度。 在 MyBatis 中,缓存的主要目的是通过存储查询结果,减少对数据库的直接查询次数,提升系统性能。 …...
跨越技术壁垒:EasyCVR为何选择支持FMP4格式,重塑视频汇聚平台标准
随着物联网、大数据、云计算等技术的飞速发展,视频监控系统已经从传统的安防监控扩展到智慧城市、智能交通、工业制造等多个领域。视频流格式作为视频数据传输与存储的基础,其兼容性与效率直接影响到整个视频监控系统的性能。 在众多视频流格式中&#…...
美团OC感想
OC感想 晚上十点拿到美团意向了 到家事业部。,日常实习没过,暑期实习没过,秋招终于意向了,晚上十点发的,整整激动到一点才睡着,不仅因为这是秋招的第一个意向,更因为这是我一直心心念念想去的地…...
搜维尔科技:AcuMap - 针灸模拟VR训练解决方案
AcuMap第一个针灸VR训练解决方案。全面且医学上准确的人体映射,其中 14 条经络和 361 个穴位以 3D 形式可视化。您还可以在虚拟人体模型上模拟针刺。主要特点 - 可视化 14 条经络及其分支 - 基于 4 个主要类别的 361 个穴位:五行、危险穴位、补邪和特殊穴…...
WEB渗透权限维持篇-禁用Windows事件日志
往期文章WEB渗透权限维持篇-DLL注入\劫持-CSDN博客 WEB渗透权限维持篇-CLR-Injection-CSDN博客 WEB渗透权限维持篇-计划任务-CSDN博客 WEB渗透权限维持篇-DLL注入-修改内存中的PE头-CSDN博客 WEB渗透权限维持篇-DLL注入-进程挖空(MitreT1055.012)-CSDN博客 WEB渗透权限维…...
【设计模式】Template Method伪代码
1. 不好的代码 1.1 lib.cpp class Library{ public:void Step1(){//...}void Step3(){//...}void Step5(){//...} };1.2 app.cpp class Application{ public:bool Step2(){//...}void Step4(){//...} };int main() {Library lib();Application app();lib.Step1();if(app.Ste…...
关于2023.9.2~2023.9.10学习总结与教训
关于2023.9.2~2023.9.10学习总结与教训 语文古诗文与古诗基础阅读作文 数学几综卷子 英语物理政治总结待寻找的学习方法需应用的学习方法 语文 古诗文与古诗 背诵岳阳楼记和醉翁亭记的经验告诉我,应该在背诵时附以抄写同时在背下来后还应该去默写纠错,…...
NLTK:Python自然语言处理工具包及其参数使用详解
NLTK(Natural Language Toolkit)是一个领先的平台,用于构建处理人类语言数据的Python程序。它提供了易于使用的接口,用于超过50个语料库和词汇资源,如WordNet,以及一套文本处理库,用于分类、标记…...
php 之 php-fpm 和 nginx结合使用
php-fpm php-fpm是php面试必问的一个小考点,聊这个之前还是要铺垫一下,cgi 和 fastcgi。 CGI,通用网关接口,用于WEB服务器(比如 nginx)和应用程序(php)间的交互,简单的…...
数学建模笔记——TOPSIS[优劣解距离]法
数学建模笔记——TOPSIS[优劣解距离法] TOPSIS(优劣解距离)法1. 基本概念2. 模型原理3. 基本步骤4. 典型例题4.1 矩阵正向化4.2 正向矩阵标准化4.3 计算得分并归一化4.4 python代码实现 TOPSIS(优劣解距离)法 1. 基本概念 C. L.Hwang和 K.Yoon于1981年首次提出 TOPSIS(Techni…...
证书学习(四)X.509数字证书整理
目录 一、X.509证书 介绍1.1 什么是 X.509证书?1.2 什么是 X.509标准?1.3 什么是 PKI?二、X.509证书 工作原理2.1 证书认证机构(CA)2.1 PKI 的基础——加密算法2.2 PKI 证书编码三、X.509证书 结构3.1 证书字段3.2 证书扩展背景: 我们在日常的开发过程中,经常会遇到各种…...
氚云,低代码领风者如何破解行业的“中式焦虑”?
To B生意“难做”,很多公司的苦恼都难以掩盖。 上半年,一个“中国软件行业全军覆没”的帖子引发热烈讨论,评论竟是赞同的居多。那些以实现上市为目标的SaaS公司,或者已经上市的、主营业务为To B的企业,其整体的业绩状…...
“深入解析:MySQL半同步复制的配置指南与实践技巧“
本次配置是在已搭建好主从复制的架构中进行配置 配置环境 操作系统 master节点 slave节点 centos7 8.0.37 8.0.37 配置半同步复制 配置master 安装master半同步复制插件 INSTALL PLUGIN rpl_semi_sync_source SONAME semisync_source.so; 在MySQL的配置文件中添加配置…...
第四届长城杯部分wp
还是太菜了,要经常练了 1.BrickGame 读源码可以看到时间的值是由js设定的,所以控制台将timeleft的时间改成999999 通过游戏就可以得到flag 2.SQLUP 一道文件上传的题目,在登陆页面我用admin和1登陆成功了,但是按照正常的应该是…...
打造无死角安防网:EasyCVR平台如何助力智慧警务实现视频+AI的全面覆盖
一、背景概述 随着科技的飞速发展,智慧城市建设已成为提升社会治理能力、增强公共安全水平的重要途径。在警务领域,智慧警务作为智慧城市的重要组成部分,正通过融合视频监控技术与人工智能(AI)解决方案,实…...
批发订货系统源码怎么弄 门店订货系统小程序价格
上线批发订货系统可以显著提升业务效率和管理水平,它能够帮助企业自动化处理订单、实时跟踪库存、简化订单管理、生成数据报表…这些优势能最终帮助你降低成本、提高效率,提升业务竞争力。今天,小编为您分享批发订货系统源码怎么弄。大家点赞…...
springboot 百货中心供应链管理系统小程序
一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,百货中心供应链管理系统被用户普遍使用,为方…...
RocketMQ延迟消息机制
两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数,对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后…...
Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...
Linux简单的操作
ls ls 查看当前目录 ll 查看详细内容 ls -a 查看所有的内容 ls --help 查看方法文档 pwd pwd 查看当前路径 cd cd 转路径 cd .. 转上一级路径 cd 名 转换路径 …...
【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表
1、行为树节点分类 在 Nav2(Navigation2)的行为树框架中,行为树节点插件按照功能分为 Action(动作节点)、Condition(条件节点)、Control(控制节点) 和 Decorator(装饰节点) 四类。 1.1 动作节点 Action 执行具体的机器人操作或任务,直接与硬件、传感器或外部系统…...
OkHttp 中实现断点续传 demo
在 OkHttp 中实现断点续传主要通过以下步骤完成,核心是利用 HTTP 协议的 Range 请求头指定下载范围: 实现原理 Range 请求头:向服务器请求文件的特定字节范围(如 Range: bytes1024-) 本地文件记录:保存已…...
C# SqlSugar:依赖注入与仓储模式实践
C# SqlSugar:依赖注入与仓储模式实践 在 C# 的应用开发中,数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护,许多开发者会选择成熟的 ORM(对象关系映射)框架,SqlSugar 就是其中备受…...
ArcGIS Pro制作水平横向图例+多级标注
今天介绍下载ArcGIS Pro中如何设置水平横向图例。 之前我们介绍了ArcGIS的横向图例制作:ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等(ArcGIS出图图例8大技巧),那这次我们看看ArcGIS Pro如何更加快捷的操作。…...
【生成模型】视频生成论文调研
工作清单 上游应用方向:控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...
JavaScript 数据类型详解
JavaScript 数据类型详解 JavaScript 数据类型分为 原始类型(Primitive) 和 对象类型(Object) 两大类,共 8 种(ES11): 一、原始类型(7种) 1. undefined 定…...
