当前位置: 首页 > article >正文

OpenCV--图像边缘检测

在计算机视觉和图像处理领域,边缘检测是极为关键的技术。边缘作为图像中像素值发生急剧变化的区域,承载了图像的重要结构信息,在物体识别、图像分割、目标跟踪等众多应用场景中发挥着核心作用。OpenCV 作为强大的计算机视觉库,提供了丰富且高效的边缘检测算法。本文将深入探讨常见边缘检测算法的原理,并结合 OpenCV 的代码示例,助力读者深入理解与运用边缘检测技术。

一、边缘检测简介

边缘检测旨在识别和提取图像中物体的边界,通过检测图像中像素值的变化,标记出图像中明显的边缘部分。不同类型的图像边缘可能对应不同的物体边界、纹理变化或光照变化。在实际应用中,良好的边缘检测结果能大幅简化后续图像处理任务,提高算法的效率和准确性。

二、Sobel 算子

1. 原理

Sobel 算子是一种常用的边缘检测算法,它基于图像中像素的梯度来检测边缘。该算法分别计算图像在水平方向(X 方向)和垂直方向(Y 方向)的梯度,通过近似计算一阶偏导数来获取梯度幅值和方向。具体来说,Sobel 算子使用两个卷积核,一个用于检测水平方向的边缘,另一个用于检测垂直方向的边缘。以 3x3 的 Sobel 核为例,水平方向核为\(\begin{bmatrix}-1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1\end{bmatrix}\),垂直方向核为\(\begin{bmatrix}-1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1\end{bmatrix}\)。通过对图像进行卷积运算,得到水平和垂直方向的梯度值,再根据两者计算梯度幅值和方向,以确定边缘位置。由于 Sobel 算子在计算梯度时考虑了邻域像素的加权平均,对噪声有一定的抑制能力。

2. OpenCV 实现

在 OpenCV 中,使用cv2.Sobel()函数实现 Sobel 边缘检测。该函数的第一个参数为输入图像,第二个参数为输出图像的深度,第三个参数为 X 方向的导数阶数,第四个参数为 Y 方向的导数阶数,此外还可指定卷积核的大小等参数。下面是使用 Sobel 算子进行边缘检测的示例代码:

import cv2import numpy as npimport matplotlib.pyplot as plt# 读取图像并转换为灰度图img = cv2.imread('test.jpg', 0)# 计算X方向的梯度sobelx = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize = 5)sobelx = np.uint8(np.absolute(sobelx))# 计算Y方向的梯度sobely = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize = 5)sobely = np.uint8(np.absolute(sobely))# 计算梯度幅值sobelxy = cv2.addWeighted(cv2.convertScaleAbs(sobelx), 0.5, cv2.convertScaleAbs(sobely), 0.5, 0)# 显示结果plt.subplot(141), plt.imshow(img, cmap = 'gray'), plt.title('Original')plt.xticks([]), plt.yticks([])plt.subplot(142), plt.imshow(sobelx, cmap = 'gray'), plt.title('Sobel X')plt.xticks([]), plt.yticks([])plt.subplot(143), plt.imshow(sobely, cmap = 'gray'), plt.title('Sobel Y')plt.xticks([]), plt.yticks([])plt.subplot(144), plt.imshow(sobelxy, cmap = 'gray'), plt.title('Sobel XY')plt.xticks([]), plt.yticks([])plt.show()

三、Scharr 算子

1. 原理

Scharr 算子同样用于计算图像的梯度,本质上是 Sobel 算子的改进版本。在 Sobel 算子中,当卷积核较小时,对图像细节的检测能力有限。Scharr 算子使用固定的 3x3 卷积核,在计算梯度时,能更精确地逼近导数,对图像细节的检测效果优于 Sobel 算子。水平方向的 Scharr 核为\(\begin{bmatrix}-3 & 0 & 3 \\ -10 & 0 & 10 \\ -3 & 0 & 3\end{bmatrix}\),垂直方向的 Scharr 核为\(\begin{bmatrix}-3 & -10 & -3 \\ 0 & 0 & 0 \\ 3 & 10 & 3\end{bmatrix}\),这使得它在检测图像边缘的细微变化时表现更出色。

2. OpenCV 实现

在 OpenCV 中,通过将cv2.Sobel()函数的ksize参数设置为cv2.CV_SCHARR来使用 Scharr 算子。下面是使用 Scharr 算子进行边缘检测的示例:

import cv2import numpy as npimport matplotlib.pyplot as plt# 读取图像并转换为灰度图img = cv2.imread('test.jpg', 0)# 计算X方向的梯度scharrx = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize = cv2.CV_SCHARR)scharrx = np.uint8(np.absolute(scharrx))# 计算Y方向的梯度scharry = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize = cv2.CV_SCHARR)scharry = np.uint8(np.absolute(scharry))# 计算梯度幅值scharrxy = cv2.addWeighted(cv2.convertScaleAbs(scharrx), 0.5, cv2.convertScaleAbs(scharry), 0.5, 0)# 显示结果plt.subplot(141), plt.imshow(img, cmap = 'gray'), plt.title('Original')plt.xticks([]), plt.yticks([])plt.subplot(142), plt.imshow(scharrx, cmap = 'gray'), plt.title('Scharr X')plt.xticks([]), plt.yticks([])plt.subplot(143), plt.imshow(scharry, cmap = 'gray'), plt.title('Scharr Y')plt.xticks([]), plt.yticks([])plt.subplot(144), plt.imshow(scharrxy, cmap = 'gray'), plt.title('Scharr XY')plt.xticks([]), plt.yticks([])plt.show()

四、Laplacian 算子

1. 原理

Laplacian 算子是一种二阶导数算子,通过计算图像的二阶导数来检测边缘。与 Sobel 和 Scharr 算子基于一阶导数不同,Laplacian 算子对图像中的孤立点、线以及边缘的变化更为敏感。其原理是通过对图像进行拉普拉斯运算,找到二阶导数为零的点,这些点通常对应图像的边缘。在实际应用中,常用的 Laplacian 核有\(\begin{bmatrix}0 & 1 & 0 \\ 1 & -4 & 1 \\ 0 & 1 & 0\end{bmatrix}\)等。由于 Laplacian 算子对噪声非常敏感,通常在使用前需要对图像进行平滑处理。

2. OpenCV 实现

在 OpenCV 中,使用cv2.Laplacian()函数实现 Laplacian 边缘检测。该函数的第一个参数为输入图像,第二个参数为输出图像的深度。以下是使用 Laplacian 算子进行边缘检测的示例代码:

import cv2import numpy as npimport matplotlib.pyplot as plt# 读取图像并转换为灰度图img = cv2.imread('test.jpg', 0)# 使用高斯滤波对图像进行平滑处理img = cv2.GaussianBlur(img, (3, 3), 0)# 进行Laplacian边缘检测laplacian = cv2.Laplacian(img, cv2.CV_64F)laplacian = np.uint8(np.absolute(laplacian))# 显示结果plt.subplot(121), plt.imshow(img, cmap = 'gray'), plt.title('Original')plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(laplacian, cmap = 'gray'), plt.title('Laplacian')plt.xticks([]), plt.yticks([])plt.show()

五、Canny 边缘检测

1. 原理

Canny 边缘检测是一种被广泛应用的边缘检测算法,它是一种多阶段的算法,旨在检测出图像中真实、清晰的边缘。Canny 算法主要包含以下几个步骤:

  • 高斯滤波:对输入图像进行高斯滤波,去除噪声,减少噪声对边缘检测的干扰。
  • 计算梯度幅值和方向:使用 Sobel 等算子计算图像中每个像素的梯度幅值和方向。
  • 非极大值抑制:在梯度方向上,对每个像素进行检查,仅保留梯度幅值最大的像素,抑制非边缘像素,从而细化边缘。
  • 双阈值检测和边缘连接:设置高、低两个阈值,将梯度幅值大于高阈值的像素确定为强边缘,小于低阈值的像素排除,介于两者之间的像素根据其与强边缘的连接性来确定是否为边缘。

2. OpenCV 实现

在 OpenCV 中,使用cv2.Canny()函数实现 Canny 边缘检测。该函数的第一个参数为输入图像,第二个参数为低阈值,第三个参数为高阈值。示例代码如下:

import cv2import numpy as npimport matplotlib.pyplot as plt# 读取图像并转换为灰度图img = cv2.imread('test.jpg', 0)# 进行Canny边缘检测edges = cv2.Canny(img, 100, 200)# 显示结果plt.subplot(121), plt.imshow(img, cmap = 'gray'), plt.title('Original')plt.xticks([]), plt.yticks([])plt.subplot(122), plt.imshow(edges, cmap = 'gray'), plt.title('Canny Edges')plt.xticks([]), plt.yticks([])plt.show()

六、总结

本文详细介绍了 OpenCV 中的多种边缘检测算法,包括 Sobel 算子、Scharr 算子、Laplacian 算子和 Canny 边缘检测算法。每种算法都有其独特的原理和适用场景,Sobel 和 Scharr 算子基于一阶导数,对噪声有一定抗性且能较好检测明显边缘;Laplacian 算子基于二阶导数,对细节敏感但对噪声也敏感;Canny 算法通过多阶段处理,能检测出更真实、连续的边缘。在实际应用中,需根据图像的特点和处理需求,选择合适的边缘检测算法,以达到最佳的处理效果。

相关文章:

OpenCV--图像边缘检测

在计算机视觉和图像处理领域,边缘检测是极为关键的技术。边缘作为图像中像素值发生急剧变化的区域,承载了图像的重要结构信息,在物体识别、图像分割、目标跟踪等众多应用场景中发挥着核心作用。OpenCV 作为强大的计算机视觉库,提供…...

深度探索:策略学习与神经网络在强化学习中的应用

深度探索:策略学习与神经网络在强化学习中的应用 策略学习(Policy-Based Reinforcement Learning)一、策略函数1.1 策略函数输出的例子 二、使用神经网络来近似策略函数:Policy Network ,策略网络2.1 策略网络运行的例子2.2需要的几个概念2.3神经网络近似…...

ModuleNotFoundError: No module named ‘pandas‘

在使用Python绘制散点图表的时候,运行程序报错,如图: 报错显示Python 环境中可能没有安装 pandas 库,执行pip list命令查看,果然没有安装pandas 库,如图: 执行命令:python -m pip in…...

配环境的经验

pip install -e . 该命令用于以“编辑模式”(也称为开发模式)安装当前目录下的 Python 包,比如包含有 setup.py、setup.cfg 或 pyproject.toml 文件的项目-e 是 --editable 的简写。以编辑模式安装时,pip 会在你的 Python 环境中创…...

解决 Kubernetes 中容器 `CrashLoopBackOff` 问题的实战经验

在 Kubernetes 集群中,容器状态为 CrashLoopBackOff 通常意味着容器启动失败,并且 Kubernetes 正在不断尝试重启它。这种状态表明容器内可能存在严重错误,如应用异常、依赖服务不可用、配置错误等。本文将分享一次实际排障过程,并…...

hive/doris查询表的创建和更新时间

hive查询表的创建和更新时间: SELECT d.NAME AS database_name, t.TBL_NAME AS table_name, FROM_UNIXTIME(t.CREATE_TIME) AS create_time, FROM_UNIXTIME(tp.PARAM_VALUE) AS last_ddl_time FROM metastore.TBLS t JOIN metastore.DBS d ON t.DB_ID d.DB_ID JOIN…...

springboot中使用async实现异步编程

目录 1.说明 2.实现原理 3.示例 4.总结 1.说明 Async 是 Spring 框架提供的一个注解,用于标记方法为异步执行。被标记的方法将在调用时立即返回,而实际的方法执行将在单独的线程中进行。 Async 注解有一个可选属性:指定要使用的特定线程…...

【教程】MacBook 安装 VSCode 并连接远程服务器

目录 需求步骤问题处理 需求 在 Mac 上安装 VSCode,并连接跳板机和服务器。 步骤 Step1:从VSCode官网(https://code.visualstudio.com/download)下载安装包: Step2:下载完成之后,直接双击就能…...

初识 Three.js:开启你的 Web 3D 世界 ✨

3D 技术已经不再是游戏引擎的专属,随着浏览器技术的发展,我们完全可以在网页上实现令人惊艳的 3D 效果。而 Three.js,作为 WebGL 的封装库,让 Web 3D 的大门向更多开发者敞开了。 这是我开启这个 Three.js 专栏的第一篇文章&…...

基于大模型的病态窦房结综合征预测及治疗方案研究报告

目录 一、引言 1.1 研究背景与目的 1.2 研究意义 二、病态窦房结综合征概述 2.1 定义与病因 2.2 临床表现与分型 2.3 诊断方法 三、大模型在病态窦房结综合征预测中的应用 3.1 大模型介绍 3.2 数据收集与预处理 3.3 模型训练与优化 四、术前预测与准备 4.1 风险预…...

在 Ubuntu 下通过 Docker 部署 PSQL 服务器的详细技术博客

今天,需要部署一个密码管理器,突然要用到PSQL的服务器,所以就把部署的过程记录下来。 鉴于最近囊中羞涩,故此次部署实验使用三丰云的免费服务器配置,配置是为1 核 CPU、1G 内存和 5M 带宽,足够了。 以下是…...

【FAQ】HarmonyOS SDK 闭源开放能力 —Account Kit(3)

1.问题描述: PC场景,青少年模式系统API不支持吗? 解决方案: PC场景,青少年模式系统API不支持,另外文档上的几个API也不支持。 2.问题描述: 华为一键登录 Beta7本地运行到手机可以拿到匿名手…...

地图与图层操作

地图文档本质上就是存储在磁盘上的地图,包括地理数据、图名、图例等一系列要素,当完成地图制作、图层要素标注及符号显示设置后,可以将其作为图层文件保存到磁盘中,在一个图层文件中,包括了定义如何在地图上描述地理数…...

starrocks split函数和trino split函数差异性

在trino419和starrocks3.2.8中分别执行下面这两条sql,出来的结果是不一样的 select split(,,,)[1] as t1 select coalesce(split(,,&#...

LeetCode算法题(Go语言实现)_33

题目 给定一个二叉树 root ,返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 一、代码实现 func maxDepth(root *TreeNode) int {// 递归法(后序遍历)if root nil {return 0}leftDepth : maxDepth(r…...

go程序启动工具——cobra

以下是将“为什么很多 Go 程序启动都是用 Cobra”的内容转换为 Markdown 格式的文档: 为什么很多 Go 程序启动都是用 Cobra 在 Go 编程生态中,Cobra 是一个非常流行的命令行工具库,许多 Go 程序选择使用它来构建启动逻辑和命令行接口&#…...

Unet网络的Pytorch实现和matlab实现

文章目录 一、Unet网络简介1.1 输入图像1.2 编码器部分(Contracting Path)1.3 解码器部分(Expanding Path)1.4 最后一层(输出)1.5 跳跃连接(Skip Connections) 二、Unet网络的Pytorc…...

【合新通信】相控阵雷达RFoF方案的应用

一、相控阵雷达为何需要RFoF? 核心需求驱动 分布式部署:相控阵雷达(AESA/PESA)的T/R模块需分散布局(如舰载雷达阵面、卫星载荷),传统同轴电缆导致重量和损耗剧增。高频段挑战:X/Ku/…...

关于点卷积

🧠 什么是点卷积? 点卷积(Pointwise Convolution) 是一种特殊类型的卷积操作,其基本特点是卷积核的大小为 1 1 1 \times 1 11。与传统的卷积操作(如 3 3 3 \times 3 33 或 5 5 5 \times 5 55 卷积核…...

原理图输出网表及调入

一、输出网表操作步骤 (1)选中.dsn文件,选者N或进入tools下拉列表选择Creat Netlists (2)导出网表后的文件 二、网表的导入 (1)执行菜单命令“File-Import-Logic/netlist”,将原理…...

python基础12 模块/库的引用

在软件的设计中,经常提及到解耦的概念,即模块和模块之间的功能尽可能独立,减少不必要的关联。所以在实际项目中,我们经常会将一个工程拆解成很多不同的功能模块,以实现更优的设计并满足团队开发的要求。 有了模块的概…...

TDengine JAVA 语言连接器

简介 本节简介 TDengine 最重要且使用最多的连接器, 本节内容是以教科书式方式列出对外提供的接口及功能及使用过程中要注意的技术细节,大家可以收藏起来做为今后开发 TDengine 的参考资料。 taos-jdbcdriver 是 TDengine 的官方 Java 语言连接器,Java…...

【NLP 55、实践 ⑬ LoRA完成NER任务】

目录 一、数据文件 二、模型配置文件 config.py 三、数据加载文件 loader.py 1.导入文件和类的定义 2.初始化 3.数据加载方法 代码运行流程 4.文本编码 / 解码方法    ① encode_sentence(): ② decode(): 代码运行流程 ③ padding(): 代码…...

【蓝桥杯】Python大学A组第十五届省赛

1.填空题 1.1.拼正方形 问题描述 小蓝正在玩拼图游戏,他有个的方块和个的方块,他需要从中挑出一些来拼出一个正方形。 比如用个和个的方块可以拼出一个的正方形;用个的方块可以拼出一个的正方形。 请问小蓝能拼成的最大的正方形的边长为多少。 import math # 2*2的个数 a =…...

小球反弹(蓝桥杯C语言)

有一长方形,长为 343720343720 单位长度,宽为 233333233333 单位长度。在其内部左上角顶点有一小球 (无视其体积),其初速度如图所示且保持运动速率不变,分解到长宽两个方向上的速率之比为 dx:dy15:17dx:dy15:17。小球碰到长方形的…...

Redis底层数据结构?编码与底层数据结构的映射?

Redis底层数据结构 一、简单动态字符串(SDS) 结构: struct sdshdr {int len; // 已使用字节长度 int free; // 未使用字节长度 char buf[]; // 字节数组(兼容C字符串) };特点: 二进制安全&#…...

linux环境下的硬盘分区格式化工具介绍 fdisk,gdisk,parted,cfdisk,cgdisk,sfdisk,gparted 笔记250407

linux环境下的硬盘分区格式化工具介绍 fdisk,gdisk,parted,cfdisk,cgdisk,sfdisk,gparted 笔记250407 以下是 Linux 系统中常用的 硬盘分区与格式化工具,涵盖命令行和图形界面工具,按功能分类整理: 一、分区管理工具 1. 命令行工具 工具功能…...

HarmonyOS-ArkUI Ability进阶系列-UIAbility与各类Context

UIAbility及相关类关系 一个模块编译的时候会出一个HAP包, 每一个HAP包在运行时都对应一个AbilityStage。 AbilityStage持有一个AbilityStageContext一个APP, 有时候会有很多个HAP包, 至少一个。 一个APP运行时,对应的是我们的App…...

前端入门之CSS

CSS: HTML负责定义页面结构;JS负责处理页面逻辑和点击事件;CSS负责用于描述 HTML 元素的显示方式,通过 CSS 可以控制颜色、字体、布局等。 核心语法: 选择器: 类选择器主要用于选中需要添加样式的 HTML 元素。主要分为:类选择器(.class-name { ... })、标签选择器(…...

JavaScript逆向WebSocket协议解析与动态数据抓取

在JavaScript逆向工程中,WebSocket协议的解析和动态数据抓取是关键技能。本文将结合Fiddler、Charles Proxy和APIfox工具,详细讲解如何解析WebSocket协议并抓取动态数据。 一、WebSocket协议解析 (一)WebSocket协议的基本概念 …...