OpenCV(6):图像边缘检测
图像边缘检测是计算机视觉和图像处理中的一项基本任务,它用于识别图像中亮度变化明显的区域,这些区域通常对应于物体的边界。是 OpenCV 中常用的边缘检测函数及其说明:
| 函数 | 算法 | 说明 | 适用场景 |
|---|---|---|---|
cv2.Canny() | Canny 边缘检测 | 多阶段算法,检测效果较好,噪声抑制能力强。 | 通用边缘检测,适合大多数场景。 |
cv2.Sobel() | Sobel 算子 | 基于一阶导数的边缘检测,可以检测水平和垂直边缘。 | 检测水平和垂直边缘。 |
cv2.Scharr() | Scharr 算子 | Sobel 算子的改进版本,对边缘的响应更强。 | 检测细微的边缘。 |
cv2.Laplacian() | Laplacian 算子 | 基于二阶导数的边缘检测,对噪声敏感。 | 检测边缘和角点。 |
1 Canny 边缘检测 (cv2.Canny())
Canny 边缘检测是一种多阶段的边缘检测算法,由 John F. Canny 在 1986 年提出。Canny 边缘检测被认为是边缘检测的"金标准",因为它能够在噪声抑制和边缘定位之间取得良好的平衡。
1.1 Canny 边缘检测的步骤
Canny 边缘检测算法主要包括以下几个步骤:
- 噪声抑制:使用高斯滤波器对图像进行平滑处理,以减少噪声的影响。
- 计算梯度:使用 Sobel 算子计算图像的梯度幅值和方向。
- 非极大值抑制:沿着梯度方向,保留局部梯度最大的像素点,抑制其他像素点。
- 双阈值检测:使用两个阈值(低阈值和高阈值)来确定真正的边缘。高于高阈值的像素点被认为是强边缘,低于低阈值的像素点被抑制,介于两者之间的像素点如果与强边缘相连则保留。
- 边缘连接:通过滞后阈值处理,将弱边缘与强边缘连接起来,形成完整的边缘。
1.2 使用 OpenCV 实现 Canny 边缘检测
在 OpenCV 中,可以使用 cv2.Canny() 函数来实现 Canny 边缘检测。该函数的原型如下:
edges = cv2.Canny(image, threshold1, threshold2, apertureSize=3, L2gradient=False)
image:输入图像,必须是单通道的灰度图像。threshold1:低阈值。threshold2:高阈值。apertureSize:Sobel 算子的孔径大小,默认为 3。L2gradient:是否使用 L2 范数计算梯度幅值,默认为 False(使用 L1 范数)。
import cv2# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)# 应用 Canny 边缘检测
edges = cv2.Canny(image, 100, 200)# 显示结果
cv2.imshow('Canny Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

2 Sobel 算子 (cv2.Sobel())
Sobel 算子是一种基于梯度的边缘检测算子,它通过计算图像在水平和垂直方向上的梯度来检测边缘。Sobel 算子结合了高斯平滑和微分操作,因此对噪声具有一定的抑制作用。
2.1 Sobel 算子的原理
Sobel 算子使用两个 3x3 的卷积核分别计算图像在水平和垂直方向上的梯度:
- 水平方向的卷积核:
[-1, 0, 1] [-2, 0, 2] [-1, 0, 1]
- 垂直方向的卷积核:
[-1, -2, -1] [ 0, 0, 0] [ 1, 2, 1]
通过这两个卷积核,可以分别得到图像在水平和垂直方向上的梯度 Gx 和 Gy。最终的梯度幅值可以通过以下公式计算:
G = sqrt(Gx^2 + Gy^2)
2.2 使用 OpenCV 实现 Sobel 算子
在 OpenCV 中,可以使用 cv2.Sobel() 函数来计算图像的梯度。该函数的原型如下:
dst = cv2.Sobel(src, ddepth, dx, dy, ksize=3, scale=1, delta=0, borderType=cv2.BORDER_DEFAULT)
src:输入图像。ddepth:输出图像的深度,通常使用cv2.CV_64F。dx:x 方向上的导数阶数。dy:y 方向上的导数阶数。ksize:Sobel 核的大小,默认为 3。scale:缩放因子,默认为 1。delta:可选的 delta 值,默认为 0。borderType:边界填充类型,默认为cv2.BORDER_DEFAULT。
import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)# 计算 x 方向的梯度
sobel_x = cv2.Sobel(image, cv2.CV_64F, 1, 0, ksize=3)# 计算 y 方向的梯度
sobel_y = cv2.Sobel(image, cv2.CV_64F, 0, 1, ksize=3)# 计算梯度幅值
sobel_combined = np.sqrt(sobel_x ** 2 + sobel_y ** 2)# 显示结果
cv2.imshow('Sobel X', sobel_x)
cv2.imshow('Sobel Y', sobel_y)
cv2.imshow('Sobel Combined', sobel_combined)
cv2.waitKey(0)
cv2.destroyAllWindows()

3 Scharr算子(cv2.Scharr())
3.1 Scharr算子的原理
在离散的空间上,有很多方法可以用来计算近似导数,在使用 3×3 的 Sobel 算子时,可能计算结果并不太精准。OpenCV 提供了 Scharr 算子,该算子具有和 Sobel 算子同样的速度,且精度更高。可以将 Scharr 算子看作对 Sobel 算子的改进,其核通常为:

3.2 使用 OpenCV 实现 Scharr 算子
OpenCV 提供了函数 cv2.Scharr()来计算 Scharr 算子,其语法格式如下:
dst = cv2.Scharr( src, ddepth, dx, dy[, scale[, delta[, borderType]]] )
- dst 代表输出图像。
- src 代表原始图像。
- ddepth 代表输出图像深度。该值与函数 cv2.Sobel()中的参数 ddepth 的含义相同。
- dx 代表 x 方向上的导数阶数。
- dy 代表 y 方向上的导数阶数。
- scale 代表计算导数值时的缩放因子,该项是可选项,默认值是 1,表示没有缩放。
- delta 代表加到目标图像上的亮度值,该项是可选项,默认值为 0。
- borderType 代表边界样式。
import cv2# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)# 计算 x 方向的梯度
scharr_x = cv2.Scharr(image, cv2.CV_64F, 1, 0)# 计算 y 方向的梯度
scharr_y = cv2.Scharr(image, cv2.CV_64F, 0, 1)# 计算梯度幅值
scharr_combined = cv2.addWeighted(scharr_x, 0.5, scharr_y, 0.5, 0)# 显示结果
cv2.imshow('Scharr X', scharr_x)
cv2.imshow('Scharr Y', scharr_y)
cv2.imshow('Scharr Combined', scharr_combined)
cv2.waitKey(0)
cv2.destroyAllWindows()

4 Laplacian 算子 (cv2.Laplacian())
Laplacian 算子是一种二阶微分算子,它通过计算图像的二阶导数来检测边缘。Laplacian 算子对噪声比较敏感,因此通常在使用之前会对图像进行高斯平滑处理。
4.1 Laplacian 算子的原理
Laplacian 算子使用以下卷积核来计算图像的二阶导数:
[ 0, 1, 0] [ 1, -4, 1] [ 0, 1, 0]
通过这个卷积核,可以得到图像的 Laplacian 值。Laplacian 值较大的区域通常对应于图像的边缘。
4.2 使用 OpenCV 实现 Laplacian 算子
在 OpenCV 中,可以使用 cv2.Laplacian() 函数来计算图像的 Laplacian 值。该函数的原型如下:
dst = cv2.Laplacian(src, ddepth, ksize=1, scale=1, delta=0, borderType=cv2.BORDER_DEFAULT)
src:输入图像。ddepth:输出图像的深度,通常使用cv2.CV_64F。ksize:Laplacian 核的大小,默认为 1。scale:缩放因子,默认为 1。delta:可选的 delta 值,默认为 0。borderType:边界填充类型,默认为cv2.BORDER_DEFAULT。
import cv2# 读取图像
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)# 应用 Laplacian 算子
laplacian = cv2.Laplacian(image, cv2.CV_64F)# 显示结果
cv2.imshow('Laplacian', laplacian)
cv2.waitKey(0)
cv2.destroyAllWindows()

5 常用边缘检测函数对比
| 函数 | 算法 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|---|
cv2.Canny() | Canny 边缘检测 | 噪声抑制能力强,边缘检测效果好。 | 参数调节较为复杂。 | 通用边缘检测,适合大多数场景。 |
cv2.Sobel() | Sobel 算子 | 计算简单,适合检测水平和垂直边缘。 | 对噪声敏感,边缘检测效果一般。 | 检测水平和垂直边缘。 |
cv2.Scharr() | Scharr 算子 | 对边缘的响应更强,适合检测细微边缘。 | 对噪声敏感。 | 检测细微的边缘。 |
cv2.Laplacian() | Laplacian 算子 | 可以检测边缘和角点。 | 对噪声非常敏感。 | 检测边缘和角点。 |
相关文章:
OpenCV(6):图像边缘检测
图像边缘检测是计算机视觉和图像处理中的一项基本任务,它用于识别图像中亮度变化明显的区域,这些区域通常对应于物体的边界。是 OpenCV 中常用的边缘检测函数及其说明: 函数算法说明适用场景cv2.Canny()Canny 边缘检测多阶段算法,检测效果较…...
多模态人物视频驱动技术回顾与业务应用
一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推…...
星海智算+ DeepSeek-R1:技术突破与行业应用的协同革新
一、前言 在当今数字化时代,人工智能(AI)正以前所未有的速度改变着商业和社会的方方面面。最近爆火的DeepSeek-R1系列模型,以其强大的推理能力和在中文的推理、代码和数学任务高效的性能得到了全球用户的热议。该模型不仅在多项专…...
选择排序:简单高效的选择
大家好,今天我们来聊聊选择排序(Selection Sort)算法。这是一个非常简单的排序算法,适合用来学习排序的基本思路和操作。选择排序在许多排序算法中以其直观和易于实现的特点著称,虽然它的效率不如其他高效算法…...
考研/保研复试英语问答题库(华工建院)
华南理工大学建筑学院保研/考研 英语复试题库,由华工保研er和学硕笔试第一同学一起整理,覆盖面广,助力考研/保研上岸!需要👇载可到文章末尾见小🍠。 以下是主要内容: Part0 复试英语的方法论 Pa…...
ARM Cortex-M处理器中的MSP和PSP
在ARM Cortex-M系列处理器中,MSP(主堆栈指针)和PSP(进程堆栈指针)是两种不同的堆栈指针,主要用于实现堆栈隔离和提升系统可靠性。以下是它们的核心区别和应用场景: 1. 基本定义 MSP(…...
《Keras 3 使用 NeRF 进行 3D 体积渲染》:此文为AI自动翻译
《Keras 3 使用 NeRF 进行 3D 体积渲染》 作者: Aritra Roy Gosthipaty, Ritwik Raha 创建日期: 2021/08/09 最后修改时间: 2023/11/13 描述: 体积渲染的最小实现,如 NeRF 中所示。 (i) 此示例使用 Keras 3 在 Colab 中查看 GitHub 源 介绍 在此示例中,我们展示了…...
Pytorch实现之浑浊水下图像增强
简介 简介:这也是一篇非常适合GAN小白们上手的架构文章!提出了一种基于GAN的水下图像增强网络。这种网络与其他架构类似,生成器是卷积+激活函数+归一化+残差结构的组成,鉴别器是卷积+激活函数+归一化以及全连接层。损失函数是常用的均方误差、感知损失和对抗损失三部分。 …...
【redis】数据类型之Bitfields
Redis的Bitfields(位域)与Bitmaps一样,在Redis中并不是一种独立的数据类型,而是一种基于字符串的数据结构,用于处理位级别的操作。允许用户将一个Redis字符串视作由一系列二进制位组成的数组,并对这些位进行…...
Python入门 — 类
面向对象编程中,编写表示现实世界中的事物和情景的类(class),并基于这些类来创建对象(object)。根据类来创建对象称为实例化,这样就可以使用类的实例(instance) 一、创建…...
R-INLA实现绿地与狐狸寄生虫数据空间建模:含BYM、SPDE模型及PC先验应用可视化...
全文链接:https://tecdat.cn/?p40720 本论文旨在为对空间建模感兴趣的研究人员客户提供使用R-INLA进行空间数据建模的基础教程。通过对区域数据和地统计(标记点)数据的分析,介绍了如何拟合简单模型、构建和运行更复杂的空间模型&…...
Linux云计算SRE-第十五周
1.总结Dockerfile的指令和Docker的网络模式 一、Dockerfile 核心指令详解 1、基础构建指令 指令 功能描述 关键特性 FROM 指定基础镜像(必须为首条指令) - 支持多阶段构建:FROM node AS builder - scratch 表示空镜像 RUN 在镜像构建…...
2014年下半年试题一:论软件需求管理
论文库链接:系统架构设计师论文 论文题目 软件需求管理是一个对系统需求变更了解和控制的过程。需求管理过程与需求开发过程相互关联,初始需求导出的同时就要形成需求管理规划,一旦启动了软件开发过程需求管理活动就紧密相伴。 需求管理过程中…...
podman加速器配置,harbor镜像仓库部署
Docker加速器 registries加速器 [rootlocalhost ~]# cat /etc/redhat-release CentOS Stream release 8 [rootlocalhost ~]# cd /etc/containers/ [rootlocalhost containers]# ls certs.d policy.json registries.conf.d storage.conf oci registries.conf re…...
信息学奥赛一本通 1522:网络 | OpenJudge 百练 1144:Network
【题目链接】 ybt 1522:网络 OpenJudge 百练 1144:Network 【题目考点】 1. 图论:割点 【解题思路】 每个交换机是一个顶点,如果两地点之间有电话线连接,那么两顶点之间有一条无向边,该图是无向图。 初始时任何地…...
本地部署DeepSeek的硬件配置建议
本地部署DeepSeek的硬件配置需求因模型参数规模和部署工具不同而有所差异,以下是综合多个来源的详细要求: 1. 基础配置(适用于7B参数模型) 内存:最低8GB,推荐16GB及以上;若使用Ollama工具&…...
Redis面试题----Redis 的持久化机制是什么?各自的优缺点?
Redis 提供了两种主要的持久化机制,分别是 RDB(Redis Database)和 AOF(Append Only File),下面将详细介绍它们的原理、优缺点。 RDB(Redis Database) 原理 RDB 持久化是将 Redis 在某个时间点上的数据集快照以二进制文件的形式保存到磁盘上。可以通过手动执行 SAVE …...
C#实现本地AI聊天功能(Deepseek R1及其他模型)。
前言 1、C#实现本地AI聊天功能 WPFOllamaSharpe实现本地聊天功能,可以选择使用Deepseek 及其他模型。 2、此程序默认你已经安装好了Ollama。 在运行前需要线安装好Ollama,如何安装请自行搜索 Ollama下载地址: https://ollama.org.cn Ollama模型下载地址…...
Metal 学习笔记四:顶点函数
到目前为止,您已经完成了 3D 模型和图形管道。现在,是时候看看 Metal 中两个可编程阶段中的第一个阶段,即顶点阶段,更具体地说,是顶点函数。 着色器函数 定义着色器函数时,可以为其指定一个属性。您将在本…...
C# string转unicode字符
在 C# 中,将字符串转换为 Unicode 字符(即每个字符的 Unicode 码点)可以通过遍历字符串中的每个字符并获取其 Unicode 值来实现。Unicode 值是一个整数,表示字符在 Unicode 标准中的唯一编号。 以下是实现方法: 1. 获…...
如何快速开发原神风格3D启动器:基于xviewer.js的完整指南
如何快速开发原神风格3D启动器:基于xviewer.js的完整指南 【免费下载链接】www-genshin 项目地址: https://gitcode.com/GitHub_Trending/ww/www-genshin 原神作为一款现象级开放世界游戏,其精美的视觉风格和流畅的动画效果深受玩家喜爱。本文将…...
如何在3分钟内让Jellyfin媒体库显示中文电影信息?
如何在3分钟内让Jellyfin媒体库显示中文电影信息? 【免费下载链接】jellyfin-plugin-metashark jellyfin电影元数据插件 项目地址: https://gitcode.com/gh_mirrors/je/jellyfin-plugin-metashark MetaShark是一款专为Jellyfin设计的智能元数据插件ÿ…...
怎么鉴定用了Tritan材质?2026权威指南:从感官体验到官方溯源
在健康消费成为主流的今天,Tritan材质凭借其“近似玻璃般透亮、塑料般坚韧”的特性,成为水杯、奶瓶等日用品的“明星材料”。然而,随着市场热度攀升,部分商家开始用普通PET、劣质回收料冒充Tritan。究竟怎么鉴定用了Tritan材质&am…...
用AI重构代码,到底能省多少时间?先看清这5个代价
先说结论AI重构能快速处理命名、注释等基础问题,但复杂模块拆分仍需人工介入提示词设计需要投入时间,否则可能生成不可执行或偏离业务逻辑的代码不同编程语言和框架的适配成本差异很大,Java Spring项目比Python脚本更考验提示词精度从实际开发…...
FanControl完全配置指南:3步打造个性化电脑散热系统
FanControl完全配置指南:3步打造个性化电脑散热系统 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/F…...
单细胞数据合并后,你的聚类图为啥不好看?可能是批次效应在捣鬼
单细胞数据合并后,你的聚类图为啥不好看?可能是批次效应在捣鬼 当你兴奋地将多个单细胞RNA测序样本合并,准备大展拳脚进行聚类分析时,却发现t-SNE或UMAP图上细胞群杂乱无章,本该清晰的细胞类型边界变得模糊不清——这很…...
SP4574锂电池充放电SOC
概述 SP4574 是一款集成开关充电和同步升压功能的单芯片解决方案,内部集成了同步开关充电模块、同步升压放电管理模块、电量检测与 LED 指示模块、保护模块。 SP4574 内置充电与放电功率 MOS,充电电流为 0.42A,同步升压输出电流为 0.8A。 SP4574 采用专利…...
py每日spider案例之某scrape电影数据获取(难度一般)
逆向接口参数: 加密入口: 逆向代码: n=require(crypto-js)function i() {for (var t = Math...
一键解锁蓝奏云高速下载:LanzouAPI直链解析方案深度解析
一键解锁蓝奏云高速下载:LanzouAPI直链解析方案深度解析 【免费下载链接】LanzouAPI 蓝奏云直链,蓝奏api,蓝奏解析,蓝奏云解析API,蓝奏云带密码解析 项目地址: https://gitcode.com/gh_mirrors/la/LanzouAPI 还…...
Koikatu HF Patch完整指南:5步免费解锁200+插件与完整英文翻译
Koikatu HF Patch完整指南:5步免费解锁200插件与完整英文翻译 【免费下载链接】KK-HF_Patch Automatically translate, uncensor and update Koikatu! and Koikatsu Party! 项目地址: https://gitcode.com/gh_mirrors/kk/KK-HF_Patch Koikatu HF Patch是Koik…...
