当前位置：首页 > news >正文

搭配：基于OpenCV的边缘检测实战

news 2026/2/10 7:07:38

引言

计算机中的目标检测与人类识别物体的方式相似。作为人类，我们可以分辨出狗的形象，因为狗的特征是独特的。尾巴、形状、鼻子、舌头等特征综合在一起，帮助我们把狗和牛区分开来。

同样，计算机能够通过检测与估计物体的结构和性质相关的特征来识别物体。其中一个特征就是边缘。

在数学上，边是两个角或面之间的一条线。边缘检测的关键思想是像素亮度差异极大的区域表示边缘。因此，边缘检测是对图像亮度不连续性的一种度量。

Sobel边缘检测

Sobel边缘检测器也称为Sobel–Feldman运算符或Sobel过滤器，它的工作原理是通过计算图像中每个像素的图像强度梯度。

它找到了从亮到暗的最大亮度增加方向以及该方向的变化率。使用该过滤器时，可以分别在X和Y方向上或一起处理图像。

Sobel检测器使用3X3核函数，这些核函数与原始图像进行卷积，计算出导数的近似值。

为了检测图像中的水平边缘(x方向) ，我们将使用x方向内核来扫描图像，用于检测垂直边缘。

import cv2
import numpy as np
import matplotlib.pyplot as plt
# Load the image
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# Convert image to gray scale
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
# 3x3 Y-direction  kernel
sobel_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])
# 3 X 3 X-direction kernel
sobel_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])
# Filter the image using filter2D, which has inputs: (grayscale image, bit-depth, kernel)
filtered_image_y = cv2.filter2D(image_gray, -1, sobel_y)
filtered_image_x = cv2.filter2D(image_gray, -1, sobel_x)

现在，让我们绘制上面代码的输出。

(fig, (ax1, ax2, ax3)) = plt.subplots(1, 3, figsize=(25, 25))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('sobel_x')
ax2.imshow(filtered_image_y)
ax3.title.set_text('sobel_y filter')
ax3.imshow(filtered_image_x)
plt.show()

不需要记住所有的过滤器内核。可以直接在 OpenCV 库中使用您选择的相应过滤器。

在OpenCV中，可以像如下所示应用Sobel边缘检测。

sobel_x_filtered_image = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
sobel_x_filtered_image = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
sobel_y_filtered_image = cv2.convertScaleAbs(sobel_x_filtered_image)
sobel_y_filtered_image = cv2.convertScaleAbs(sobel_y_filtered_image)

Laplacian边缘检测

拉普拉斯边缘检测器比较图像的二阶导数。它测量的是一阶导数在一次通过中的变化率。拉普拉斯边缘检测使用一个核心，包含负值的交叉模式，如下所示。

拉普拉斯边缘检测器的一个缺点是对噪声敏感。也就是说，它可能最终检测噪声作为边缘。在应用拉普拉斯过滤器之前对图像进行平滑处理是一种常见的做法。

我们可以实现一个拉普拉斯边缘检测器如下:

import cv2
import numpy as np
import matplotlib.pyplot as plt
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# remove noise
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
# Reduce noise in image
img = cv2.GaussianBlur(image_gray,(3,3),0)
# Filter the image using filter2D, which has inputs: (grayscale image, bit-depth, kernel)
filtered_image = cv2.Laplacian(img, ksize=3, ddepth=cv2.CV_16S)
# converting back to uint8
filtered_image = cv2.convertScaleAbs(filtered_image)
# Plot outputs
(fig, (ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 15))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('Laplacian Filtered Image')
ax2.imshow(filtered_image, cmap='gray')

Canny边缘检测

Canny边缘检测可以分为如下四个步骤：

· 消除噪音

· 梯度计算

· 利用非最大值抑制提取图像边缘

· 滞后阈值法

因为Canny边缘检测对噪声很敏感，所以第一步就是去噪，通过首先应用高斯滤波器对图像进行平滑处理。

Canny边缘检测的第二步是梯度计算。它通过沿着梯度方向计算图像中灰度(梯度)的变化率来实现。

我们知道图像的亮度在边缘处最高，但实际上，亮度并不是在一个像素处达到峰值; 相反，邻近的像素具有很高的亮度。在每个像素位置，canny 边缘检测比较像素，并在沿梯度方向选择3X3邻域的局部最大值。这个过程被称为非最大值抑制。

这一步结束之后，会形成一些破碎的边缘。最后一步是使用一种叫做滞后阈值的方法来修复这些断裂的边缘。

对于滞后阈值，有两个阈值: 高阈值和低阈值。

任何梯度值高于高阈值的像素自动保持为边缘。对于梯度位于高阈值和低阈值之间的像素，有两种处理方式。检查像素是否可能连接到边缘; 如果连接，则保留像素，否则丢弃。低于低阈值的像素被自动丢弃。

现在，让我们通过OpenCV实现一个Canny边缘检测。

import cv2
import numpy as np
import matplotlib.pyplot as plt
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# remove noise
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
filtered_image = cv2.Canny(image_gray, threshold1=20, threshold2=200)
# Plot outputs
(fig, (ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 15))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('Laplacian Filtered Image')
ax2.imshow(filtered_image, cmap='gray')

· END ·

HAPPY LIFE

觉得有趣就点亮在看吧

搭配：基于OpenCV的边缘检测实战

引言计算机中的目标检测与人类识别物体的方式相似。作为人类，我们可以分辨出狗的形象，因为狗的特征是独特的。尾巴、形状、鼻子、舌头等特征综合在一起，帮助我们把狗和牛区分开来。同样，计算机能够通过检测与估计物体的结构和性…...

编程日记 2023/11/24 15:42:26

AI大发展：人机交互、智能生活全解析

目录编辑人工智能对我们的生活影响有多大人工智能的应用领域一、机器学习与深度学习二、计算机视觉三、自然语言处理四、机器人技术五、智能推荐系统六、智能城市和智能家居编辑自己对人工智能的应用自己的人工智能看法：以ChatGPT为例 …...

编程日记 2023/11/24 15:41:25

Django DRF序列化器serializer

以下案例由浅到深，逐步深入，通过实例介绍了序列化器的使用方法，和遇到的常见问题的解决方法。一、序列化器serializers.Serializer 1、urls.py urlpatterns [path("api/<str:version>/depart/",views.DepartView.as_vie…...

编程日记 2023/11/24 15:40:24

【开源】基于JAVA的衣物搭配系统

项目编号： S 016 ，文末获取源码。 \color{red}{项目编号：S016，文末获取源码。} 项目编号：S016，文末获取源码。目录一、摘要1.1 项目介绍1.2 项目录屏二、研究内容2.1 衣物档案模块2.2 衣物搭配模块2.3 衣…...

编程日记 2023/11/24 15:39:23

Standalone模式两种提交任务方式一、Standalone-client提交任务方式 1、提交命令 ./spark-submit --master spark://mynode1:7077 --class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100 或者 ./spark-submit --master spark…...

编程日记 2023/11/24 15:38:22

webrtc的RTCPeerConnection使用

背景：平时我们很少会需要使用到点对点单独的通讯，即p2p,一般都是点对服务端通讯，但p2p也有自己的好处，即通讯不经过服务端，从服务端角度这个省了带宽和压力，从客户端角度，通讯是安全，且快速的，当然有些情况下可能速度并不一定快。那么如何实现p2p呢？解决办法： …...

编程日记 2023/11/24 15:36:20

【视觉SLAM十四讲学习笔记】第三讲——Eigen库

专栏系列文章如下： 【视觉SLAM十四讲学习笔记】第一讲——SLAM介绍【视觉SLAM十四讲学习笔记】第二讲——初识SLAM 【视觉SLAM十四讲学习笔记】第三讲——旋转矩阵本章将介绍视觉SLAM的基本问题之一：如何描述刚体在三维空间中的运动？ Eigen…...

编程日记 2023/11/24 15:35:19

Ubuntu开机显示recovering journal，进入emergency mode

在一次正常的shutdown -r now之后，服务器启动不起来了，登录界面显示recovering journal，主要报错信息如下所示： /dev/sda2:recovering journal /dev/sda2:Clearn... You are in emergency mode. After logging in, type journalc…...

编程日记 2023/11/24 15:34:18

C++_String增删查改模拟实现

C_String增删查改模拟实现前言一、string默认构造、析构函数、拷贝构造、赋值重载1.1 默认构造1.2 析构函数1.3 拷贝构造1.4 赋值重载二、迭代器和范围for三、元素相关：operator[ ]四、容量相关：size、resize、capacity、reserve4.1 size、capacity4.2…...

编程日记 2023/11/24 15:33:17

LeeCode前端算法基础100题（2）- 最多水的容器

一、问题详情： 给定一个长度为 n 的整数数组 height 。有 n 条垂线，第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。找出其中的两条线，使得它们与 x 轴共同构成的容器可以容纳最多的水。返回容器可以储存的最大水量。说明：…...

编程日记 2023/11/24 15:32:17

排序算法--归并排序

实现逻辑 ① 将序列每相邻两个数字进行归并操作，形成floor(n/2)个序列，排序后每个序列包含两个元素 ② 将上述序列再次归并，形成floor(n/4)个序列，每个序列包含四个元素 ③ 重复步骤②，直到所有元素排序完毕 void pri…...

编程日记 2023/11/24 15:31:15

【LeetCode:1410. HTML 实体解析器 | 模拟+哈希表+字符串+库函数】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持，因为它具有很高的价值，算法就是这样✨ 🌲 作者简介：硕风和炜，…...

编程日记 2023/11/24 15:30:14

基于SSM的公司仓库管理系统（有报告）。Javaee项目

演示视频： 基于SSM的公司仓库管理系统（有报告）。Javaee项目项目介绍： 采用M（model）V（view）C（controller）三层体系结构，通过Spring SpringMvc …...

编程日记 2023/11/24 15:29:13

spark数据倾斜的解决思路

数据倾斜是：多个分区中，某个分区的数据比其他分区的数据多的多数据倾斜导致的问题： 导致某个spark任务耗时较长，导致整个任务耗时增加，甚至出现OOM运行速度慢：主要发生在shuffle阶段，同样的k…...

编程日记 2023/11/24 15:28:12

Python武器库开发-前端篇之html概述(二十八)

前端篇之html概述(二十八) html概述 HTML5是构建Web内容的一种语言描述方式。HTML5是互联网的下一代标准，是构建以及呈现互联网内容的一种语言方式．被认为是互联网的核心技术之一。HTML产生于1990年，1997年HTML4成为互联网标准，…...

编程日记 2023/11/24 15:27:11

安防视频EasyCVR平台太阳能供电+4G摄像头视频监控方案的建设

在工地、光伏、风电站、水库河道等场景中，以及一些偏远地区的项目现场，会存在无网无电情况，大大制约了视频监控系统建设的效率及可行性。在这种场景中，我们也可以通过太阳能供电4G监控摄像机的方案，满足偏远地区无网无…...

编程日记 2023/11/24 15:26:10

12.位运算的性质（异或的性质）

文章目录异或的性质求异或和问题[421. 数组中两个数的最大异或值](https://leetcode.cn/problems/maximum-xor-of-two-numbers-in-an-array/)[2935. 找出强数对的最大异或值 II](https://leetcode.cn/problems/maximum-strong-pair-xor-ii/) 异或前缀和问题（最..回…...

编程日记 2023/11/24 15:25:09

国标直流充电枪9孔分别啥意思？

DC：直流电源正 DC-：直流电源负 PE：接地（搭铁）S：通讯CAN-H S-：通讯CAN-L CC1：充电连接确认 CC2：充电连接确认 A：12V A-：12V- 以上就是国标直流充电…...

编程日记 2023/11/24 15:24:08

关于 Google AMP 和 SEO

Google 于 2015 年首次推出 AMP，即加速移动页面。借助开源 AMP 框架，网页设计师可以制作快速加载的移动网页。该框架的创建是为了应对使用移动设备访问互联网的个人数量的增加。从那时起，谷歌一直在推动使用 AMP 来增强移动设备上的 SEO 和用…...

编程日记 2023/11/24 15:23:07

【SpringMVC】对请求的不同响应

前言本文学习如何运用不同的注解来返回不同的响应. 1.返回静态页面Controller 返回index.html页面 Controller 和 RestController的区别 controller 只有加上这个注解,Spring才会帮我们管理这个代码.后续我们访问时才能访问到. RestController 等同于 Controller ResponseBo…...

编程日记 2023/11/24 15:22:06

conda相比python好处

Conda 作为 Python 的环境和包管理工具，相比原生 Python 生态（如 pip 虚拟环境）有许多独特优势，尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处： 一、一站式环境管理&#xff1a…...

编程新知 2025/11/29 6:54:19

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制指定固定的延迟级别通过在Message中设定一个MessageDelayLevel参数，对应18个预设的延迟级别指定时间点的延迟级别通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

编程新知 2026/2/8 21:59:25

椭圆曲线密码学(ECC)

一、ECC算法概述椭圆曲线密码学（Elliptic Curve Cryptography）是基于椭圆曲线数学理论的公钥密码系统，由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA，ECC在相同安全强度下密钥更短（256位ECC ≈ 3072位RSA…...

编程新知 2025/10/1 22:26:06

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎（Physics Engine） 物理引擎是一种通过计算机模拟物理规律（如力学、碰撞、重力、流体动力学等）的软件工具或库。它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互，广泛应用于游戏开发、动画制作、虚…...

编程新知 2026/2/4 2:08:30

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

微信小程序 - 手机震动

一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码注：文档 https://developers.weixin.qq…...

编程新知 2026/1/29 8:41:55

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备工具安装： 下载安装DevEco Studio 4.0（支持HarmonyOS 5）配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化： ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

编程新知 2026/2/1 4:17:33

新能源汽车智慧充电桩管理方案：新能源充电桩散热问题及消防安全监管方案

随着新能源汽车的快速普及，充电桩作为核心配套设施，其安全性与可靠性备受关注。然而，在高温、高负荷运行环境下，充电桩的散热问题与消防安全隐患日益凸显，成为制约行业发展的关键瓶颈。如何通过智慧化管理手段优化散…...

编程新知 2026/1/29 3:00:56

IT供电系统绝缘监测及故障定位解决方案

随着新能源的快速发展，光伏电站、储能系统及充电设备已广泛应用于现代能源网络。在光伏领域，IT供电系统凭借其持续供电性好、安全性高等优势成为光伏首选，但在长期运行中，例如老化、潮湿、隐裂、机械损伤等问题会影响光伏板绝缘层…...

编程新知 2026/2/1 6:36:36

Xen Server服务器释放磁盘空间

disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

编程新知 2025/11/19 6:04:18

搭配：基于OpenCV的边缘检测实战

相关文章：

搭配：基于OpenCV的边缘检测实战

AI大发展：人机交互、智能生活全解析

Django DRF序列化器serializer

【开源】基于JAVA的衣物搭配系统

Spark---基于Standalone模式提交任务

webrtc的RTCPeerConnection使用

【视觉SLAM十四讲学习笔记】第三讲——Eigen库

Ubuntu开机显示recovering journal，进入emergency mode

C++_String增删查改模拟实现

LeeCode前端算法基础100题（2）- 最多水的容器

排序算法--归并排序

【LeetCode:1410. HTML 实体解析器 | 模拟+哈希表+字符串+库函数】

基于SSM的公司仓库管理系统（有报告）。Javaee项目

spark数据倾斜的解决思路

Python武器库开发-前端篇之html概述(二十八)

安防视频EasyCVR平台太阳能供电+4G摄像头视频监控方案的建设

12.位运算的性质（异或的性质）

国标直流充电枪9孔分别啥意思？

关于 Google AMP 和 SEO

【SpringMVC】对请求的不同响应

conda相比python好处

RocketMQ延迟消息机制

椭圆曲线密码学(ECC)

【OSG学习笔记】Day 18: 碰撞检测与物理交互

阿里云ACP云计算备考笔记 (5)——弹性伸缩

微信小程序 - 手机震动

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

新能源汽车智慧充电桩管理方案：新能源充电桩散热问题及消防安全监管方案

IT供电系统绝缘监测及故障定位解决方案

Xen Server服务器释放磁盘空间