当前位置: 首页 > news >正文

特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。

特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。下面是一些关键的知识点:

1. 特征点检测

特征点检测的目的是从图像中找到独特的、稳定的点,这些点在图像变化(如旋转、缩放、光照变化等)中具有较好的鲁棒性。常见的特征点检测算法包括:

  • SIFT描述符:具有旋转和尺度不变性。
  • SURF描述符:加速的SIFT,计算速度更快。
  • ORB描述符:结合了旋转不变的BRIEF描述符,速度快且具有较好的性能。

1.1 Harris 角点检测器
Harris 角点检测器是最早的一种特征点检测方法,通过计算图像的梯度,找到角点。

import cv2
import numpy as np# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Harris 角点检测
gray = np.float32(gray)
dst = cv2.cornerHarris(gray, 2, 3, 0.04)# 结果通过膨胀标记角点
dst = cv2.dilate(dst, None)# 设置阈值
img[dst > 0.01 * dst.max()] = [0, 0, 255]# 显示结果
cv2.imshow('Harris Corners', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.2 SIFT (Scale-Invariant Feature Transform)
SIFT 是一种尺度不变特征变换算法,能够检测并描述图像中的局部特征点。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints, descriptors = sift.detectAndCompute(gray, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)# 显示结果
cv2.imshow('SIFT Keypoints', img_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.3 ORB (Oriented FAST and Rotated BRIEF)
ORB 是一种快速且高效的特征点检测与描述算法,结合了FAST关键点检测器和BRIEF描述符。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints, descriptors = orb.detectAndCompute(img, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, color=(0, 255, 0))# 显示结果
cv2.imshow('ORB

2. 特征点匹配

特征点匹配是将一幅图像中的特征点与另一幅图像中的特征点进行匹配,以找到它们之间的对应关系。
2.1 Brute-Force匹配
Brute-Force匹配器逐一比较描述符,并找到最相似的描述符对。

import cv2# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = orb.detectAndCompute(img1, None)
keypoints2, descriptors2 = orb.detectAndCompute(img2, None)# 创建Brute-Force匹配器
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)# 进行描述符匹配
matches = bf.match(descriptors1, descriptors2)# 按距离排序
matches = sorted(matches, key=lambda x: x.distance)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('ORB Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.2 FLANN匹配
FLANN是快速最近邻搜索库,适用于大数据集和高维特征的匹配。

import cv2
import numpy as np# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = sift.detectAndCompute(img1, None)
keypoints2, descriptors2 = sift.detectAndCompute(img2, None)# 设置FLANN匹配器参数
FLANN_INDEX_KDTREE = 1
index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)
search_params = dict(checks=50)# 创建FLANN匹配器
flann = cv2.FlannBasedMatcher(index_params, search_params)# 进行描述符匹配
matches = flann.knnMatch(descriptors1, descriptors2, k=2)# 仅保留距离比率小于0.7的匹配
good_matches = []
for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, good_matches, None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('SIFT FLANN Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

3.单应性矩阵

单应性矩阵(Homography Matrix)是一种用于描述两个平面间映射关系的3x3矩阵,常用于图像配准、图像拼接和透视变换等应用中。在计算机视觉中,通过计算单应性矩阵可以将一个图像中的点映射到另一个图像中的对应点,从而实现图像的对齐和变换。

计算单应性矩阵

为了计算单应性矩阵,我们需要至少四对对应的点(即源图像中的点和目标图像中的点)。OpenCV提供了cv2.findHomography函数来计算单应性矩阵。

基本步骤:

  • 读取图像并检测特征点
  • 匹配特征点
  • 计算单应性矩阵
  • 应用单应性矩阵进行图像变换

下面是一个详细的示例代码:

import cv2
import numpy as np# 读取源图像和目标图像
src_img = cv2.imread('source.jpg')
dst_img = cv2.imread('destination.jpg')# 转换为灰度图像
src_gray = cv2.cvtColor(src_img, cv2.COLOR_BGR2GRAY)
dst_gray = cv2.cvtColor(dst_img, cv2.COLOR_BGR2GRAY)# 使用ORB检测关键点和描述符
orb = cv2.ORB_create()
src_keypoints, src_descriptors = orb.detectAndCompute(src_gray, None)
dst_keypoints, dst_descriptors = orb.detectAndCompute(dst_gray, None)# 使用Brute-Force匹配器进行特征点匹配
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(src_descriptors, dst_descriptors)# 按距离排序匹配结果
matches = sorted(matches, key=lambda x: x.distance)# 确保有足够的匹配点对
if len(matches) >= 4:# 提取匹配的点坐标src_pts = np.float32([src_keypoints[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)dst_pts = np.float32([dst_keypoints[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 使用单应性矩阵对源图像进行透视变换height, width, channels = dst_img.shapewarped_img = cv2.warpPerspective(src_img, H, (width, height))# 显示结果cv2.imshow('Warped Image', warped_img)cv2.waitKey(0)cv2.destroyAllWindows()
else:print("Not enough matches found - {}/{}".format(len(matches), 4))
详细说明
  • ORB特征点检测和描述:使用ORB算法检测关键点和描述符。
  • 特征点匹配:使用Brute-Force匹配器对检测到的特征点进行匹配。
  • 检查匹配点对数量:在计算单应性矩阵之前,确保有足够的匹配点对(至少4对)。
  • 计算单应性矩阵和透视变换:如果有足够的匹配点对,计算单应性矩阵并进行透视变换;否则,输出提示信息。

4.项目

用于将两张图像拼接在一起,生成一个全景图。以下是代码的主要步骤和功能:

1.读取和预处理图像:

  • 代码首先读取了两张图片(map1.png 和 map2.png)。
  • 然后将两张图片调整到相同的尺寸(640x480)。
    2.特征点检测和匹配:
  • 使用SIFT(Scale-Invariant Feature Transform)算法检测两张图像中的特征点,并计算特征描述子。
  • 创建一个BFMatcher(Brute-Force Matcher)对象来进行特征匹配。
  • 使用knnMatch方法找到两张图像中的特征点匹配对,并根据距离筛选有效的匹配点。

3.计算单应性矩阵:

  • 通过有效的特征匹配点计算单应性矩阵(Homography Matrix),这个矩阵用于将一张图像变换到另一张图像的坐标系中。
    4.图像变换与拼接:
  • 使用单应性矩阵将第一张图像进行透视变换。
  • 计算结果图像的尺寸,并创建一个新的大图像,将变换后的第一张图像和第二张图像拼接在一起。
    5.显示结果:
  • 最后,将拼接后的结果图像显示出来。

具体代码解释如下:

import cv2
import numpy as npdef stitch_image(img1, img2, H):# 获得原始图的高/宽h1, w1 = img1.shape[:2]h2, w2 = img2.shape[:2]# 获取图像的四个角点img1_dims = np.float32([[0,0], [0, h1], [w1, h1], [w1, 0]]).reshape(-1, 1, 2)img2_dims = np.float32([[0,0], [0, h2], [w2, h2], [w2, 0]]).reshape(-1, 1, 2)# 对第一张图像的角点进行透视变换img1_transform = cv2.perspectiveTransform(img1_dims, H)# 计算结果图像的尺寸result_dims = np.concatenate((img2_dims, img1_transform), axis=0)[x_min, y_min] = np.int32(result_dims.min(axis=0).ravel() - 0.5)[x_max, y_max] = np.int32(result_dims.max(axis=0).ravel() + 0.5)# 平移的距离transform_dist = [-x_min, -y_min]# 平移矩阵transform_array = np.array([[1, 0, transform_dist[0]],[0, 1, transform_dist[1]],[0, 0, 1]])# 对第一张图像进行透视变换和平移result_img = cv2.warpPerspective(img1, transform_array.dot(H), (x_max-x_min, y_max-y_min))# 将第二张图像拼接到结果图像上result_img[transform_dist[1]:transform_dist[1]+h2, transform_dist[0]:transform_dist[0]+w2] = img2return result_imgdef get_homo(img1, img2):# 创建SIFT特征检测对象sift = cv2.xfeatures2d.SIFT_create()# 检测特征点和计算描述子k1, d1 = sift.detectAndCompute(img1, None)k2, d2 = sift.detectAndCompute(img2, None)# 创建特征匹配器bf = cv2.BFMatcher()matches = bf.knnMatch(d1, d2, k=2)# 过滤特征匹配点verify_ratio = 0.8verify_matches = []for m1, m2 in matches:if m1.distance < 0.8 * m2.distance:verify_matches.append(m1)min_matches = 8if len(verify_matches) > min_matches:img1_pts = []img2_pts = []for m in verify_matches:img1_pts.append(k1[m.queryIdx].pt)img2_pts.append(k2[m.trainIdx].pt)img1_pts = np.float32(img1_pts).reshape(-1, 1, 2)img2_pts = np.float32(img2_pts).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(img1_pts, img2_pts, cv2.RANSAC, 5.0)return Helse:print('err: Not enough matches!')exit()# 读取两张图片
img1 = cv2.imread('map1.png')
img2 = cv2.imread('map2.png')# 将两张图片设置成同样大小
img1 = cv2.resize(img1, (640, 480))
img2 = cv2.resize(img2, (640, 480))inputs = np.hstack((img1, img2))# 获得单应性矩阵
H = get_homo(img1, img2)# 进行图像拼接
result_image = stitch_image(img1, img2, H)cv2.imshow('input img', result_image)
cv2.waitKey()

相关文章:

特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。

特征点检测与匹配是计算机视觉中的基础任务之一&#xff0c;广泛应用于图像配准、物体识别、运动估计、三维重建等领域。下面是一些关键的知识点&#xff1a; 1. 特征点检测 特征点检测的目的是从图像中找到独特的、稳定的点&#xff0c;这些点在图像变化&#xff08;如旋转、…...

python——Echarts现交互式动态可视化

数据展示 20192018201720162015201420132012北京5817.15785.91765430.78755081.264723.864027.16093661.10973314.934天津2410.252106.23972310.35522723.52667.112390.35182079.07161760.0201河北3742.673513.86433233.83322849.872649.182446.61662295.62032084.2825山西234…...

【含开题报告+文档+PPT+源码】基于SSM框架的民宿酒店预定系统的设计与实现

开题报告 随着人们旅游需求的增加&#xff0c;民宿行业呈现出快速发展的趋势。传统的住宿方式逐渐无法满足人们对个性化、舒适、便捷的需求&#xff0c;而民宿作为一种新型的住宿选择&#xff0c;逐渐受到人们的青睐。民宿的特点是具有独特的风格、便捷的地理位置、相对亲近的…...

正确理解协程

import asyncio# 定义一个异步函数&#xff08;协程&#xff09; async def say_after(delay, what):# 等待指定的时间await asyncio.sleep(delay)# 打印消息print(what)# 定义另一个异步函数 async def main():# 同时启动两个协程&#xff0c;并等待这2个协程结束await say_af…...

蒙特卡罗方法 - 采样和蒙特卡罗方法篇

序言 蒙特卡罗&#xff08; Monte Carlo \text{Monte Carlo} Monte Carlo&#xff09;方法&#xff0c;也被称为计算机随机模拟方法&#xff0c;是一种基于“随机数”的计算方法。这一方法源于美国在第二次世界大战期间研制原子弹的“曼哈顿计划”。其核心思想是使用随机数&am…...

论文阅读:InternVL v1.5| How Far Are We to GPT-4V? 通过开源模型缩小与商业多模式模型的差距

论文地址&#xff1a;https://arxiv.org/abs/2404.16821 Demo&#xff1a; https://internvl.opengvlab.com Model&#xff1a;https://huggingface.co/OpenGVLab/InternVL-Chat-V1-5 公开时间&#xff1a;2024年4月29日 InternVL1.5&#xff0c;是一个开源的多模态大型语言模…...

什么是电能表PTB认证

电能表PTB认证是指电能表产品经过德国国家计量研究所&#xff08;Physikalisch-Technische Bundesanstalt&#xff0c;简称PTB&#xff09;的认证和审核过程。PTB是德国联邦政府在计量、物理、材料和测试领域的技术专家和合作伙伴&#xff0c;拥有世界领先的技术水平和专业知识…...

C# 单例模式继承

简介&#xff1a;单例模式是软件工程中最著名的模式之一。从本质上讲&#xff0c;singleton 是一个只允许创建自身的单个实例的类&#xff0c;并且通常提供对该实例的简单访问。最常见的是&#xff0c;单例不允许在创建实例时指定任何参数 - 否则&#xff0c;对实例进行第二次请…...

ESP8266模块(WIFI STM32)

目录 一、介绍 二、传感器原理 1.原理图 2.引脚描述 3.ESP8266基础AT指令介绍 4.ESP8266基础工作模式 三、程序设计 main.c文件 esp8266.h文件 esp8266.c文件 四、实验效果 五、资料获取 项目分享 一、介绍 ESP8266是一款嵌入式系统级芯片&#xff0c;它集成了Wi…...

微信小程序学习实录9:掌握wx.chooseMedia实现多图片文件上传功能(选择图片、预览图片、上传图片)

要实现多图片上传到服务器&#xff0c;需要在小程序前端和PHP后端分别进行相应的设置。 基本流程 微信小程序提供了丰富的API来支持多图片上传功能。在微信小程序中实现多图片的选择、预览以及上传到服务器的功能&#xff1a; 1. 选择图片 使用 wx.chooseImage API 可以让用…...

助动词的分类及其缩略形式

助动词的分类及其缩略形式 1. 助动词 (auxiliary verb)2. 基本助动词 (primary auxiliary)2.1. 基本助动词 be、do 和 have2.2. 实义动词 be、do 和 have 3. 情态助动词 (modal auxiliary)3.1. 情态助动词取代情态动词 4. 半助动词 (semi-auxiliary)4.1. 不能与 it ... that-cl…...

Redis——分布式锁

在一个分布式系统中&#xff0c;只要涉及到多个节点访问同一个公共资源的时候&#xff0c;就需要加锁来实现互斥&#xff0c;从而达到线程安全的问题。 但是呢&#xff0c;分布式系统不同一些&#xff0c;因为分布式系统部署在不同的服务器上&#xff0c;很可能大量的请求打到…...

C++面试速通宝典——13

208. class里面定义int a&#xff0c;如果不实现构造函数&#xff0c;实例化这个类&#xff0c;a的值是&#xff1f; ‌‌‌‌  答&#xff1a;a的值是未定义的&#xff08;在C标准中成为“未初始化”&#xff09;。 解释&#xff1a; ‌‌‌‌  在C中&#xff0c;如果一…...

数据结构(二叉树)

1. 树相关术语 父结点/双亲结点&#xff1a;如果一个结点有子结点那么它就是父结点或者双亲结点&#xff1b;例如A是BCDEFG的父结点&#xff0c;J是PQ的父结点等等&#xff1b;子结点&#xff1a;一个结点含有的子树的根节点称为该结点的子结点&#xff1b;如上图的H是D的子结点…...

Windows 通过 Docker 安装 GitLab

1. 安装 Docker Desktop 下载网站&#xff1a;Windows | Docker Docs 2. 拉取 GitLab Docker 镜像 打开 PowerShell 或 命令提示符&#xff0c;拉取 GitLab 镜像&#xff1a; docker pull gitlab/gitlab-ee:latest或则使用社区版&#xff1a; docker pull gitlab/gitlab-ce…...

SQL专项练习第六天

Hive 在处理不同数据需求时的灵活性和强大功能&#xff0c;包括间隔连续问题的处理、行列转换、交易数据查询、用户登录统计以及专利数据分析等方面。本文将介绍五个 Hive 数据处理问题的解决方案&#xff0c;并通过实际案例进行演示。 先在home文件夹下建一个hivedata文件夹&a…...

CSS——属性值计算

CSS——属性值计算 今天来详细讲解一下 CSS的属性值计算过程&#xff0c;这是 CSS 的核心之一&#xff08;另一个是视觉可视化模型&#xff0c;个人理解&#xff0c;这个相对复杂&#xff0c;以后再讲&#xff09;。 基本概念 层叠样式表&#xff1a;Cascade Style Sheet&am…...

408算法题leetcode--第26天

496. 下一个更大元素 I 题目地址&#xff1a;496. 下一个更大元素 I - 力扣&#xff08;LeetCode&#xff09; 题解思路&#xff1a;单调栈&#xff0c;如注释 时间复杂度&#xff1a;O(n m) 空间复杂度&#xff1a;O(n) 代码: class Solution { public:vector<int&g…...

JavaScript 与浏览器存储

JavaScript提供了两种存储数据的方式&#xff1a;LocalStorage和SessionStorage。这两种方式都是浏览器提供的客户端存储解决方案&#xff0c;可以将数据保存在用户的浏览器中&#xff0c;供网站使用。 LocalStorage和SessionStorage的区别在于数据的作用域和生命周期。 Loca…...

Chromium 如何查找已经定义好的mojom函数实现c++

进程通信定义通常都是用.mojom文件或者idl文件格式 以content\common\frame.mojom里面的BeginNavigation函数为例。 一、如何查找BeginNavigation函数定义&#xff0c;在vscode里面直接搜索BeginNavigation&#xff0c;过滤条件 *.idl,*.mojom,*.cc 效果&#xff1a; 这样…...

图文深入理解Oracle DB Scheduler(续)-调度的创建

List item 今天是国庆假期最后一天。窗外&#xff0c;秋雨淅淅沥沥淅淅下个不停。继续深宅家中&#xff0c;闲来无事&#xff0c;就多写几篇博文。 本篇承接前一篇&#xff0c;继续图文深入介绍Oracle DB Scheduler。本篇主要介绍调度的创建。 1. 创建基于时间的作业 • 可以…...

基于Springboot的宠物咖啡馆平台的设计与实现(源码+定制+参考)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…...

Conda答疑

文章目录 优雅的使用Conda管理python环境1. conda info -e 和conda env list区别2.conda创建环境 创建的新环境在哪个文件夹下3. 自定义路径4. anaconda 新建环境 包是来自哪里4.1. 默认 Anaconda 仓库4.2. Conda-Forge4.3. 镜像源4.4. 自定义频道4.5. 总结 5. conda config --…...

Python 工具库每日推荐【PyPDF2】

文章目录 引言Python PDF 处理库的重要性今日推荐:PyPDF2 工具库主要功能:使用场景:安装与配置快速上手示例代码代码解释实际应用案例案例:PDF文件合并案例分析高级特性加密和解密PDF添加水印扩展阅读与资源优缺点分析优点:缺点:总结【 已更新完 TypeScript 设计模式 专栏…...

Nacos的应用

什么是nacos&#xff1f; Nacos是一个开源的动态服务发现&#xff0c;配置管理和服务治理平台。主要用于构建原生应用和微服务架构。它是阿里巴巴开源的项目&#xff0c;整合了配置管理&#xff0c;服务管理&#xff0c;服务发现的功能&#xff0c;核心价值在于帮助用户在云平…...

CSS圆角

在制作网页的过程中&#xff0c;有时我们可能需要实现圆角的效果&#xff0c;以前的做法是通过切图&#xff08;将设计稿切成便于制作成页面的图片&#xff09;&#xff0c;使用多个背景图像来实现圆角。在 CSS3 出现之后就不需要这么麻烦了&#xff0c;CSS3 中提供了一系列属性…...

信息安全工程师(37)防火墙概述

前言 防火墙是一种网络安全系统&#xff0c;旨在监控和控制网络流量&#xff0c;根据预定义的安全规则决定是否允许数据包的传输。 一、定义与功能 定义&#xff1a;防火墙是网络安全的第一道防线&#xff0c;由硬件设备和软件系统共同构成&#xff0c;位于外网与内网之间、公共…...

多元化网络团队应对复杂威胁

GenAI、ML 和 IoT 等技术为威胁者提供了新的工具&#xff0c;使他们更容易针对消费者和组织发起攻击。 从诱骗受害者陷入投资骗局的Savvy Seahorse &#xff0c;到使用 ChatGPT 之类的程序感染计算机并阅读电子邮件的自我复制 AI 蠕虫&#xff0c;新的网络威胁几乎每天都在出现…...

Observer(观察者模式)

1. 意图 定义对象间的一种一对多的依赖关系&#xff0c;当一个对象的状态发生改变时&#xff0c;所有依赖于它的对象都得到通知并被自动更新。 在观察者模式中&#xff0c;有两类对象&#xff1a;被观察者&#xff08;Subject&#xff09;和观察者&#xff08;Observer&#xf…...

Python深度学习进阶与前沿应用:注意力机制、Transformer模型、生成式模型、目标检测算法、图神经网络、强化学习等

近年来&#xff0c;伴随着以卷积神经网络&#xff08;CNN&#xff09;为代表的深度学习的快速发展&#xff0c;人工智能迈入了第三次发展浪潮&#xff0c;AI技术在各个领域中的应用越来越广泛。为了帮助广大学员更加深入地学习人工智能领域最近3-5年的新理论与新技术&#xff0…...