OpenCV中的SIFT特征提取
文章目录
- 引言
- 一、SIFT算法概述
- 二、OpenCV中的SIFT实现
- 2.1 基本使用
- 2.1.1 导入库
- 2.1.2 图片预处理
- 2.1.3 创建SIFT检测器
- 2.1.4 检测关键点并计算描述符
- 2.1.5 检测关键点并计算描述符并对关键点可视化
- 2.1.6 印关键点和描述符的形状信息
- 2.2 参数调优
- 三、SIFT的优缺点分析
- 3.1 优点
- 3.2 缺点
- 结语
引言
在计算机视觉领域,特征提取是许多任务的基础步骤,如图像匹配、目标识别和三维重建等。SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)是一种经典的特征提取算法,由David Lowe在1999年提出。本文将详细介绍SIFT算法的原理,并通过OpenCV实现展示其应用。
一、SIFT算法概述
SIFT是一种基于局部特征的图像处理算法,具有以下突出特点:
- 尺度不变性:在不同尺度的图像中都能检测到相同的特征点
- 旋转不变性:不受图像旋转的影响
- 光照鲁棒性:对光照变化不敏感
- 视角部分不变性:能够处理一定程度的视角变化
二、OpenCV中的SIFT实现
OpenCV提供了简洁的SIFT接口:
2.1 基本使用
2.1.1 导入库
import cv2
import numpy as np
- 导入opencv库和numpy库
2.1.2 图片预处理
image = cv2.imread('man.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
- 读取图像并转换为灰度图
2.1.3 创建SIFT检测器
sift = cv2.SIFT_create()
- 功能:创建一个 SIFT 特征检测器 对象。
- 细节:SIFT 是一种经典的 局部特征提取算法,对尺度、旋转、光照变化具有鲁棒性。
- cv2.SIFT_create() 是 OpenCV 中初始化 SIFT 检测器的方式(需 OpenCV ≥ 4.4.0,早期版本用cv2.xfeatures2d.SIFT_create())。
2.1.4 检测关键点并计算描述符
kp = sift.detect(gray)
功能:在灰度图像 gray 上检测关键点(keypoints)。
细节:
sift.detect() 会返回一个列表 kp,其中每个元素是一个 KeyPoint 对象,包含以下属性:
- pt:关键点的坐标 (x, y)。
- size:关键点的尺度(scale)。
- angle:方向(角度,0-360°)。
- response:关键点的强度(可用于筛选)。
- octave:所在金字塔层级(尺度空间)
2.1.5 检测关键点并计算描述符并对关键点可视化
man_sift = cv2.drawKeypoints(man,kp,None,flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
输入参数:
- man:原始 BGR 彩色图像(NumPy 数组)。
- kp:SIFT 检测到的关键点列表(cv2.KeyPoint 对象组成的列表)。
- None:可选参数,表示输出图像(如果为 None,函数会新建一个图像)。
- flags:控制关键点的绘制方式。
输出:
- man_sift:绘制了关键点后的新图像(BGR 格式)
关键参数详解:flags
flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS 表示 “以丰富格式绘制关键点”,具体效果包括:
- 圆圈标记:每个关键点用一个圆圈表示,圆圈的 半径 表示该关键点的 尺度(scale)(尺度越大,圆圈越大)。
- 方向指示:圆圈内有一条直线,表示关键点的 主方向(angle)(方向由 SIFT 计算得出)。
- 颜色对比:默认关键点会以醒目的颜色(如红色、绿色)绘制,与原始图像形成对比。
如果省略 flags 或设置为 cv2.DRAW_MATCHES_FLAGS_DEFAULT,则仅用简单的小点标记位置,不显示尺度和方向。
2.1.6 印关键点和描述符的形状信息
kp,des = sift.compute(man,kp)
print(np.array(kp).shape,des.shape)
1.sift.compute(man, kp)
功能:基于原始图像 man 和已检测到的关键点 kp,计算每个关键点的 描述符(descriptor)。
输入参数:
- man:原始图像(BGR 或灰度格式)。虽然 SIFT 检测通常在灰度图上进行,但 compute() 可以接受彩色图像(内部会自动转换为灰度)。
- kp:之前通过 sift.detect() 得到的关键点列表(cv2.KeyPoint 对象的列表)。
输出:
- kp:更新后的关键点列表(可能与输入相同,但某些实现可能会过滤掉无法计算描述符的关键点)。
- des:描述符的 NumPy 数组,形状为 (n_keypoints, 128),数据类型通常为 np.float32。
2.print(np.array(kp).shape, des.shape)
功能:打印关键点列表 kp 和描述符数组 des 的形状。
输出含义:
- np.array(kp).shape:将关键点列表 kp 转换为 NumPy 数组后的形状。由于 kp 是 cv2.KeyPoint对象的列表,直接转换后的形状是 (n_keypoints,)(表示有 n_keypoints 个关键点)。
- 注意:cv2.KeyPoint 对象的属性(如坐标、尺度等)需要通过 kp[i].pt、kp[i].size 等方式单独访问。
- des.shape: 描述符数组的形状为 (n_keypoints, 128),表示每个关键点对应一个 128 维的特征向量(SIFT 描述符的固定维度)。
2.2 参数调优
OpenCV的SIFT实现提供了多个可调参数:
# 自定义参数创建SIFT
sift = cv2.SIFT_create(nfeatures=0, # 保留的特征点数量,0表示不限制nOctaveLayers=3, # 每组(octave)中的层数contrastThreshold=0.04, # 对比度阈值edgeThreshold=10, # 边缘阈值sigma=1.6 # 高斯模糊的初始sigma值
)
三、SIFT的优缺点分析
3.1 优点
- 对尺度、旋转、光照变化具有鲁棒性
- 特征区分性强,匹配准确率高
- 算法成熟,有大量实际应用验证
3.2 缺点
- 计算复杂度高,实时性较差
- 对模糊图像和非刚性变形敏感
- 专利限制(已过期)
结语
SIFT作为计算机视觉领域的里程碑算法,尽管已有20多年历史,但其核心思想仍影响着现代特征提取方法的发展。通过OpenCV的简洁接口,我们可以轻松地将这一强大工具应用到各种视觉任务中。理解SIFT的原理和实现,对于掌握更先进的视觉算法也大有裨益。
相关文章:
OpenCV中的SIFT特征提取
文章目录 引言一、SIFT算法概述二、OpenCV中的SIFT实现2.1 基本使用2.1.1 导入库2.1.2 图片预处理2.1.3 创建SIFT检测器2.1.4 检测关键点并计算描述符2.1.5 检测关键点并计算描述符并对关键点可视化2.1.6 印关键点和描述符的形状信息 2.2 参数调优 三、SIFT的优缺点分析3.1 优点…...

【金仓数据库征文】-《深入探索金仓数据库:从基础到实战》
目录 前言 什么是金仓数据库? 金仓数据库的特点 金仓数据库的核心特点 金仓数据库与其他数据库的对比 金仓数据库的安装 常见的语句 总结 前言 为助力开发者、运维人员及技术爱好者快速掌握这一工具,本文将系统性地介绍金仓数据库的核心知识。内…...

RocketMQ 主题与队列的协同作用解析(既然队列存储在不同的集群中,那要主题有什么用呢?)---管理命令、配置安装
学习之前呢需要会使用linux的基础命令 一.RocketMQ 主题与队列的协同作用解析 在 RocketMQ 中,主题(Topic)与队列(Queue)的协同设计实现了消息系统的逻辑抽象与物理存储分离。虽然队列实际存储在不同集群的 B…...

从岗位依附到能力生态:AI革命下“什么叫就业”的重构与价值
在人工智能(AI)技术深刻重塑社会生产关系的当下,“就业”这一概念正经历着从“职业绑定”到“能力变现”的范式转移。本文将从传统就业观的解构、AI赋能艺术教育的价值逻辑、以及未来就业形态的进化方向三个维度,探讨技术驱动下就业的本质变革,并揭示AI技术如何通过教育创…...
leetcode_二叉树 230. 二叉搜索树中第 K 小的元素
230. 二叉搜索树中第 K 小的元素 给定一个二叉搜索树的根节点 root ,和一个整数 k ,请你设计一个算法查找其中第 k 小的元素(从 1 开始计数)。 示例 1: 输入:root [3,1,4,null,2], k 1输出:1…...

海外版高端Apple科技汽车共享投资理财系统
这一款PHP海外版高端Apple、科技汽车、共享投资理财系统phplaravel框架。...
架构-软件架构设计
一、软件架构基础概念 1. 软件架构的定义 通俗理解:软件架构是软件系统的“骨架”,定义了系统的结构、行为和属性,就像盖房子的设计图纸,规划了房间布局、承重结构和功能分区。核心作用: 沟通桥梁:让技术…...

企业为何要禁止“片断引用开源软件代码”?一文看透!
开篇故事:一段“开源代码”引发的百亿级灾难 某电商平台为快速上线新功能,从GitHub复制了一段“高性能加密算法”代码到支付系统中。 半年后,黑客通过该代码中的隐藏后门,盗取百万用户信用卡信息。 事后调查:这段代…...
yolo常用操作(长话短说)热力图,特征图,结构图,训练,测试,预测
训练 from ultralytics import YOLOmodel YOLO(ryolo11n.yaml) # 改为模型文件名model.load(yolo11n.pt) # 权重文件名,官网下载results model.train(datarfish.yaml, # 数据yaml文件epochs300,batch8,device0,workers0,workspace4) yaml文件不会搞的࿰…...

【C++指南】告别C字符串陷阱:如何实现封装string?
🌟 各位看官好,我是egoist2023! 🌍 种一棵树最好是十年前,其次是现在! 💬 注意:本章节只详讲string中常用接口及实现,有其他需求查阅文档介绍。 🚀 今天通过了…...

国内ip地址怎么改?详细教程
在中国,更改IP地址需要遵守规则,并确保所有操作合规。在特定情况下,可能需要修改IP地址以满足不同需求或解决特定问题。以下是一些常见且合法的IP地址变更方法及注意事项: 一、理解IP地址 IP地址是设备在网络中的唯一标识&#x…...

模式设计简介
设计模式简介 设计模式是软件开发中经过验证的最佳实践解决方案,它是针对特定问题的通用解决方案,能够帮助开发者提升代码的可维护性、可扩展性和复用性。设计模式并非具体的代码实现,而是一种解决问题的思路和方法论,它源于大量的实践经验总结,旨在解决软件开发过程中反…...

众趣科技X世界读书日丨数字孪生技术赋能图书馆空间智慧化运营
4月23日,是第30个“世界读书日”,不仅是庆祝阅读的日子,更是思考知识传播未来的契机。 图书馆作为主要传播图书的场所,在科技的发展中,图书馆正面临前所未有的挑战,联合国数据显示,全球近30%的…...

MySQL 事务(详细版)
目录 一、事务简介 1、事务的概念 2、事务执行的案例 3、对于事务的理解 二、事务操作 (一)未控制事务 (二)控制事务一 (三)控制事务二 三、事务四大特性 四、并发事务问题 五、事务隔离…...

c++之网络编程
网络编程:使得计算机程序能够在网络中发送和接受数据,从而实现分布式系统和网络服务的功能。 作用:使应用程序能够通过网络协议与其他计算机程序进行数据交换 基本概念 套接字(socket): 套接字是网络通信…...
支付场景下,乐观锁的实现(简洁版)
1、问题描述 看到一个同事建的数据库表,好奇打开看看。 create table db_paycenter.t_pay_order_divide (id bigint auto_increment comment 主键id|20250402|XXXprimary key,user_id bigint not null comment user…...

MySQL8的安装方法
概述: MySQL对于开发人员来说,并不陌生。但是很多朋友提起安装MySQL就很头疼,如果一不小心安装失败,再现安装第二遍就变得更加头疼。今天给大家分享一个比较非常简单好安装的方法,并且删除或者卸载也都非常容易 下载…...

CF每日4题
1500左右的做到还是有点吃力 2093E 1500 二分答案 题意:给定一个长度为 n 的数组,现在要把它切成 k 份,求每一份最小的MEX中的最大值。 就是找最大值,但是这个值是所有段最小的值采用二分答案,二分这个值࿰…...

基于 Spring Boot 瑞吉外卖系统开发(七)
基于 Spring Boot 瑞吉外卖系统开发(七) 新增菜品页面 菜品管理页面提供了一个“新增菜品”按钮,单击该按钮时,会打开新增菜品页面。 菜品分类列表 首先要获取分类列表数据。 请求路径/category/list,请求方法GE…...

二项式分布html实验
二项式分布html实验 本文将带你一步步搭建一个纯前端的二项分布 Monte-Carlo 模拟器。 只要一个 HTML 文件,打开就能运行: 动态输入试验次数 n、成功概率 p 与重复次数 m点击按钮立刻得到「模拟频数 vs 理论频数」柱状图随着 m 增大,两组柱状…...
什么是非关系型数据库
什么是非关系型数据库? 引言 随着互联网应用的快速发展,传统的基于表格的关系型数据库(如 MySQL、Oracle 等)已经不能完全满足现代应用程序的需求。在这种背景下,非关系型数据库(NoSQL 数据库)…...

java配置
环境变量...
MySQL性能常用优化技巧总结
1. 索引优化 创建合适的索引 -- 为常用查询条件创建索引 ALTER TABLE users ADD INDEX idx_email (email); ALTER TABLE orders ADD INDEX idx_customer_date (customer_id, order_date);避免索引失效的情况 -- 避免在索引列上使用函数 SELECT * FROM users WHERE DATE(crea…...

大模型如何作为reranker?
大模型如何作为reranker? 作者:爱工作的小小酥 原文地址:https://zhuanlan.zhihu.com/p/31805674335 只为了感动自己而去做一些事情纯属浪费时间。 ————爱工作的小小酥 引言 用于检索的模型中,我们最熟悉的就是单塔和双塔了&…...

发放优惠券
文章目录 概要整体架构流程技术细节小结 概要 发放优惠券 处于暂停状态,或者待发放状态的优惠券,在优惠券列表中才会出现发放按钮,可以被发放: 需求分析以及接口设计 需要我们选择发放方式,使用期限。 发放方式分…...
Java大师成长计划之第3天:Java中的异常处理机制
📢 友情提示: 本文由银河易创AI(https://ai.eaigx.com)平台gpt-4o-mini模型辅助创作完成,旨在提供灵感参考与技术分享,文中关键数据、代码与结论建议通过官方渠道验证。 在 Java 编程中,异常处理…...

试完5个AI海报工具后,我投了秒出设计一票!
随着AI技术的不断发展,越来越多的AI生成工具进入了设计领域,海报生成工具成为了其中的重要一员。今天,我们将为大家介绍三款热门的AI海报生成工具,并进行对比分析,帮助大家选择最适合的工具。 1. 秒出设计:…...
SD2351核心板:重构AI视觉产业价值链的“超级节点”
在AI视觉技术狂飙突进的当下,一个吊诡的现象正在浮现:一方面,学术界不断刷新着ImageNet等基准测试的精度纪录;另一方面,产业界却深陷“算法有、场景无,技术强、落地难”的怪圈。明远智睿SD2351核心板的问世…...

PH热榜 | 2025-04-25
1. LambdaTest Accessibility Testing Suite 标语:轻松点击,确保网站的包容性和合规性。 介绍:LambdaTest 的可访问性测试工具可以自动识别你的网站和网络应用中是否符合 WCAG(网页内容无障碍指南)标准。你可以设置定…...

模方ModelFun是什么?如何安装?
摘要:本文主要介绍模方ModelFun的软件简介、特性、安装环境配置、插件及软件安装。 1.软件简介 模方是一款实景三维模型的场景修饰与单体化建模工具,是建模的后处理软件,包括网格模型编辑和单体化建模两大模块。 场景修饰模块可以对 OBJ、OSG…...