【OpenCV实战】基于 OpenCV 的多尺度与模板匹配目标跟踪设计与实现

文章目录
- 基于 OpenCV 的模板匹配目标跟踪设计与实现
- 1. 摘要
- 2. 系统概述
- 3. 系统原理
- 3.1 模板匹配的基本原理
- 3.2 多尺度匹配
- 4. 逻辑流程
- 4.1 系统初始化
- 4.2 主循环
- 4.3 逻辑流程图
- 5. 关键代码解析
- 5.1 鼠标回调函数
- 5.2 多尺度模板匹配
- 6. 系统优势与不足
- 6.1 优势
- 6.2 不足
- 7. 总结
- 相关资料
基于 OpenCV 的模板匹配目标跟踪设计与实现
1. 摘要
来了来了还是我们可爱的鸡哥
本文介绍了一种基于 OpenCV 的视频目标跟踪,该利用模板匹配技术和多尺度匹配算法,实现对视频中目标的实时跟踪。通过结合鼠标的交互操作和暂停功能,用户可以方便地选择跟踪目标,并在不同的播放状态中查看跟踪效果。文章详细描述了系统的原理、逻辑流程以及实现过程中所涉及的关键公式和逻辑图。
2. 系统概述
本系统旨在实现对视频中目标的实时跟踪,适用于多种应用场景,如安全监控、体育比赛分析和自动驾驶等。系统的核心功能包括:
- 目标选择:通过鼠标拖动选择感兴趣区域(ROI),作为模板。
- 多尺度模板匹配:在不同缩放比例下进行模板匹配,提高跟踪的鲁棒性。
- 暂停与恢复播放:用户可以通过空格键暂停或恢复视频播放,方便观察跟踪效果。
- FPS 显示:实时显示帧率,便于性能评估。
- 状态可视化:通过绘制矩形框和文本提示,直观地展示跟踪状态。
3. 系统原理
3.1 模板匹配的基本原理
模板匹配是一种基于块匹配的算法,通过计算模板图像与目标图像之间的相似度来确定模板在目标图像中的位置。相似度可以通过多种方法计算,本文使用的是归一化互相关系数(Normalized Cross-Correlation, NCC)。
归一化互相关系数公式为:
R i j = ∑ k = 0 w − 1 ∑ l = 0 h − 1 ( I k + x i , l + y j − I ˉ ) ( T k , l − T ˉ ) ∑ k = 0 w − 1 ∑ l = 0 h − 1 ( I k + x i , l + y j − I ˉ ) 2 ∑ k = 0 w − 1 ∑ l = 0 h − 1 ( T k , l − T ˉ ) 2 R_{ij} = \frac{\sum_{k=0}^{w-1} \sum_{l=0}^{h-1} (I_{k+xi, l+yj} - \bar{I})(T_{k,l} - \bar{T})}{\sqrt{\sum_{k=0}^{w-1} \sum_{l=0}^{h-1} (I_{k+xi, l+yj} - \bar{I})^2} \sqrt{\sum_{k=0}^{w-1} \sum_{l=0}^{h-1} (T_{k,l} - \bar{T})^2}} Rij=∑k=0w−1∑l=0h−1(Ik+xi,l+yj−Iˉ)2∑k=0w−1∑l=0h−1(Tk,l−Tˉ)2∑k=0w−1∑l=0h−1(Ik+xi,l+yj−Iˉ)(Tk,l−Tˉ)
其中:
- ( R_{ij} ) 表示在图像 ( I ) 中位置 ( (xi, yj) ) 处的匹配得分。
- ( T_{k,l} ) 是模板图像的像素值。
- ( I_{k+xi, l+yj} ) 是目标图像中的像素值。
- ( \bar{I} ) 和 ( \bar{T} ) 分别是目标图像块和模板图像的均值。
最大值 ( R_{ij} ) 对应的位置即为模板在目标图像中的最佳匹配位置。
3.2 多尺度匹配
为了处理目标在视频中的缩放变化,系统引入了多尺度匹配。在不同缩放比例下,对模板进行缩放并计算匹配得分,找到最佳匹配比例和位置。
多尺度匹配的公式如下:
R best = max s ∈ S ( max i , j R i j ( s ) ) R_{\text{best}} = \max_{s \in S} \left( \max_{i,j} R_{ij}(s) \right) Rbest=s∈Smax(i,jmaxRij(s))
其中:
- ( R_{\text{best}} ) 是所有尺度下的最大匹配得分。
- ( S ) 是预先定义的比例尺集合。
- ( R_{ij}(s) ) 是在比例尺 ( s ) 下的匹配得分。
4. 逻辑流程
4.1 系统初始化
- 打开视频文件或摄像头。
- 获取视频的基本参数(宽度、高度、帧率)。
- 定义窗口和鼠标回调函数。
- 初始化全局变量。
4.2 主循环
- 读取帧:根据暂停状态决定是否读取下一帧。
- 帧处理:
- 调整帧大小以适应显示窗口。
- 绘制鼠标选择的 ROI。
- 执行目标跟踪(如果模板已初始化)。
- 显示帮助信息和状态。
- 按键处理:
- 空格键暂停/恢复播放。
Q键退出系统。
4.3 逻辑流程图
以下是系统的主要逻辑流程图:
5. 关键代码解析
5.1 鼠标回调函数
def mouse_callback(event, x, y, flags, param):global dragging, start_point, end_point, rect, template, tracking, current_frameif event == cv2.EVENT_LBUTTONDOWN:dragging = Truestart_point = (x, y)end_point = (x, y)tracking = Falseelif event == cv2.EVENT_MOUSEMOVE:if dragging:end_point = (x, y)elif event == cv2.EVENT_LBUTTONUP:dragging = Falseend_point = (x, y)# 计算矩形区域x1 = min(start_point[0], end_point[0])y1 = min(start_point[1], end_point[1])x2 = max(start_point[0], end_point[0])y2 = max(start_point[1], end_point[1])rect = (x1, y1, x2 - x1, y2 - y1)# 初始化模板if rect is not None and current_frame is not None:x, y, w, h = recttemplate = current_frame[y:y + h, x:x + w]tracking = True
该函数实现了鼠标选择 ROI 的功能,通过拖动鼠标确定矩形区域,并将其作为模板。
5.2 多尺度模板匹配
def multi_scale_template_match(frame_gray, template_gray, scales=np.linspace(0.8, 1.2, 5)):orig_h, orig_w = template_gray.shape[:2]best_match = Nonebest_match_location = Nonebest_scale = 1.0for scale in scales:resized = cv2.resize(template_gray, (int(orig_w * scale), int(orig_h * scale)))result = cv2.matchTemplate(frame_gray, resized, cv2.TM_CCOEFF_NORMED)_, max_val, _, max_loc = cv2.minMaxLoc(result)if best_match is None or max_val > best_match:best_match = max_valbest_match_location = max_locbest_scale = scalereturn best_match_location, best_scale
该函数通过多尺度匹配,找到最佳匹配位置和比例,提高了跟踪的鲁棒性。
6. 系统优势与不足
6.1 优势
交互性强:用户可以通过鼠标选择 ROI,操作简单直观。
鲁棒性高:多尺度匹配提高了对目标缩放变化的适应能力。
实时性好:通过优化模板匹配和暂停功能,保证了系统的实时性。
6.2 不足
对光照和视角变化敏感:模板匹配方法在光照和视角变化较大的场景下效果不佳。
背景复杂的场景:在背景复杂或目标特征不明显时,跟踪效果可能不稳定。
总的来讲模板匹配不适合剧烈运动一类。
7. 总结
本文介绍的视频目标跟踪系统基于 OpenCV 实现,具有较强的交互性和鲁棒性。通过多尺度模板匹配和暂停功能,用户可以方便地选择跟踪目标并观察跟踪效果。然而,系统在光照变化和复杂背景场景下的表现仍有待改进。未来的研究可以结合深度学习方法,进一步提高跟踪的准确性和鲁棒性。
希望这篇文章能满足您的需求!如果有任何需要调整或补充的地方,请随时告诉我。
相关资料
Pythonopencv教程
opencv教程
相关文章:
【OpenCV实战】基于 OpenCV 的多尺度与模板匹配目标跟踪设计与实现
文章目录 基于 OpenCV 的模板匹配目标跟踪设计与实现1. 摘要2. 系统概述3. 系统原理3.1 模板匹配的基本原理3.2 多尺度匹配 4. 逻辑流程4.1 系统初始化4.2 主循环4.3 逻辑流程图 5. 关键代码解析5.1 鼠标回调函数5.2 多尺度模板匹配 6. 系统优势与不足6.1 优势6.2 不足 7. 总结…...
将有序数组转换为二叉搜索树(力扣108)
这道题需要在递归的同时使用双指针。先找到一个区间的中间值,当作子树的父节点,再递归该中间值的左区间和右区间,用于生成该父节点的左子树和右子树。这就是此题的递归逻辑。而双指针就体现在每一层递归都要使用左指针和右指针来找到中间值。…...
开放式TCP/IP通信
一、1200和1200之间的开放式TCP/IP通讯 第一步:组态1214CPU,勾选时钟存储器 第二步:防护与安全里面连接机制勾选允许PUT/GET访问 第三步:添加PLC 第四步:点击网络试图,选中网口,把两个PLC连接起…...
S4 HANA (递延所得税传输)Deferred Tax Transfer - S_AC0_52000644
本文主要介绍在S4 HANA OP中S4 HANA (递延所得税传输)Deferred Tax Transfer - S_AC0_52000644的后台配置及前台操作。具体请参照如下内容: 目录 Deferred Tax Transfer - S_AC0_52000644 1. 后台配置 1.1 Business Transaction Events激活- FIBF 2. 前台操作 …...
如何从0开始做自动化测试?
自动化测试是使用软件工具在应用程序上自动运行测试的过程,无需任何人为干预。这可以通过减少手动测试的需要来保存时间并提高软件开发过程的效率。由于人为错误或不一致性,手动测试可能容易出错,这可能导致错误未被检测到。自动化测试通过…...
DeepSeek服务器繁忙问题的原因分析与解决方案
一、引言 随着人工智能技术的飞速发展,DeepSeek 等语言模型在众多领域得到了广泛应用。然而,在春节这段时间的使用过程中,用户常常遭遇服务器繁忙的问题,这不仅影响了用户的使用体验,也在一定程度上限制了模型的推广和…...
C#,入门教程(10)——常量、变量与命名规则的基础知识
上一篇: C#,入门教程(09)——运算符的基础知识https://blog.csdn.net/beijinghorn/article/details/123908269 C#用于保存计算数据的元素,称为“变量”。 其中一般不改变初值的变量,称为常变量,简称“常量”。 无论…...
宏观经济:信贷紧缩与信贷宽松、通货膨胀与通货紧缩以及经济循环的四个周期
目录 信贷紧缩与信贷宽松信贷紧缩信贷宽松信贷政策对经济影响当前政策环境 通货膨胀与通货紧缩通货膨胀通货紧缩通货膨胀与通货紧缩对比 经济循环的四个周期繁荣阶段衰退阶段萧条阶段复苏阶段经济周期理论解释经济周期类型 信贷紧缩与信贷宽松 信贷紧缩 定义:金融…...
分层解耦.
三层架构 controller:控制层,接收前端发送的请求,对请求进行处理,并响应数据 service:业务逻辑层,处理具体的业务逻辑 dao:数据访问层(Data Access Object)(持久层),负责数据访问操作,包括数据的增、删、改…...
JAVA异步的TCP 通讯-客户端
一、客户端代码示例 import java.io.IOException; import java.net.InetSocketAddress; import java.nio.ByteBuffer; import java.nio.channels.AsynchronousSocketChannel; import java.nio.channels.CompletionHandler; import java.util.concurrent.ExecutorService; impo…...
MySQL的存储引擎对比(InnoDB和MyISAM)
InnoDB 特点: 事务支持:InnoDB 是 MySQL 默认的事务型存储引擎,支持 ACID(原子性、一致性、隔离性、持久性)事务。行级锁定:支持行级锁,能够并发执行查询和更新操作,提升多用户环境…...
【2025-02-06】简单算法:相向双指针 盛最多水的容器 接雨水
📝前言说明: ●本专栏主要记录本人的基础算法学习以及LeetCode刷题记录,主要跟随B站博主灵茶山的视频进行学习,专栏中的每一篇文章对应B站博主灵茶山的一个视频 ●题目主要为B站视频内涉及的题目以及B站视频中提到的“课后作业”。…...
2.6-组合博弈入门
组合博弈入门 组合游戏 要求 有两个玩家;游戏的操作状态是一个有限的集合(比如:限定大小的棋盘);游戏双方轮流操作;双方的每次操作必须符合游戏规定;当一方不能将游戏继续进行的时候…...
【教学】推送docker仓库
引言 Docker Hub 这个最常见的公共 Docker 仓库为例,本文将介绍如何把本地 Docker 镜像推送到公共 Docker 仓库 1. 注册 Docker Hub 账号 如果你还没有 Docker Hub 账号,需要先在 Docker Hub 官网 进行注册。注册完成后,记住你的用户名和密…...
【大数据技术】本机PyCharm远程连接虚拟机Python
本机PyCharm远程连接虚拟机Python 注意:本文需要使用PyCharm专业版。 pycharm-professional-2024.1.4VMware Workstation Pro 16CentOS-Stream-10-latest-x86_64-dvd1.iso写在前面 本文主要介绍如何使用本地PyCharm远程连接虚拟机,运行Python脚本,提高编程效率。 注意: …...
3060显卡掉帧是为什么?3060掉帧卡顿解决方法
NVIDIA GeForce RTX 3060是一款性能强劲的显卡,它可以在高画质的情况下运行大多数的游戏,但是也有一些用户反映,3060玩游戏时会出现掉帧和卡顿的现象,这让很多玩家感到困扰。那么,3060显卡掉帧是什么原因呢?…...
Kubernetes集群通过Filebeat收集日志
Filebeat收集容器日志,其中NODE_NAME配置,是将node信息添加到日志中,所以需要serviceAccount权限,如果不需要配置NODE信息,可以不创建serviceAccount,其他内容可根据实际情况修改 apiVersion: v1 kind: Ser…...
SQLAlchemy-2.0中模型定义和alembic的数据库迁移工具
SQLAlchemy-2.0中模型定义和alembic的数据库迁移工具 一、SQLAIchemy的介绍二、数据库引擎1、支持的数据库1.1、sqlite数据库1.2、MySQL数据库1.3、数据库引擎的参数 三、定义模型类1、定义模型2、engine负责数据库迁移 四、alembic数据库迁移⼯具1、安装alembic2、初始化alemb…...
[含文档+PPT+源码等]精品基于Python实现的django个性化健康餐计划订制系统
软件开发环境及开发工具: 开发语言:python 使用框架:Django 前端技术:JavaScript、VUE.js(2.X)、css3 开发工具:pycharm、Visual Studio Code、HbuildX 数据库:MySQL 5.7.26&am…...
Python3中异常处理:try/except语句
一. 简介 什么是异常处理 ? 在 Python中,异常处理是一种用于管理程序运行时错误的机制。通过使用异常处理,你可以编写更加健壮和可靠的代码。 Python 提供了 try,except,else和 finally关键字来处理异常,…...
【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型
摘要 拍照搜题系统采用“三层管道(多模态 OCR → 语义检索 → 答案渲染)、两级检索(倒排 BM25 向量 HNSW)并以大语言模型兜底”的整体框架: 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后,分别用…...
观成科技:隐蔽隧道工具Ligolo-ng加密流量分析
1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具,该工具基于TUN接口实现其功能,利用反向TCP/TLS连接建立一条隐蔽的通信信道,支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式,适应复杂网…...
铭豹扩展坞 USB转网口 突然无法识别解决方法
当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...
golang循环变量捕获问题
在 Go 语言中,当在循环中启动协程(goroutine)时,如果在协程闭包中直接引用循环变量,可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下: 问题背景 看这个代码片段: fo…...
在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能
下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...
为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
3403. 从盒子中找出字典序最大的字符串 I
3403. 从盒子中找出字典序最大的字符串 I 题目链接:3403. 从盒子中找出字典序最大的字符串 I 代码如下: class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...
【生成模型】视频生成论文调研
工作清单 上游应用方向:控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...
