《opencv实用探索·十八》Camshift进行目标追踪流程
CamShift(Continuously Adaptive Mean Shift)是一种用于目标跟踪的方法,它是均值漂移(Mean Shift)的扩展,支持对目标的旋转跟踪,能够对目标的大小和形状进行自适应调整。
cv::CamShift和cv::meanShift区别:
cv::meanShift: 这是一种用于均值漂移目标跟踪的算法。它基于颜色直方图的均值漂移,寻找输入图像中与模板颜色直方图最相似的区域。在这个算法中,窗口的位置根据均值漂移进行调整,直到找到目标对象。cv::meanShift 返回找到的目标的矩形区域。但它的不足之处在于检测窗口的大小是固定的,而目标是不断变化的比如由近到远,各种旋转,固定的窗口是不合适的。
cv::CamShift: 这是 cv::meanShift 的扩展,用于在图像中寻找旋转目标的位置。cv::CamShift 在 cv::meanShift 的基础上引入了旋转矩形,使得它能够更好地适应旋转目标的情况。实际上,cv::CamShift 返回的是一个旋转矩形(cv::RotatedRect),而不仅仅是矩形。同时,能够对目标的大小和形状进行自适应调整,适用于目标尺寸和形状变化较大的情况下。
下面左图是meanShift,右图是CamShift追踪效果对比,可以看到随着目标有近到远变小,meanShfit追踪窗口始终固定不变,而CamShift能实时变化。
meanShift原理:
图中一堆点集,任意位置有个圆形窗口(黑色圆),可以看到窗口的圆心(点1位置)和窗口的质心(点2位置)并不重合,那么这个窗口的圆心便会向质心的方向移动,当圆心1与质心2大致重合时圆的位置大概在红色圆的位置,此时在被红色圆覆盖的点集中3的位置为点集最密集的地方,此时红色圆的质心又被更新到3的位置,那么圆便会继续从2的位置向3的位置移动。
不断执行上面的过程直到圆心最终和质心大致重合。每次迭代移动的矢量即meanShift。
meanShift算法的基本思路:
先设置一个感兴趣窗口(通常为矩形),计算窗口内像素的颜色直方图作为目标对象,根据目标对象的颜色分布,通过不断迭代计算窗口的平均漂移来更新窗口的位置和大小,从而实现目标的实时跟踪。
camShift算法原理是在meanShift基础上加入了自适应调整目标窗口大小和旋转方向实现目标的实时跟踪。
利用opencv的camShift算法来追踪目标:
RotatedRect CamShift( InputArray probImage, CV_IN_OUT Rect& window,TermCriteria criteria );
probImage:表示概率图像,通常是反向投影的结果。反向投影是基于目标的颜色直方图,用于估计在图像中的可能位置。
window:输入时表示追踪的初始窗口,输出时表示找到的新窗口。这是一个矩形,也就是目标区域的初始位置。
criteria:指定迭代的停止条件,通常是一个 cv::TermCriteria 类型的对象。它定义了迭代的最大次数、最小精度,或两者的组合。
cv::CamShift 函数返回一个 cv::RotatedRect 对象,它表示找到的目标的位置、方向和大小。
camShift追踪流程:
(1)首先在图像上选定一个目标区域(通常为矩形)
(2)计算选定区域的直方图分布,一般是HSV色彩空间的直方图。
(3)对下一帧图像B同样计算直方图分布。
(4)计算图像B当中与选定区域直方图分布最为相似的区域,即比较图像B的直方图和目标对象的直方图,生成一个反向投影图像。这个反向投影图像的每个像素值表示图像B该位置的像素值与目标对象直方图的相似程度。(反向投影图像可以将图像中与给定模式(目标对象)具有相似颜色分布的区域显著地突出显示)
(5)使用camshift算法将选定区域沿着最为相似的部分进行移动,直到找到最相似的区域,便完成了在图像b中的目标追踪。
(6)重复3到5的过程,就完成整个视频目标追踪。
下面是代码示例:
#include <opencv2/opencv.hpp>
#include <iostream>
using namespace cv;
using namespace std;
//-----------------------------------【全局变量声明】-----------------------------------------
// 描述:声明全局变量
//-------------------------------------------------------------------------------------------------
Mat image;
bool selectObject = false;
Point origin;
Rect selection;
int vmin = 10, vmax = 255, smin = 30;
bool isSelectRoi = false;
bool targetTrackingEnable = false;
Mat roi_hist;
int channels[] = { 0 };
int histSize = 180; //bin分为180份
float range[] = { 0, 180 };
const float* histRange = { range };
TermCriteria term_crit_; //--------------------------------【onMouse( )回调函数】------------------------------------
// 描述:鼠标操作回调
//-------------------------------------------------------------------------------------------------
static void onMouse(int event, int x, int y, int, void*)
{if (selectObject){selection.x = MIN(x, origin.x);selection.y = MIN(y, origin.y);selection.width = std::abs(x - origin.x);selection.height = std::abs(y - origin.y);selection &= Rect(0, 0, image.cols, image.rows);}switch (event){case EVENT_LBUTTONDOWN:origin = Point(x, y);selection = Rect(x, y, 0, 0);selectObject = true;targetTrackingEnable = false;break;case EVENT_LBUTTONUP:selectObject = false;if (selection.width > 0 && selection.height > 0)isSelectRoi = true;break;}
}int main(int argc, const char** argv)
{VideoCapture cap;Rect trackWindow;int hsize = 16;float hranges[] = { 0,180 };const float* phranges = hranges;cap.open(0);if (!cap.isOpened()){cout << "不能初始化摄像头\n";}namedWindow("Histogram", 0);namedWindow("CamShift Demo", 0);setMouseCallback("CamShift Demo", onMouse, 0);//设置滚动条可以在二值化图像时实时改变阈值createTrackbar("Vmin", "CamShift Demo", &vmin, 256, 0);createTrackbar("Vmax", "CamShift Demo", &vmax, 256, 0);createTrackbar("Smin", "CamShift Demo", &smin, 256, 0);Mat frame;for (;;){cap >> frame;if (frame.empty())break;frame.copyTo(image);if (isSelectRoi){//获取第一帧图像并指定ROI区域Mat roi_hsv;Mat roi = image(selection); //截取鼠标绘制的roicvtColor(roi, roi_hsv, COLOR_BGR2HSV); //把roi图像转为hsv色彩图像//去除低亮度值,二值化图像,低亮度置0,高亮度置1Mat mask;int _vmin = vmin, _vmax = vmax;inRange(roi_hsv, Scalar(0, smin, MIN(_vmin, _vmax)),Scalar(180, 255, MAX(_vmin, _vmax)), mask);//计算直方图/*在HSV颜色空间中,H(色相)的取值范围是[0, 360),而在OpenCV中,H通道的取值范围被映射到[0, 180)。这是因为OpenCV中对H通道的取值范围进行了缩放,将360度映射到了180度。所以,在使用 calcHist 函数计算直方图时,range[] 参数用于指定每个通道的取值范围。对于HSV颜色空间中的H通道,这里使用的是[0, 180)。这确保了直方图的统计考虑了整个H通道的取值范围。如果你的颜色空间是RGB,而不是HSV,那么在计算直方图时,range[] 参数应该是[0, 256)。这样就能覆盖RGB图像中每个通道的所有可能取值。*/calcHist(&roi_hsv, 1, channels, mask, roi_hist, 1, &histSize, &histRange);// 归一化normalize(roi_hist, roi_hist, 0, 255, NORM_MINMAX);// 4. 目标追踪// 4.1 设置窗口搜索终止条件:最大迭代次数,窗口中心漂移最小值TermCriteria term_crit(TermCriteria::EPS | TermCriteria::COUNT, 10, 1);term_crit_ = term_crit;waitKey(30);isSelectRoi = false;targetTrackingEnable = true;}else if (targetTrackingEnable){// 4.2 计算直方图的反向投影Mat hsv;cvtColor(image, hsv, COLOR_BGR2HSV); //把输入图像转为hsv色彩图像Mat backProject;cv::calcBackProject(&hsv, 1, channels, roi_hist, backProject, &histRange);// 4.3 进行meanshift追踪RotatedRect track_box = cv::CamShift(backProject, selection, term_crit_);// 4.4 将追踪的位置绘制在视频上,并进行显示ellipse(image, track_box, Scalar(0, 0, 255), 2);imshow("CamShift Demo", image);if (waitKey(30) == 'q')break;}if (selectObject && selection.width > 0 && selection.height > 0){Mat roi(image, selection);bitwise_not(roi, roi);}imshow("CamShift Demo", image);if (waitKey(30) == 'q')break;}// 5. 资源释放cap.release();destroyAllWindows();return 0;
}
效果展示:
Camshift的优点:简单,计算量较少,因为Camshift的本质就局部检测,在局部里检测“密度”最大的位置。
Camshift的缺点:Camshift的优点有时候也正是其缺点,因为其简单,所以对于复杂背景或者纹理丰富的物体跟踪效果较差。因为Camshift是对直方图反投影所形成的二值图像进行处理的,如果背景较为复杂或者物体的纹理较为丰富,那么此二值图像的噪声就很多(具体原因可参考直方图反投影的原理),这将直接干扰Camshift对物体位置的判断。
所以对Camshift的总结为:Camshift适用于物体表面颜色较为单一,且和背景颜色差距较大

相关文章:

《opencv实用探索·十八》Camshift进行目标追踪流程
CamShift(Continuously Adaptive Mean Shift)是一种用于目标跟踪的方法,它是均值漂移(Mean Shift)的扩展,支持对目标的旋转跟踪,能够对目标的大小和形状进行自适应调整。 cv::CamShift和cv::me…...

MAP: Multimodal Uncertainty-Aware Vision-Language Pre-training Model
问题 多模态语义理解通常需要处理不确定性,这意味着获得的消息往往涉及多个目标。这种不确定性对我们的解释来说是有问题的,包括模式间和模式内的不确定性。人们很少研究这种不确定性的建模,特别是在未标记数据集的预训练和特定任务下游数据…...

【SpringCache】快速入门 通俗易懂
1. 介绍 Spring Cache 是一个框架,实现了基于注解的缓存功能,只需要简单地加一个注解,就能实现缓存功能。 Spring Cache 提供了一层抽象,底层可以切换不同的缓存实现,例如: EHCache Caffeine Redis(常用…...
GeoTools学习笔记
Feature要素: 例子:Csv2Shape.java 创建要素,先创建FeatureType,再创建Feature 根据FeatureCollection,可以创建shapefile https://docs.geotools.org/latest/userguide/library/main/data.html API详解:…...

短剧规模达到了百亿元,短剧分销成为短剧新模式
我国短剧市场规模直接突破了三百多亿元,目前已经是互联网的一大创业风口! 一、短剧特点 在当下快节奏的生活中,短剧具有的快节奏、剧情紧凑的特点,符合大众对影视的需求。目前我国的短剧题材主要是言情、总裁、赘婿等࿰…...
Kotlin 中的 `as` 关键字:类型转换的艺术
在 Android 编程中,类型转换是一项常见的操作。为了使这一过程更加流畅和安全,Kotlin 提供了 as 关键字。本文将深入探讨 as 关键字的用法和最佳实践。 一、as 关键字的基本概念 🚀 as 关键字在 Kotlin 中用于显式类型转换。它将一个表达式…...
CDN可以给企业网站带来哪些优势?
企业网站带来哪些优势?现在企业最关心的问题,就是我的网站能不能打开,用户访问到的是不是正常的页面,网站是否能够正常运营,而互联网是 一个开放式的平台,网站是否能够正常运营和很多因素都有关系ÿ…...
离线运行Oracle Database In-Memory Advisor
概念 离线运行Oracle Database In-Memory Advisor,就是不在生产系统上运行。这样可以避免影响生产系统。但需要从生产系统导出以下的数据: AWR DumpAWR补充数据 过程 导出AWR Dump 连接到CDB root运行。 SQL> connect / as sysdba SQL> ?/r…...

2,PyCharm的下载与安装
1,PyCharm的下载 a:打开PyCharm官网,并选择Developer Tools → PyCharm Pycharm官网地址 b:点击Download c:下载完成后,会在下载文件夹中,出现“pycharm-professional-2023.3.exe”文件 2&a…...

HNU计算机视觉作业一
前言 选修的是蔡mj老师的计算机视觉,上课还是不错的,但是OpenCV可能需要自己学才能完整把作业写出来。由于没有认真学,这门课最后混了80多分,所以下面作业解题过程均为自己写的,并不是标准答案,仅供参考 …...
Java:SpringBoot获取当前运行的环境activeProfile
代码示例 /*** 启动监听器*/ Component public class AppListener implements ApplicationListener<ApplicationReadyEvent> {Overridepublic void onApplicationEvent(ApplicationReadyEvent event) {// 获取当前的环境,如果是test,则直接返回Co…...

射频功率放大器的参数有哪些
射频功率放大器是射频通信系统中重要的组件,用于将输入的射频信号放大到需要的功率水平。在设计和选择射频功率放大器时,需要考虑多种参数。下面西安安泰将详细介绍射频功率放大器的常见参数。 1、P1dB功率压缩点 当放大器的输入功率比较低时,…...
3-5、多态性
语雀原文链接 文章目录 1、多态类型2、上下转型3、instanceof 1、多态类型 编译时多态:方法重载 在编译阶段就已经确定要调用哪个重载的方法 运行时多态:方法重写 具体调用哪个子类的方法要到运行的时候,结果才能确定,多态只针对…...
什么是https 加密协议?
什么是https 加密协议? 加密通信的作用加密原理数字证书SSL/TLS 协议部署和使用重要性 HTTPS(Hyper Text Transfer Protocol Secure)是一种网络传输协议,它是基于HTTP协议的扩展,通过加密通信内容来保障数据传输的安全…...

低压无功补偿在分布式光伏现场中的应用
摘要:分布式光伏电站由于建设时间短、技术成熟、收益明显而发展迅速,但光伏并网引起用户功率因数异常的问题也逐渐凸显。针对分布式光伏电站接入配电网后功率因数降低的问题,本文分析了低压无功补偿装置补偿失效的原因,并提出了一…...
人工智能技术在宽域飞行器控制中的应用
近年来,以空天飞行器、高超声速飞行器等 ̈1 为典型代表的宽域飞行器蓬勃发展,如图1所示,其 不仅对高端装备制造、空间信息以及太空经济等领 域产生辐射带动作用,进一步提升了中国在航空航 天领域的自主创新能力,同时也…...

NGINX高性能服务器与关键概念解析
目录 1 NGINX简介2 NGINX的特性3 正向代理4 反向代理5 负载均衡6 动静分离7 高可用8 结语 1 NGINX简介 NGINX(“engine x”)在网络服务器和代理服务器领域备受推崇。作为一款高性能的 HTTP 和反向代理服务器,它以轻量级、高并发处理能力以及…...
云ssrf
https://book.hacktricks.xyz/pentesting-web/ssrf-server-side-request-forgery/cloud-ssrf SSRF -> EC2 Metadata API -> IAM临时Security Token -> AWS SSM -> RCESSRF -> EC2 Metadata API -> IAM临时Security Token -> AWS Lambda -> RCESSRF -&g…...
面试题目总结(三)
1. Spring、Springboot、springMVC、Spring Cloud 的区别: Spring:Spring 是一个开源的、轻量级的Java框架,提供了丰富的功能和组件,用于构建企业级应用程序。Spring框架包含了很多模块,包括核心容器、数据访问、事物…...

Kubernetes入门笔记——(2)k8s设计文档
k8s最初源自谷歌的Brog项目,架构与其类似,主要包括etcd、api server、controller manager、scheduler、kubelet和kube-proxy等组件 etcd:分布式存储,保存k8s集群的状态 api server:资源操作的唯一入口,…...
Java 语言特性(面试系列2)
一、SQL 基础 1. 复杂查询 (1)连接查询(JOIN) 内连接(INNER JOIN):返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法
树莓派摄像头高级使用方法 配置通过调谐文件来调整相机行为 使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 配置 大多数用例自动工作,无需更改相机配置。但是,一…...

什么是库存周转?如何用进销存系统提高库存周转率?
你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...
macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用
文章目录 问题现象问题原因解决办法 问题现象 macOS启动台(Launchpad)多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显,都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现
摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...

网络编程(UDP编程)
思维导图 UDP基础编程(单播) 1.流程图 服务器:短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 GPU 上对图像执行 均值漂移滤波(Mean Shift Filtering),用于图像分割或平滑处理。 该函数将输入图像中的…...

GC1808高性能24位立体声音频ADC芯片解析
1. 芯片概述 GC1808是一款24位立体声音频模数转换器(ADC),支持8kHz~96kHz采样率,集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器,适用于高保真音频采集场景。 2. 核心特性 高精度:24位分辨率,…...
快刀集(1): 一刀斩断视频片头广告
一刀流:用一个简单脚本,秒杀视频片头广告,还你清爽观影体验。 1. 引子 作为一个爱生活、爱学习、爱收藏高清资源的老码农,平时写代码之余看看电影、补补片,是再正常不过的事。 电影嘛,要沉浸,…...
Linux系统部署KES
1、安装准备 1.版本说明V008R006C009B0014 V008:是version产品的大版本。 R006:是release产品特性版本。 C009:是通用版 B0014:是build开发过程中的构建版本2.硬件要求 #安全版和企业版 内存:1GB 以上 硬盘…...