DeepSORT(目标跟踪算法)中的状态向量与状态转移矩阵
DeepSORT(目标跟踪算法)中的状态向量与状态转移矩阵
flyfish
状态转移矩阵(State Transition Matrix)F的构造
这篇是一定要看的,拖到文章的最后部分,需要理解状态转移矩阵怎么来的,怎么是这个样子
状态向量(State Vector)
状态向量描述系统在某个时间点的完整状态。它通常包括多个变量,例如位置、速度、加速度等,具体取决于系统的动态特性。
- 记作 x k \mathbf{x}_k xk,其中 k k k 是时间步长。
状态转移矩阵(State Transition Matrix)
状态转移矩阵描述系统从一个时间点到下一个时间点的状态变化。它反映了状态向量的演化。
-
记作 A k \mathbf{A}_k Ak,用于将状态向量从 x k − 1 \mathbf{x}_{k-1} xk−1 转移到 x k \mathbf{x}_k xk:
x k = A k − 1 x k − 1 + B k − 1 u k − 1 + w k − 1 \mathbf{x}_k = \mathbf{A}_{k-1} \mathbf{x}_{k-1} + \mathbf{B}_{k-1} \mathbf{u}_{k-1} + \mathbf{w}_{k-1} xk=Ak−1xk−1+Bk−1uk−1+wk−1 -
状态向量与状态转移矩阵:状态转移矩阵 A k \mathbf{A}_k Ak 描述了状态向量 x k \mathbf{x}_k xk 如何从时间 k − 1 k-1 k−1 转移到时间 k k k。例如,对于一个简单的运动模型,状态向量可能包括位置和速度,而状态转移矩阵描述了位置和速度在每个时间步长中的变化。例如,对于一个匀速直线运动模型,状态向量和状态转移矩阵可以表示为: x k = [ x k x ˙ k ] , A k = [ 1 Δ t 0 1 ] \mathbf{x}_k = \begin{bmatrix} x_k \\ \dot{x}_k \end{bmatrix}, \quad \mathbf{A}_k = \begin{bmatrix} 1 & \Delta t \\ 0 & 1 \end{bmatrix} xk=[xkx˙k],Ak=[10Δt1]这里, Δ t \Delta t Δt 是时间步长。
假设我们要跟踪一个在平面上运动的物体,其状态包括位置和速度:
- 状态向量 x k \mathbf{x}_k xk: x k = [ x k y k x ˙ k y ˙ k ] \mathbf{x}_k = \begin{bmatrix} x_k \\ y_k \\ \dot{x}_k \\ \dot{y}_k \end{bmatrix} xk= xkykx˙ky˙k 这里 x k x_k xk 和 y k y_k yk 是位置, x ˙ k \dot{x}_k x˙k 和 y ˙ k \dot{y}_k y˙k 是速度。
- 状态转移矩阵 A k \mathbf{A}_k Ak: A k = [ 1 0 Δ t 0 0 1 0 Δ t 0 0 1 0 0 0 0 1 ] \mathbf{A}_k = \begin{bmatrix} 1 & 0 & \Delta t & 0 \\ 0 & 1 & 0 & \Delta t \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} Ak= 10000100Δt0100Δt01 这表示位置随时间步长 Δ t \Delta t Δt 变化。
状态预测
给定当前时间步长 k − 1 k-1 k−1 的状态向量 x k − 1 \mathbf{x}_{k-1} xk−1 和状态转移矩阵 A k − 1 \mathbf{A}_{k-1} Ak−1,下一个时间步长 k k k 的预测状态向量 x ^ k ∣ k − 1 \hat{\mathbf{x}}_{k|k-1} x^k∣k−1 可以表示为:
x ^ k ∣ k − 1 = A k − 1 x k − 1 + B k − 1 u k − 1 \hat{\mathbf{x}}_{k|k-1} = \mathbf{A}_{k-1} \mathbf{x}_{k-1} + \mathbf{B}_{k-1} \mathbf{u}_{k-1} x^k∣k−1=Ak−1xk−1+Bk−1uk−1
- A k − 1 \mathbf{A}_{k-1} Ak−1 是状态转移矩阵,描述了系统的动态特性。
- B k − 1 \mathbf{B}_{k-1} Bk−1 是控制输入矩阵,描述了控制输入如何影响系统状态。
- u k − 1 \mathbf{u}_{k-1} uk−1 是控制输入向量,包含外部施加的控制量。
误差协方差预测
误差协方差矩阵 P k ∣ k − 1 \mathbf{P}_{k|k-1} Pk∣k−1 也需要更新,以反映预测状态的不确定性。预测步骤的误差协方差矩阵更新公式为:
P k ∣ k − 1 = A k − 1 P k − 1 ∣ k − 1 A k − 1 T + Q k − 1 \mathbf{P}_{k|k-1} = \mathbf{A}_{k-1} \mathbf{P}_{k-1|k-1} \mathbf{A}_{k-1}^T + \mathbf{Q}_{k-1} Pk∣k−1=Ak−1Pk−1∣k−1Ak−1T+Qk−1
- P k − 1 ∣ k − 1 \mathbf{P}_{k-1|k-1} Pk−1∣k−1 是当前时间步长 k − 1 k-1 k−1 的误差协方差矩阵。
- Q k − 1 \mathbf{Q}_{k-1} Qk−1 是过程噪声协方差矩阵,反映了模型中未捕捉到的不确定性。
例子
假设我们要跟踪一个在平面上运动的物体,其状态向量包括位置和速度:
x k = [ x k y k x ˙ k y ˙ k ] \mathbf{x}_k = \begin{bmatrix} x_k \\ y_k \\ \dot{x}_k \\ \dot{y}_k \end{bmatrix} xk= xkykx˙ky˙k
假设物体做匀速直线运动,状态转移矩阵可以表示为:
A = [ 1 0 Δ t 0 0 1 0 Δ t 0 0 1 0 0 0 0 1 ] \mathbf{A} = \begin{bmatrix} 1 & 0 & \Delta t & 0 \\ 0 & 1 & 0 & \Delta t \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} A= 10000100Δt0100Δt01
在没有控制输入的情况下,预测状态的计算如下:
x ^ k ∣ k − 1 = A x k − 1 \hat{\mathbf{x}}_{k|k-1} = \mathbf{A} \mathbf{x}_{k-1} x^k∣k−1=Axk−1
假设上一时间步长的状态向量为:
x k − 1 = [ 10 15 1 − 1 ] \mathbf{x}_{k-1} = \begin{bmatrix} 10 \\ 15 \\ 1 \\ -1 \end{bmatrix} xk−1= 10151−1
其中,物体在位置 ( 10 , 15 ) (10, 15) (10,15) 处,速度为 ( 1 , − 1 ) (1, -1) (1,−1) 米每秒,时间步长 Δ t = 1 \Delta t = 1 Δt=1 秒。
状态转移计算为:
x ^ k ∣ k − 1 = [ 1 0 1 0 0 1 0 1 0 0 1 0 0 0 0 1 ] [ 10 15 1 − 1 ] = [ 10 + 1 15 − 1 1 − 1 ] = [ 11 14 1 − 1 ] \hat{\mathbf{x}}_{k|k-1} = \begin{bmatrix} 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} 10 \\ 15 \\ 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 10 + 1 \\ 15 - 1 \\ 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 11 \\ 14 \\ 1 \\ -1 \end{bmatrix} x^k∣k−1= 1000010010100101 10151−1 = 10+115−11−1 = 11141−1
因此,通过状态转移矩阵,得到了下一个时间步长的预测状态向量 x ^ k ∣ k − 1 = [ 11 14 1 − 1 ] \hat{\mathbf{x}}_{k|k-1} = \begin{bmatrix} 11 \\ 14 \\ 1 \\ -1 \end{bmatrix} x^k∣k−1= 11141−1 。
在卡尔曼滤波中,控制输入(control input)指的是系统在每个时间步长可以施加的外部影响或干预。控制输入常用于表示可以影响系统状态的外部因素,例如驾驶员对汽车的操控、无人机的推力指令等。
控制输入的作用
控制输入用于描述外部控制如何影响系统状态的变化。它在状态转移方程中起到了修正预测状态的作用,帮助更准确地反映系统的动态。
控制输入的数学描述
状态转移方程中引入控制输入项,使状态更新更全面:
x k = A k − 1 x k − 1 + B k − 1 u k − 1 + w k − 1 \mathbf{x}_k = \mathbf{A}_{k-1} \mathbf{x}_{k-1} + \mathbf{B}_{k-1} \mathbf{u}_{k-1} + \mathbf{w}_{k-1} xk=Ak−1xk−1+Bk−1uk−1+wk−1
其中:
- A k − 1 \mathbf{A}_{k-1} Ak−1:状态转移矩阵,描述系统的内在动力学。
- B k − 1 \mathbf{B}_{k-1} Bk−1:控制输入矩阵,描述控制输入对系统状态的影响。
- u k − 1 \mathbf{u}_{k-1} uk−1:控制输入向量,表示外部施加的控制。
- w k − 1 \mathbf{w}_{k-1} wk−1:过程噪声,表示模型中未捕捉到的随机扰动。
示例
假设我们在跟踪一辆汽车,状态向量包括位置和速度:
x k = [ x k x ˙ k ] \mathbf{x}_k = \begin{bmatrix} x_k \\ \dot{x}_k \end{bmatrix} xk=[xkx˙k]
无控制输入的情况
状态转移矩阵假设汽车做匀速运动:
A = [ 1 Δ t 0 1 ] \mathbf{A} = \begin{bmatrix} 1 & \Delta t \\ 0 & 1 \end{bmatrix} A=[10Δt1]
预测下一时间步的状态为:
x ^ k ∣ k − 1 = A x k − 1 \hat{\mathbf{x}}_{k|k-1} = \mathbf{A} \mathbf{x}_{k-1} x^k∣k−1=Axk−1
有控制输入的情况
假设汽车可以通过加速或减速改变速度,控制输入向量表示加速度:
u k = a k \mathbf{u}_k = a_k uk=ak
控制输入矩阵描述加速度对速度和位置的影响:
B = [ 0.5 Δ t 2 Δ t ] \mathbf{B} = \begin{bmatrix} 0.5 \Delta t^2 \\ \Delta t \end{bmatrix} B=[0.5Δt2Δt]
状态转移方程引入控制输入后变为:
x ^ k ∣ k − 1 = A x k − 1 + B u k − 1 \hat{\mathbf{x}}_{k|k-1} = \mathbf{A} \mathbf{x}_{k-1} + \mathbf{B} \mathbf{u}_{k-1} x^k∣k−1=Axk−1+Buk−1
具体计算
假设上一时间步的状态向量为:
x k − 1 = [ 10 5 ] \mathbf{x}_{k-1} = \begin{bmatrix} 10 \\ 5 \end{bmatrix} xk−1=[105]
其中,位置为10米,速度为5米每秒。时间步长 Δ t = 1 \Delta t = 1 Δt=1 秒。
如果加速度为2米每秒平方( a k = 2 a_k = 2 ak=2),则控制输入向量为:
u k − 1 = 2 \mathbf{u}_{k-1} = 2 uk−1=2
状态转移矩阵和控制输入矩阵为:
A = [ 1 1 0 1 ] , B = [ 0.5 1 ] \mathbf{A} = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}, \quad \mathbf{B} = \begin{bmatrix} 0.5 \\ 1 \end{bmatrix} A=[1011],B=[0.51]
预测下一时间步的状态为:
x ^ k ∣ k − 1 = A x k − 1 + B u k − 1 = [ 1 1 0 1 ] [ 10 5 ] + [ 0.5 1 ] ⋅ 2 = [ 15 5 ] + [ 1 2 ] = [ 16 7 ] \hat{\mathbf{x}}_{k|k-1} = \mathbf{A} \mathbf{x}_{k-1} + \mathbf{B} \mathbf{u}_{k-1} = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} 10 \\ 5 \end{bmatrix} + \begin{bmatrix} 0.5 \\ 1 \end{bmatrix} \cdot 2 = \begin{bmatrix} 15 \\ 5 \end{bmatrix} + \begin{bmatrix} 1 \\ 2 \end{bmatrix} = \begin{bmatrix} 16 \\ 7 \end{bmatrix} x^k∣k−1=Axk−1+Buk−1=[1011][105]+[0.51]⋅2=[155]+[12]=[167]
因此,通过引入控制输入,预测得到下一时间步的位置为16米,速度为7米每秒。
在卡尔曼滤波中,测量向量通过观测矩阵可以得到与实际测量值进行比较的预测测量值。这是滤波器更新步骤中的一个关键部分,用于校正预测的状态。
相关文章:
DeepSORT(目标跟踪算法)中的状态向量与状态转移矩阵
DeepSORT(目标跟踪算法)中的状态向量与状态转移矩阵 flyfish 状态转移矩阵(State Transition Matrix)F的构造 这篇是一定要看的,拖到文章的最后部分,需要理解状态转移矩阵怎么来的,怎么是这个…...
李宏毅深度学习01——基本概念简介
视频链接 基本概念 Regression(回归): 类似于填空 Classification(分类): 类似于选择 Structure Learning(机器学习): ?? 机器学习找对应函数…...
TcpClient 服务器、客户端连接
TcpClient 服务器 TcpListener 搭建tcp服务器的类,基于socket套接字通信的 1 创建服务器对象 TcpListener server new TcpListener(IPAddress.Parse("127.0.0.1"), 3000); 2 开启服务器 设置最大连接数 server.Start(1000); 3 接收客户端的链接,只能…...
13大最佳工程项目管理系统软件盘点
国内外主流的13款工程项目管理系统软件:Worktile、中建软件、泛微建筑项目管理软件、LiquidPlanner、Wrike、建文软件、广联达、Microsoft Project、泛普软件、Procore、Buildertrend、Fieldwire、Autodesk Construction Cloud。 在快速变化的工程领域,有…...
SpringMVC:拦截器(Interceptor)
1. 简介 拦截器(Interceptor)类似于过滤器(Filter) Spring MVC的拦截器作用是在请求到达控制器之前或之后进行拦截,可以对请求和响应进行一些特定的处理。拦截器可以用于很多场景下: 1. 登录验证…...
【Python】selenium使用find_element时解决【NoSuchWindowException】问题的方法
NoSuchWindowException 是 Selenium WebDriver 中的一种异常,当尝试切换到一个不存在的窗口时,或者在尝试获取窗口句柄时窗口已经关闭或不存在,就会抛出这个异常。 以下是一些解决 NoSuchWindowException 的常见方法: 检查窗口是…...
PTA:7-188 水仙花数
作者 王秀秀 单位 山东交通学院 任务描述 本关任务:输出100到999之间的所有的“水仙花数”。所谓的“水仙花数”是指一个3位数,其各位数字立方和等于该数本身。 例如,153是一个水仙花数,因为 15313 53 33 提示 关键在于对一…...
HTML静态网页成品作业(HTML+CSS+JS)—— 美食企业曹氏鸭脖介绍网页(4个页面)
🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,使用Javacsript代码实现 图片轮播切换,共有4个页面。 二、…...
SCI二区|鲸鱼优化算法(WOA)原理及实现【附完整Matlab代码】
目录 1.背景2.算法原理2.1算法思想 3.结果展示4.参考文献5.代码获取 1.背景 2016年,S Mirjalili受到自然界座头鲸社会行为启发,提出了鲸鱼优化算法(Whale Optimization Algorithm, WOA)。 2.算法原理 WOA模拟了座头鲸的社会行为…...
人脸匹配——OpenCV
人脸匹配 导入所需的库加载dlib的人脸识别模型和面部检测器读取图片并转换为灰度图比较两张人脸选择图片并显示结果比较图片创建GUI界面运行GUI主循环运行显示全部代码 导入所需的库 cv2:OpenCV库,用于图像处理。 dlib:一个机器学习库&#x…...
韩顺平0基础学java——第22天
p441-459 异常exception 选中代码块,快捷键ctraltt6,即trt-catch 如果进行了异常处理,那么即使出现了异常,但是会继续执行 程序过程中发生的异常事件分为两大类: 异常体系图※ 常见的运行异常:类型转换…...
神经网络介绍及教程案例
神经网络介绍及教程&案例 神经网络(Neural Networks)是机器学习和人工智能中的一种关键技术,模仿了人类大脑的工作方式,能够处理复杂的数据和任务。以下是神经网络的一些基础介绍: 基本概念 神经元(N…...
16个不为人知的资源网站,强烈建议收藏!
整理了16个不为人知的资源网站,涵盖了课程学习、办公技能、娱乐休闲、小说音乐等多种资源,强烈建议收藏! #学习网站 1、中国大学MOOC icourse163.org/ 这是一个汇集了国内顶尖大学免费课程资源的平台,众多985工程院校如北京大…...
pandas获取某列最大值的所有数据
第一种方法: 按照某列进行由大到小的排序,然后再进去去重,保留第一个值,最终保留的结果就是最大值的数据 # 由大到小排序 data_frame data_frame.sort_values(bycolumn_a, ascendingFalse)# 按照column_b列去重保留第一条&#…...
App UI 风格展现非凡创意
App UI 风格展现非凡创意...
rocketmq-5.1.2的dleger高可用集群部署
1、背景 原先为5.0.0版本,因检查出有漏洞,升级到5.1.2版本。 【Rocketmq是阿里巴巴在2012年开发的分布式消息中间件,专为万亿级超大规模的消息处理而设计,具有高吞吐量、低延迟、海量堆积、顺序收发等特点。在一定条件下…...
无线网络与物联网技术[1]之近距离无线通信技术
无线网络与物联网技术 近距离无线通信技术WIFIWi-Fi的协议标准Wi-Fi的信道Wi-Fi技术的术语Wi-Fi的组网技术Ad-hoc模式无线接入点-APAP:FAT AP vs FIT AP Wi-Fi的特点与应用Wi-Fi的安全技术 Bluetooth蓝牙技术概论蓝牙的技术协议蓝牙的组网技术微微网piconet(了解)散…...
Codeforces Round 952 (Div. 4)
题解写到博客园了,懒得复制过来了了,放个链接 https://www.cnblogs.com/yxcblogs/p/18243276 推广一下自己记录的算法编程竞赛模板仓库 GitHub - yxc-s/programming-template: This repository contains C programming templates optimized for competi…...
spark MLlib (DataFrame-based) 中的聚类算法Bisecting K-Means、K-Means、Gaussian Mixture
Bisecting K-Means 核心原理: Bisecting K-Means 是一种层次 K-Means 聚类算法,基于 Steinbach、Karypis 和 Kumar 的论文《A comparison of document clustering techniques》,并对 Spark 环境进行了修改和适应。 该算法通过递归地将数据集…...
天降流量于雀巢?元老品牌如何创新营销策略焕新生
大家最近有看到“南京阿姨手冲咖啡”的视频吗?三条雀巢速溶咖啡入杯,当面加水手冲,十元一份售出,如此朴实的售卖方式迅速在网络上走红。而面对这一波天降的热度,雀巢咖啡迅速做出了回应,品牌组特地去到了阿…...
自然语言处理——循环神经网络
自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元(GRU)长短期记忆神经网络(LSTM)…...
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...
HashMap中的put方法执行流程(流程图)
1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中,其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下: 初始判断与哈希计算: 首先,putVal 方法会检查当前的 table(也就…...
管理学院权限管理系统开发总结
文章目录 🎓 管理学院权限管理系统开发总结 - 现代化Web应用实践之路📝 项目概述🏗️ 技术架构设计后端技术栈前端技术栈 💡 核心功能特性1. 用户管理模块2. 权限管理系统3. 统计报表功能4. 用户体验优化 🗄️ 数据库设…...
Netty从入门到进阶(二)
二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架,用于…...
MySQL:分区的基本使用
目录 一、什么是分区二、有什么作用三、分类四、创建分区五、删除分区 一、什么是分区 MySQL 分区(Partitioning)是一种将单张表的数据逻辑上拆分成多个物理部分的技术。这些物理部分(分区)可以独立存储、管理和优化,…...
leetcode_69.x的平方根
题目如下 : 看到题 ,我们最原始的想法就是暴力解决: for(long long i 0;i<INT_MAX;i){if(i*ix){return i;}else if((i*i>x)&&((i-1)*(i-1)<x)){return i-1;}}我们直接开始遍历,我们是整数的平方根,所以我们分两…...
ffmpeg(三):处理原始数据命令
FFmpeg 可以直接处理原始音频和视频数据(Raw PCM、YUV 等),常见场景包括: 将原始 YUV 图像编码为 H.264 视频将 PCM 音频编码为 AAC 或 MP3对原始音视频数据进行封装(如封装为 MP4、TS) 处理原始 YUV 视频…...
今日行情明日机会——20250609
上证指数放量上涨,接近3400点,个股涨多跌少。 深证放量上涨,但有个小上影线,相对上证走势更弱。 2025年6月9日涨停股主要行业方向分析(基于最新图片数据) 1. 医药(11家涨停) 代表标…...
Modbus转Ethernet IP深度解析:磨粉设备效率跃升的底层技术密码
在建材矿粉磨系统中,开疆智能Modbus转Ethernet IP网关KJ-EIP-101的应用案例是一个重要的技术革新。这个转换过程涉及到两种主要的通信协议:Modbus和Ethernet IP。Modbus是一种串行通信协议,广泛应用于工业控制系统中。它简单、易于部署和维护…...
