当前位置：首页 > news >正文

【视觉SLAM】4b-特征点法估计相机运动之PnP 3D-2D

news 2026/2/8 11:54:23

文章目录

0. 前言
1. PnP求解
- 1.1 直接线性变换DLT
- 1.2 P3P
- 1.3 光束平差法BA
2. 实现

0. 前言

透视n点（Perspective-n-Point，PnP）问题是计算机视觉领域的经典问题，用于求解3D-2D的点运动。换句话说，当知道 $N$ 个世界坐标系中3D空间点的坐标以及它们在图像上的投影点像素坐标时，可以使用PnP算法来估计相机在世界坐标系的姿态。P3P是最简化的PnP形式，即最少只需3个点即可估计当前的相机姿态（解不唯一）。

总体来说，PnP的求解方法有P3P、直接线性变换（Direct Linear Transformation，DLT）、EPnP（Efficient PnP）和UPnP等。此外，还有非线性优化解法，通过构建最小二乘问题并迭代求解，即万金油式的光束平差法（Bundle Adjustment，BA） 。

1. PnP求解

1.1 直接线性变换DLT

假设有世界坐标系中的3D点 $P=[X, Y, Z, 1]^T$ ，在图像 $I_1$ 中对应的投影像素点为 $x_1=[u_1, v_1, 1]^T$ ，根据相机小孔成像模型有：

$\begin{bmatrix} u_1 \\ v_1 \\ 1 \end{bmatrix}= \begin{bmatrix} R | t \end{bmatrix} P= \begin{bmatrix} t_1 & t_2 & t_3 & t_4 \\ t_5 & t_6 & t_7 & t_8 \\ t_9 & t_{10} & t_{11} & t_{12} \end{bmatrix} \begin{bmatrix} X \\ Y \\ Z \\ 1 \end{bmatrix}$

其中 $s = Z$ ，利用最后一行将其消去有：

$\begin{cases} s u_1 = t_1 X + t_2 Y + t_3 Z + t_4\\ s v_1 = t_5 X + t_6 Y + t_7 Z + t_8\\ s = t_9 X + t_{10} Y + t_{11} Z + t_{12} \end{cases} \Rightarrow \begin{cases} u_1 = \frac{t_1 X + t_2 Y + t_3 Z + t_4}{t_9 X + t_{10} Y + t_{11} Z + t_{12}} \\ v_1 = \frac{t_5 X + t_6 Y + t_7 Z + t_8}{t_9 X + t_{10} Y + t_{11} Z + t_{12}} \\ \end{cases} \\$

【视觉SLAM】4b-特征点法估计相机运动之PnP 3D-2D

文章目录 0. 前言1. PnP求解1.1 直接线性变换DLT1.2 P3P1.3 光束平差法BA2. 实现0. 前言透视n点（Perspective-n-Point，PnP）问题是计算机视觉领域的经典问题，用于求解3D-2D的点运动。换句话说，当知道 N N N个世界坐标系中3D空间点的坐标以及它们在图像上的投影点像素坐标…...

编程日记 2024/11/20 11:58:13

android 性能分析工具（04）Asan 内存检测工具

1 Asan工具简介 1.1 Asan工具历史背景 AddressSanitizer（ASan）最初由Google开发，并作为LLVM项目的一部分。ASan的设计目的是帮助开发者检测并修复内存错误，如堆栈和全局缓冲区溢出、使用已释放的内存等，这些问题可能…...

编程日记 2024/11/20 11:56:10

html中select标签的选项携带多个值

搜索参考资料：SELECT标签中的选项可以携带多个值吗？ 【摘抄】： 它可能有一个select选项中的多个值，如下所示。 <select id"ddlEmployee" class"form-control"> <option value"">-- S…...

编程日记 2024/11/20 11:55:07

Lambda表达式如何进行调试

一、概述 Java8提供了lambda表达式，方便我们对数据集合进行操作，我们使用lambda表达式的时候，是不是有这样的疑问，如何对执行过程中的中间数据进行调试呢？ 二、例子在下面的例子中，我们实现随机最多生成…...

编程日记 2024/11/20 11:54:04

C++ —— 剑斩旧我破茧成蝶—C++11

江河入海，知识涌动，这是我参与江海计划的第2篇。目录 1. C11的发展历史 2. 列表初始化 2.1 C98传统的{} 2.2 C11中的{} 2.3 C11中的std::initializer_list 3. 右值引用和移动语义 3.1 左值和右值 3.2 左值引用和右值引用 3.3 引用延长生命周期…...

编程日记 2024/11/20 11:50:58

HTML5好看的音乐播放器多种风格(附源码)

文章目录 1.设计来源1.1 音乐播放器风格1效果1.2 音乐播放器风格2效果1.3 音乐播放器风格3效果1.4 音乐播放器风格4效果1.5 音乐播放器风格5效果 2.效果和源码2.1 动态效果2.2 源代码源码下载万套模板，程序开发，在线开发，在线沟通作者&…...

编程日记 2024/11/20 11:48:56

C++设计模式行为模式———迭代器模式中介者模式

文章目录一、引言二、中介者模式三、总结一、引言中介者模式是一种行为设计模式， 能让你减少对象之间混乱无序的依赖关系。该模式会限制对象之间的直接交互， 迫使它们通过一个中介者对象进行合作。中介者模式可以减少对象之间混乱无序的依赖关系&…...

编程日记 2024/11/20 11:47:55

FFmpeg 4.3 音视频-多路H265监控录放C++开发十五，解码相关，将h264文件进行帧分隔变成avpacket

前提前面我们学习了将YUV数据读取到AVFrame，然后将AVFrame通过 h264编码器变成 AVPacket后，然后将avpacket直接存储到了本地就变成了h264文件。这一节课，学习解码的一部分。我们需要将本地存储的h264文件进行帧分隔，也就是变…...

编程日记 2024/11/20 11:45:51

力扣 LeetCode 104. 二叉树的最大深度（Day7：二叉树）

解题思路： 采用后序遍历首先要区别好什么是高度，什么是深度最大深度实际上就是根节点的高度高度的求法是从下往上传，从下往上传实际上就是左右中（后序遍历） 深度的求法是从上往下去寻找所以采用从下往上本…...

编程日记 2024/11/20 11:44:48

如何高效实现汤臣倍健营销云数据集成到SQLServer

新版订单同步-（Life-Space）江油泰熙：汤臣倍健营销云数据集成到SQL Server 在企业信息化建设中，数据的高效集成和管理是提升业务运营效率的关键。本文将分享一个实际案例——如何通过新版订单同步方案，将汤臣倍健营销云…...

编程日记 2024/11/20 11:43:47

Vue3中使用:deep修改element-plus的样式无效怎么办？

前言：当我们用 vue3 :deep() 处理 elementui 中 el-dialog_body和el-dislog__header 的时候样式一直无法生效，遇到这种情况怎么办？ 解决办法： 1.直接在 dialog 上面增加class 我试过，也不起作用，最后用这种…...

编程日记 2024/11/20 11:41:45

具身智能之Isaac Gym使用

0. 简介 Isaac Gym 是由 NVIDIA 提供的一个高性能仿真平台，专门用于大规模的机器人学习和强化学习（RL）任务。它结合了物理仿真、GPU加速、深度学习框架互操作性等特点，使得研究人员和开发者可以快速进行复杂的机器人仿真和训练。…...

编程日记 2024/11/20 11:40:43

【大数据学习 | Spark】spark-shell开发

spark的代码分为两种本地代码在driver端直接解析执行没有后续集群代码，会在driver端进行解析，然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…...

编程日记 2024/11/20 11:38:40

《Python制作动态爱心粒子特效》

一、实现思路粒子效果： – 使用Pygame模拟粒子运动，粒子会以爱心的轨迹分布并运动。爱心公式： 爱心的数学公式： x16sin 3 (t),y13cos(t)−5cos(2t)−2cos(3t)−cos(4t) 参数 t t 的范围决定爱心形状。动态效果： 粒子…...

编程日记 2024/11/20 11:37:36

Jmeter 如何导入证书并调用https请求

Jmeter 如何导入证书并调用https请求通过SSL管理器添加证书文件支持添加的文件为.p12，.pfx，.jks 如何将pem文件转换为pfx文件？ 在公司内部通常会提供3个pem文件。 ca.pem：可以理解为是根证书，用于验证颁发的证…...

编程日记 2024/11/20 11:30:29

Python程序15个提速优化方法

目录 Python程序15个提速优化方法1. 引言2. 方法一：使用内建函数代码示例：解释： 3. 方法二：避免使用全局变量代码示例：解释： 4. 方法三：使用局部变量代码示例：解释： 5. 方…...

编程日记 2024/11/20 11:29:28

足球虚拟越位线技术FIFA OT（二）

足球虚拟越位线技术FIFA OT（二） 在FIFA认证测试过程中，留给VAR系统绘制越位线的时间只有90秒（在比赛中时间可能更短），那么90秒内要做什么事呢，首先场地上球员做出踢球动作，然后VAR要…...

编程日记 2024/11/20 11:28:24

centos7.9单机版安装K8s

1.安装docker [rootlocalhost ~]# hostnamectl set-hostname master [rootlocalhost ~]# bash [rootmaster ~]# mv /etc/yum.repos.d/* /home [rootmaster ~]# curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo [rootmaster ~]# cu…...

编程日记 2024/11/20 11:27:20

【视觉SLAM】4b-特征点法估计相机运动之PnP 3D-2D

文章目录

0. 前言

1. PnP求解

1.1 直接线性变换DLT

相关文章：

【视觉SLAM】4b-特征点法估计相机运动之PnP 3D-2D

android 性能分析工具（04）Asan 内存检测工具

html中select标签的选项携带多个值

Lambda表达式如何进行调试

C++ —— 剑斩旧我破茧成蝶—C++11

HTML5好看的音乐播放器多种风格(附源码)

C++设计模式行为模式———迭代器模式中介者模式

FFmpeg 4.3 音视频-多路H265监控录放C++开发十五，解码相关，将h264文件进行帧分隔变成avpacket

力扣 LeetCode 104. 二叉树的最大深度（Day7：二叉树）

如何高效实现汤臣倍健营销云数据集成到SQLServer

Vue3中使用:deep修改element-plus的样式无效怎么办？

具身智能之Isaac Gym使用

【大数据学习 | Spark】spark-shell开发

《Python制作动态爱心粒子特效》

Jmeter 如何导入证书并调用https请求

Python程序15个提速优化方法

足球虚拟越位线技术FIFA OT（二）

centos7.9单机版安装K8s

图像编辑一些概念:Image Reconstruction与Image Re-generation

【STM32】在 STM32 USB 设备库添加新的设备类

进程地址空间（比特课总结）

通过Wrangler CLI在worker中创建数据库和表

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

ffmpeg（四）：滤镜命令

css3笔记（1）自用

初学 pytest 记录

Python Ovito统计金刚石结构数量

STM32---外部32.768K晶振（LSE）无法起振问题

django blank 与 null的区别

CVPR2025重磅突破：AnomalyAny框架实现单样本生成逼真异常数据，破解视觉检测瓶颈！