当前位置: 首页 > article >正文

最小化重投影误差求解PnP

问题描述

已知n个空间点 P i = [ x i , y i , z i ] T P_i=[x_i,y_i,z_i]^T Pi=[xi,yi,zi]T,其投影的像素坐标 p i = [ u i , v i ] T p_i=[u_i,v_i]^T pi=[ui,vi]T求相机的位姿R,T。

问题分析

根据相机模型,像素点和空间点的位置关系:
s i [ u i v i 1 ] = K T [ x i y i z i 1 ] s_i\begin{bmatrix}u_i \\v_i \\1\\\end{bmatrix}=KT \begin{bmatrix} x_i \\ y_i \\ z_i\\ 1\\ \end{bmatrix} si uivi1 =KT xiyizi1
即:
s i u i = K T P i s_iu_i=KTP_i siui=KTPi
由于存在噪声误差,因此以最小化误差平方和为目标构建最小二乘问题:
T ∗ = a r g min ⁡ T 1 2 ∑ i = 1 n ∥ u i − 1 s i K T P i ∥ 2 2 T^{*}=arg \min_{T} \frac{1}{2} \sum_{i=1}^{n} \begin{Vmatrix}u_i-\frac{1}{s_i}KTP_i\end{Vmatrix}_{2}^{2} T=argTmin21i=1n uisi1KTPi 22
因为这个误差是将3D点的理论投影位置与观测到的实际投影位置之间的误差,因此称为重投影误差
e i = u i − 1 s i K T P i e_i=u_i-\frac{1}{s_i}KTP_i ei=uisi1KTPi
重投影误差
按照之前讲过的高斯牛顿法进行求解:
旋转矩阵本身带有约束,即正交且行列式为1。而有约束的优化问题比无约束的优化问题复杂的多。因为李代数的特点,李代数表示的天然满足旋转矩阵的约束,因此通常使用李代数进行表示来求解。

问题求解

步骤概述

  1. 初始化位姿:使用闭式解法(如EPnP、DLT)获取初始相机位姿 ( R ) 和 ( t )。
  2. 构建重投影误差:将3D点投影到图像平面,计算与观测值的误差。
  3. 计算雅可比矩阵:分析误差关于位姿参数的导数,指导优化方向。
  4. 迭代优化:使用高斯-牛顿或Levenberg-Marquardt算法更新位姿,直至收敛。

详细推导与算法

1. 重投影误差定义

设第 i i i 个3D点为 P i = ( X i , Y i , Z i ) ⊤ \mathbf{P}_i = (X_i, Y_i, Z_i)^\top Pi=(Xi,Yi,Zi),对应的图像观测为 p i = ( u i , v i ) ⊤ \mathbf{p}_i = (u_i, v_i)^\top pi=(ui,vi)。相机位姿用李代数 ξ ∈ s e ( 3 ) \boldsymbol{\xi} \in \mathfrak{se}(3) ξse(3) 表示,对应的变换矩阵为 T = exp ⁡ ( ξ ∧ ) \mathbf{T} = \exp(\boldsymbol{\xi}^\wedge) T=exp(ξ)。将 P i \mathbf{P}_i Pi 变换到相机坐标系:
P i ′ = R P i + t = ( X i ′ , Y i ′ , Z i ′ ) ⊤ . \mathbf{P}'_i = \mathbf{R} \mathbf{P}_i + \mathbf{t} = (X'_i, Y'_i, Z'_i)^\top. Pi=RPi+t=(Xi,Yi,Zi).
投影到归一化平面:
Z i ′ p ^ i ′ = K P i ′ Z_i'\mathbf{\hat{p}}'_i =\mathbf{KP_i'} Zip^i=KPi
即:
[ Z i ′ u i Z i ′ v i Z i ′ ] = [ f x 0 c x 0 f y c y 0 0 1 ] [ X i ′ Y i ′ Z i ′ ] . \begin{bmatrix} Z'_iu_i \\ Z'_iv_i \\ Z'_i \end{bmatrix} = \begin{bmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} X'_i \\ Y'_i \\ Z'_i \end{bmatrix}. ZiuiZiviZi = fx000fy0cxcy1 XiYiZi .
解得:
{ u i = f x X i ′ Z i ′ + c x v i = f y Y i ′ Z i ′ + c y \begin{cases} u_i=f_x \frac{X_i'}{Z_i'}+c_x\\ v_i=f_y \frac{Y_i'}{Z_i'}+c_y\\ \end{cases} {ui=fxZiXi+cxvi=fyZiYi+cy
假设相机内参已知,重投影误差为:
e i = p ^ i ′ − p i . \mathbf{e}_i = \mathbf{\hat{p}}'_i - \mathbf{p}_i. ei=p^ipi.

2. 误差函数与优化目标

最小化所有点的重投影误差平方和:
min ⁡ ξ 1 2 ∑ i = 1 n ∥ e i ∥ 2 . \min_{\boldsymbol{\xi}} \frac{1}{2} \sum_{i=1}^n \|\mathbf{e}_i\|^2. ξmin21i=1nei2.

3. 雅可比矩阵计算

误差关于李代数 ξ \boldsymbol{\xi} ξ 的雅可比矩阵 J i \mathbf{J}_i Ji 分为两部分:
J i = ∂ e i ∂ ξ = ∂ e i ∂ P i ′ ⋅ ∂ P i ′ ∂ ξ . \mathbf{J}_i = \frac{\partial \mathbf{e}_i}{\partial \boldsymbol{\xi}} = \frac{\partial \mathbf{e}_i}{\partial \mathbf{P}'_i} \cdot \frac{\partial \mathbf{P}'_i}{\partial \boldsymbol{\xi}}. Ji=ξei=PieiξPi.

  • 误差对相机坐标系点的导数(2×3矩阵):
    ∂ e ∂ P ′ = [ ∂ u ∂ X ′ ∂ u ∂ Y ′ ∂ u ∂ Z ′ ∂ v ∂ X ′ ∂ v ∂ Y ′ ∂ v ∂ Z ′ ] = [ f x Z ′ 0 − f x X ′ Z ′ 2 0 f y Z ′ − f y Y ′ Z ′ 2 ] . \frac{\partial e}{\partial P'} = \left[ \begin{array}{ccc} \frac{\partial u}{\partial X'} & \frac{\partial u}{\partial Y'} & \frac{\partial u}{\partial Z'} \\ \frac{\partial v}{\partial X'} & \frac{\partial v}{\partial Y'} & \frac{\partial v}{\partial Z'} \end{array} \right] = \left[ \begin{array}{ccc} \frac{f_x}{Z'} & 0 & -\frac{f_x X'}{Z'^2} \\ 0 & \frac{f_y}{Z'} & -\frac{f_y Y'}{Z'^2} \end{array} \right]. Pe=[XuXvYuYvZuZv]=[Zfx00ZfyZ′2fxXZ′2fyY].
  • 相机坐标系点对位姿的导数(3×6矩阵,考虑李代数扰动):
    ∂ ( T P ) ∂ δ ξ = [ I − P ′ ∧ 0 T 0 T ] \frac{\partial (TP)}{\partial \delta \xi} = \begin{bmatrix} I & -P'^\wedge \\ 0^T & 0^T \end{bmatrix} δξ(TP)=[I0TP0T]
    由于所定义的P只有三维,因此取出结果的前三维,展开后为 2×6 矩阵:
    J i = − [ f x Z i ′ 0 − f x X i ′ ( Z i ′ ) 2 − f x X i ′ Y i ′ ( Z i ′ ) 2 f x ( 1 + ( X i ′ ) 2 ( Z i ′ ) 2 ) − f x Y i ′ Z i ′ 0 f y Z i ′ − f y Y i ′ ( Z i ′ ) 2 − f y ( 1 + ( Y i ′ ) 2 ( Z i ′ ) 2 ) f y X i ′ Y i ′ ( Z i ′ ) 2 f y X i ′ Z i ′ ] . \mathbf{J}_i = -\begin{bmatrix} \frac{f_x}{Z'_i} & 0 & -\frac{f_xX'_i}{(Z'_i)^2} & -\frac{f_xX'_i Y'_i}{(Z'_i)^2} & f_x\left(1 + \frac{(X'_i)^2}{(Z'_i)^2}\right) & -\frac{f_xY'_i}{Z'_i} \\ 0 & \frac{f_y}{Z'_i} & -\frac{f_yY'_i}{(Z'_i)^2} & -f_y(1 + \frac{(Y'_i)^2}{(Z'_i)^2}) & \frac{f_yX'_i Y'_i}{(Z'_i)^2} & \frac{f_yX'_i}{Z'_i} \end{bmatrix}. Ji= Zifx00Zify(Zi)2fxXi(Zi)2fyYi(Zi)2fxXiYify(1+(Zi)2(Yi)2)fx(1+(Zi)2(Xi)2)(Zi)2fyXiYiZifxYiZifyXi .
4. 迭代优化过程
  • 高斯-牛顿法

    1. 计算误差和雅可比:对每个点计算 e i \mathbf{e}_i ei J i \mathbf{J}_i Ji
    2. 构建线性系统:堆叠所有 J i \mathbf{J}_i Ji e i \mathbf{e}_i ei,得到 J ⊤ J Δ ξ = − J ⊤ e \mathbf{J}^\top \mathbf{J} \Delta \boldsymbol{\xi} = -\mathbf{J}^\top \mathbf{e} JJΔξ=Je
    3. 求解增量:解线性方程 Δ ξ \Delta \boldsymbol{\xi} Δξ
    4. 更新位姿 ξ ← ξ + Δ ξ \boldsymbol{\xi} \leftarrow \boldsymbol{\xi} + \Delta \boldsymbol{\xi} ξξ+Δξ
    5. 判断收敛:若 Δ ξ \Delta \boldsymbol{\xi} Δξ 足够小或误差不再下降,停止迭代。
  • Levenberg-Marquardt:通过引入阻尼因子 λ \lambda λ 稳定求解:
    ( J ⊤ J + λ I ) Δ ξ = − J ⊤ e . (\mathbf{J}^\top \mathbf{J} + \lambda \mathbf{I}) \Delta \boldsymbol{\xi} = -\mathbf{J}^\top \mathbf{e}. (JJ+λI)Δξ=Je.

关键点

  • 李代数参数化:避免旋转矩阵的约束,简化优化过程。
  • 雅可比推导:通过扰动模型或链式法则计算导数,确保优化方向正确。
  • 鲁棒性:初始值影响收敛性,建议先用闭式解法初始化。

相关文章:

最小化重投影误差求解PnP

问题描述 已知n个空间点 P i [ x i , y i , z i ] T P_i[x_i,y_i,z_i]^T Pi​[xi​,yi​,zi​]T,其投影的像素坐标 p i [ u i , v i ] T p_i[u_i,v_i]^T pi​[ui​,vi​]T求相机的位姿R,T。 问题分析 根据相机模型,像素点和空间点的位置…...

玩转Docker | 使用Docker部署IT-tools工具箱

玩转Docker | 使用Docker部署IT-tools工具箱 前言一、 IT-tools介绍简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署IT-tools服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问IT-tools应用五、测试与使用六、总结前言 在信息技…...

unity学习52:UI的最基础组件 rect transform,锚点anchor,支点/轴心点 pivot

目录 1 image 图像:最简单的UI 1.1 图像的基本属性 1.2 rect transform 1.3 image的component: 精灵 → 图片 1.4 修改颜色color 1.5 修改材质 1.6 raycast target 1.7 maskable 可遮罩 1.8 imageType 1.9 native size 原生大小 2 rect transform 2.1 …...

【Python系列】PYTHONUNBUFFERED=1的作用

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

DeepSeek-R1技术全解析:如何以十分之一成本实现OpenAI级性能?

一、现象级爆火背后的技术逻辑 2025年1月20日,中国AI公司深度求索(DeepSeek)发布新一代大模型R1,其性能直接对标OpenAI的o1版本,但训练成本仅为后者的1/20(600万美元 vs. 1.2亿美元)&#xff0…...

Linux中的cgdb的基本使用

1.cgdb的简介 Linux中的cgdb是一个基于GDB(GNU Debugger)的图形化调试前端,它结合了GDB的命令行界面功能和代码查看窗口,为开发者提供了一个更为直观的调试体验。 cgdb的作用和功能: 直观调试体验:cgdb提供…...

Qt layout

文章目录 Qt layout**关键机制****验证示例****常见误区****最佳实践****总结**关键点总结:示例代码说明:结论: Qt layout 在 Qt 中,当调用 widget->setLayout(layout) 时,layout 的父对象会被自动设置为该 widget…...

解决idea2019创建springboot项目爆红的问题

通过spring Initializr创建springboot项目时,由于idea版本太低,创建完成后需要手动修改pom.xml,对小白不太友好 一个简便的方法,配置好pom.xml文件的各个版本: 在 https://start.aliyun.com/ 上选择好后复制pom.xml代…...

DeepSeek 提示词:基础结构

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…...

自动驾驶两个传感器之间的坐标系转换

有两种方式可以实现两个坐标系的转换。 车身坐标系下一个点p_car,需要转换到相机坐标系下,旋转矩阵R_car2Cam,平移矩阵T_car2Cam。点p_car在相机坐标系下记p_cam. 方法1:先旋转再平移 p_cam T_car2Cam * p_car T_car2Cam 需要注…...

[实现Rpc] 客户端 | Requestor | RpcCaller的设计实现

目录 Requestor类的实现 框架 完善 onResponse处理回复 完整代码 RpcCaller类的实现 1. 同步调用 call 2. 异步调用 call 3. 回调调用 call Requestor类的实现 (1)主要功能: 客户端发送请求的功能,进行请求描述对服务器…...

flutter: table calendar笔记

pub dev:table_calendar 3.2.0 我来详细解释 TableCalendar 是如何根据不同的 CalendarFormat 来显示界面的。主要逻辑在 CalendarCore 中实现。 核心逻辑分为以下几个部分: 页面数量计算 - _getPageCount 方法根据不同格式计算总页数: in…...

smolagents学习笔记系列(五)Tools-in-depth-guide

这篇文章锁定官网教程中的 Tools-in-depth-guide 章节,主要介绍了如何详细构造自己的Tools,在之前的博文 smolagents学习笔记系列(二)Agents - Guided tour 中我初步介绍了下如何将一个函数或一个类声明成 smolagents 的工具&…...

axios几种请求类型的格式

Axios 是一个基于 Promise 的 HTTP 客户端,广泛用于浏览器和 Node.js 中发送 HTTP 请求。它支持多种请求格式,包括 GET、POST、PUT、DELETE 等。也叫RESTful 目录 一、axios几种请求类型的格式 1、get请求 2、post请求 3、put请求 4、delete请求 二…...

架构设计系列(六):缓存

一、概述 在应用对外提供服务的时候其稳定性,性能会受到诸多因素的影响。缓存的作用是将频繁访问的数据缓存起来,避免资源重复消耗,提升系统服务的吞吐量。 二、缓存的应用场景 2.1 客户端 HTTP响应可以被浏览器缓存。我们第一次通过HTTP请…...

个人电脑小参数GPT预训练、SFT、RLHF、蒸馏、CoT、Lora过程实践——MiniMind图文版教程

最近看到Github上开源了一个小模型的repo,是真正拉低LLM的学习门槛,让每个人都能从理解每一行代码, 从零开始亲手训练一个极小的语言模型。开源地址: GitHub - jingyaogong/minimind: 🚀🚀 「大模型」2小时…...

MySQL 中的事务隔离级别有哪些?MySQL 默认的事务隔离级别是什么?为什么选择这个级别?数据库的脏读、不可重复读和幻读分别是什么?

MySQL 中的事务隔离级别有哪些? 1. 读未提交(Read Uncommitted) 特点:一个事务可以读取另一个事务未提交的数据。如果一个事务对数据进行了修改但尚未提交,其他事务仍能读取到这些未提交的修改。优缺点: …...

格式工厂 FormatFactory v5.18.便携版 ——多功能媒体文件转换工具

格式工厂 FormatFactory v5.18.便携版 ——多功能媒体文件转换工具 功能:视频 音频 图片 文档PDF格式 各种转换,同格式调整压缩比例,调整大小 特色:果风图标 好看; 支持多任务队列,完成自动关机 下载地址&#xff1…...

python爬虫学习第十一篇爬取指定类型数据

最近在学习Python爬虫的过程中,尝试用爬虫获取指定类型的数据。今天,我想和大家分享一下我的实践过程和遇到的问题。 一、实现目标 目标是从一个网站的API接口获取不同类型的食品数据。 比如,第一步我想获取汉堡、小食、甜品等不同类型的数…...

Android 实现 RTMP 推流:快速集成指南

简介 在 Android 设备上实现 RTMP 推流,可以用于直播、远程监控等应用场景。本文将基于 rtmp-rtsp-stream-client-java 库,介绍如何在 Android 端快速集成 RTMP 推流,包括权限管理、相机预览、推流控制等关键步骤。 步骤 1. 配置 Maven 仓库 在 settings.gradle.kts 中添…...

KafkaTool

Offset Explorer 第一次打开需要配置kafka相关配置连接 随便先启动一个Kafka(先启动zookeeper) 设置key value 记得刷新...

基于C++“简单且有效”的“数据库连接池”

前言 数据库连接池在开发中应该是很常用的一个组件,他可以很好的节省连接数据库的时间开销;本文基使用C实现了一个简单的数据库连接池,代码量只有400行只有,但是压力测试效果很好;欢迎收藏 关注,本人将会…...

简单易懂,解析Go语言中的struct结构体

目录 4. struct 结构体4.1 初始化4.2 内嵌字段4.3 可见性4.4 方法与函数4.4.1 区别4.4.2 闭包 4.5 Tag 字段标签4.5.1定义4.5.2 Tag规范4.5.3 Tag意义 4. struct 结构体 go的结构体类似于其他语言中的class,主要区别就是go的结构体没有继承这一概念,但可…...

爬虫第九篇-结束爬虫循环

最近在学习Python爬虫的过程中,遇到了一个很有趣的问题:如何优雅地结束爬虫循环?今天,我想和大家分享一下我的发现和心得。 一、爬虫循环结束的常见问题 在写爬虫时,我们经常会遇到这样的情况:当爬取到的…...

国产编辑器EverEdit - 洞察秋毫!文件比较功能!

1 文件比较 1.1 应用场景 项目开发过程中,可能不同的部分会由不同的人在负责,存在一个文件多人编辑的情况,用户需要寻找差异,并将文档进行合并,比较专业的文本比较工具为BeyondCompare,WinMerge等。   如…...

QARepVGG--含demo实现

文章目录 前言引入Demo实现总结 前言 在上一篇博文RepVGG中,介绍了RepVGG网络。RepVGG 作为一种高效的重参数化网络,通过训练时的多分支结构(3x3卷积、1x1卷积、恒等映射)和推理时的单分支合并,在精度与速度间取得了优…...

五、 Spring Framework基础:Spring Data JPA基本用法与 Repository 接口

深入解析 Spring Data JPA:基本用法与 Repository 接口 Spring Data JPA 是 Spring 框架中用于简化数据访问层开发的核心模块。它基于 JPA 规范,底层使用 Hibernate 实现,通过接口继承和方法命名规则,自动实现增删改查等常见操作…...

如何实现在Redis集群情况下,同一类数据固定保存在同一个Redis实例中

1. 使用哈希标签(Hash Tags) 概述 Redis Cluster使用一致性哈希算法来分配数据到不同的节点上。为了确保相同类型的数据被分配到同一个Redis实例上,可以利用哈希标签(Hash Tags)。哈希标签是指在键名中用花括号 {} 包…...

kotlin 知识点 七 泛型的高级特性

对泛型进行实化 泛型实化这个功能对于绝大多数Java 程序员来讲是非常陌生的,因为Java 中完全没有这个概 念。而如果我们想要深刻地理解泛型实化,就要先解释一下Java 的泛型擦除机制才行。 在JDK 1.5之前,Java 是没有泛型功能的,…...

Transformer LLaMA

一、Transformer Transformer:一种基于自注意力机制的神经网络结构,通过并行计算和多层特征抽取,有效解决了长序列依赖问题,实现了在自然语言处理等领域的突破。 Transformer 架构摆脱了RNNs,完全依靠 Attention的优…...