当前位置：首页 > news >正文

《视觉SLAM十四讲》-- 相机与图像

news 2026/2/10 17:30:48

04 相机与图像

4.1 相机模型

4.1.1 针孔相机模型

针孔模型描述了一束光线通过针孔后，在针孔背面投影成像的关系（类似小孔成像原理）。

在这里插入图片描述

根据相似三角关系

$\frac{Z}{f}=-\frac{X}{X^{\prime}}=-\frac{Y}{Y^{\prime}} \tag{3-1}$

其中，负号表示成的像是倒立的。

但实际相机得到的图像并不是倒像，我们等价地将成像平面对称地放到相机前方，这样就可以把负号去掉，
在这里插入图片描述

$\frac{Z}{f}=\frac{X}{X^{\prime}}=\frac{Y}{Y^{\prime}} \tag{3-2}$

整理得

$\left\{\begin{array}{l} {X^{\prime}}=f\frac{X}{Z} \\ \\ {Y^{\prime}}=f\frac{Y}{Z} \end{array}\right. \tag{3-3}$

像素坐标与成像平面之间，相差了一个缩放和一个原点的平移。假设像素坐标在 $u$ 轴上缩放了 $\alpha$ 倍，在 $v$ 轴上缩放了 $\beta$ 倍，同时，原点平移了 $c_x, c_y]^T$ 。那么， $P^{'}$ 在成像平面坐标系和像素坐标系之间的关系为：

在这里插入图片描述

$\left\{\begin{array}{l} u=\alpha X^{\prime}+c_{x} \\ v=\beta Y^{\prime}+c_{y} \end{array}\right. \tag{3-4}$

代入式（3-3），得

$\left\{\begin{array}{l} u=\alpha f \frac{X}{Z}+c_{x} \\ \\ v=\beta f \frac{Y}{Z}+c_{y} \end{array}\right. \tag{3-5}$
记 $\alpha f=f_x,$ ， $\beta f=f_y$ 得

$\left\{\begin{array}{l} u=f_{x} \frac{X}{Z}+c_{x} \\ \\ v=f_{y} \frac{Y}{Z}+c_{y} \end{array}\right. \tag{3-6}$

写成矩阵形式

$\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]=\frac{1}{Z}\left[\begin{array}{ccc} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{array}\right]\left[\begin{array}{c} X \\ Y \\ Z \end{array}\right] \stackrel{\text { def }}{=} \frac{1}{Z} \boldsymbol{K} \boldsymbol{P} \tag{3-7}$

将 $Z$ 移到左边

$Z\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]=\left[\begin{array}{ccc} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{array}\right]\left[\begin{array}{c} X \\ Y \\ Z \end{array}\right] \stackrel{\text { def }}{=} \boldsymbol{K} \boldsymbol{P} \tag{3-8}$

中间的矩阵称为相机内参数，一般在相机出厂后便已确定。

由于相机在运动，点 $P$ 的相机坐标应由他的世界坐标（ $P_w$ ）根据相机当前位姿变换得到

$\boldsymbol{P}_{u v}=Z\left[\begin{array}{l} u \\ v \\ 1 \end{array}\right]=\boldsymbol{K} \boldsymbol{P}=\boldsymbol{K}\left(\boldsymbol{R} \boldsymbol{P}_{\mathrm{w}}+\boldsymbol{t}\right)=\boldsymbol{K} \boldsymbol{T} \boldsymbol{P}_{\mathrm{w}} \tag{3-9}$
其中， $\boldsymbol{R}$ 、 $\boldsymbol{t}$ 为外参。

上式描述了从世界坐标系到相机坐标系再到像素坐标系的过程。

将世界坐标转换到相机坐标后，再除掉最后一维的数值，这相当于把最后一维作归一化处理，得到它在归一化平面上的投影：

$\left(\boldsymbol{R} \boldsymbol{P}_{\mathrm{w}}+\boldsymbol{t}\right)=\underbrace{[X, Y, Z]^{\mathrm{T}}}_{\text {相机坐标 }} \rightarrow \underbrace{[X / Z, Y / Z, 1]^{\mathrm{T}}}_{\text {归一化坐标 }}$

可知，点的深度信息在投影过程中丢失了（变成二维），所以单目视觉无法得到像素点深度值。

4.1.2 畸变模型

（1）由透镜形状引起的畸变称为径向畸变，一般有桶形畸变和枕形畸变两类。

在这里插入图片描述

对于径向畸变，离中心距离越远，畸变越严重；穿过图像中心和光轴有交点的直线形状不变。

（2）在相机组装过程中，透镜和成像平面无法完全平行，会产生切向畸变。

（3）下面用数学模型进行描述：假设归一化平面上存在一点 $P$ ，坐标为 $x, y]^T$ ，极坐标为 $\theta]^T$ ，那么，正常归一化平面坐标和畸变后的坐标之间的关系为

$\left\{\begin{array}{l} x_{distorted}=x(1+k_1r^2+k_2r^4+k_3r^6)\\ \\ y_{distorted}=y(1+k_1r^2+k_2r^4+k_3r^6) \end{array}\right. \tag{3-10}$

类似的，切向畸变数学模型为

$\left\{\begin{array}{l} \begin{aligned} &x_{\text {distorted }}=x+2 p_{1} x y+p_{2}\left(r^{2}+2 x^{2}\right) \\ &y_{\text {distorted }}=y+p_{1}\left(r^{2}+2 y^{2}\right)+2 p_{2} x y \end{aligned} \end{array}\right. \tag{3-11}$

（4）去畸变的过程：

将三维空间上的点投影到归一化平面，得到坐标 $x, y]^T$ ；
计算径向畸变和切向畸变

$\left\{\begin{array}{l} x_{distorted}=x(1+k_1r^2+k_2r^4+k_3r^6)+2 p_{1} x y+p_{2}\left(r^{2}+2 x^{2}\right)\\ \\ y_{distorted}=y(1+k_1r^2+k_2r^4+k_3r^6)+p_{1}\left(r^{2}+2 y^{2}\right)+2 p_{2} x y \end{array}\right. \tag{3-12}$

通过内参矩阵将相机坐标投影到像素平面。

（5）单目相机的成像过程

世界坐标系下一点 $P_w$ ；
经旋转平移得到相机坐标 $\tilde{P}_{\mathrm{c}}=\boldsymbol{RP_w+t}$ ；
将坐标的三个分量分别除以 $Z$ ，得到归一化坐标 $P_c=[X/Z, Y/Z, 1]^T$ ；
计算发生畸变后的坐标；
经过内参矩阵，得到像素坐标 $\boldsymbol{P}_{uv}=\boldsymbol{KP_c}$ 。

4.1.3 双目相机模型

在这里插入图片描述

其中， $O_L$ 和 $O_R$ 为左右相机光圈中心，两者之间的距离称为基线； $f$ 为焦距； $u_R$ 为负数，需加负号。

根据几何关系，有

$\frac {z-f}{z}=\frac {b-(u_L-u_R)} {b}=\frac {b-u_L+u_R} {b} \tag{3-13}$

定义 $d=u_L-u_R$ ，称为视差，整理上式得，

$z=\frac {fb}{d} \tag{3-14}$

可见，视差越大，距离越近。基线 $b$ 越大，可测量的距离就越大；反之，小型双目器件只能测量很近的距离。

4.1.4 RGB-D 相机模型

RGB-D 相机可以主动测量每个像素的深度，按原理可分为两类：

通过红外结构光原理测量像素距离。
通过飞行时间原理测量像素距离。

在这里插入图片描述

RGB-D 相机容易受到日光或其他传感器的干扰，因此不能在室外使用。

4.2 图像

在这里插入图片描述

《视觉SLAM十四讲》-- 相机与图像

04 相机与图像

4.1 相机模型

4.1.1 针孔相机模型

4.1.2 畸变模型

4.1.3 双目相机模型

4.1.4 RGB-D 相机模型

4.2 图像

相关文章：

《视觉SLAM十四讲》-- 相机与图像

欧科云链：成本与规模之辨——合规科技如何赋能香港Web3生态？

【文献分享】NASA JPL团队CoSTAR一大力作：直接激光雷达里程计:利用密集点云快速定位

SPASS-探索性分析

电子印章怎么弄？三步教你电子印章在线生成免费教程！

以技术创新引领行业发展，飞凌嵌入式获双项省级荣誉

在Google Kubernetes集群创建分布式Jenkins(二)

GEE：GEE中调用 Math.js 教程

迅为龙芯3A5000主板,支持PCIE 3.0、USB 3.0和 SATA 3.0显示接口2 路、HDMI 和1路 VGA,可直连显示器

Opencv for unity 下载

独立IP主机怎么样？对网站有什么影响

Gerrit lfs安装及配置

基于表面电势的AlGaN/GaN MODFET紧凑模型

c语言中的fread

Unity游戏开发基础组件

股票四倍杠杆什么意思？

【hcie-cloud】【2】华为云Stack解决方案介绍、缩略语整理【下】

多无人机在线路径规划的新算法

什么是运营商精准大数据？又有什么作用？

Adobe Photoshop 2020给证件照换底

XML Group端口详解

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

【Java学习笔记】Arrays类

visual studio 2022更改主题为深色

【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表

Linux云原生安全：零信任架构与机密计算

CRMEB 框架中 PHP 上传扩展开发：涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

C++.OpenGL （14/64）多光源（Multiple Lights）

HubSpot推出与ChatGPT的深度集成引发兴奋与担忧

Oracle11g安装包