当前位置：首页 > news >正文

世界坐标系，相机坐标系，像素坐标系转换详细说明（附代码）

news 2026/2/9 17:10:52

几个坐标系介绍，相机内外参的回顾参考此文。
本文主要说明如何在几个坐标系之间转换。

本文涉及：

使用相机内参在像素坐标系和相机坐标系之间转换。
使用相机外参（位姿）在相机坐标系和世界坐标系之间转换。
(qw,qx,qy,qz,tx,ty,tz)形式的外参如何使用。
以具体情景为例，每一步详细说明，并结合代码进一步理解每个步骤。

以下面的情景为例。
假设 I1 (img1) 上有一点p1，现在要通过相机1，相机2的内外参把p1映射到 I2 (img2)上的对应点p2.
还需要知道p1的深度，假设有img1的深度图，可以读取p1处的深度。

在这里插入图片描述

整体思路：

p1在图片 I1 上，是像素坐标系，根据camera1的内参把它转到camera1的相机坐标系，得到(xc1, yc1, zc1),
根据camera1的外参把 (xc1, yc1, zc1) 转到世界坐标系，得到上图中的P点坐标(xw1, yw1, zw1),
根据camera2的外参把P点 (xw1, yw1, zw1) 转到camera2的相机坐标系，得到 (xc2, yc2, zc2).
最后根据camera2的内参把 (xc2, yc2, zc2) 转到像素坐标系，得到图像 I2 上的 p2 点坐标(x2, y2).

整个坐标系的转换关系：像素1 -> 相机1 -> 世界 -> 相机2 -> 像素2

其中，像素坐标系为2D，其他都是3D。
相机外参也称为位姿 (pose).

具体步骤：

(1). p1 像素坐标 --> 相机1 坐标

这两个坐标系的关系由相机内参决定，
相机内参（fx, fy, cx, cy)
假设像素坐标为(x1, y1), 相机1坐标为(xc1, yc1, zc1), 其中zc1为 I1 的深度图 (xc1, yc1)处的值，那么

$x_{1} = f_{x}\frac{x_{c1}}{z_{c1}} + c_{x}$ , $y_{1} = f_{y}\frac{y_{c1}}{z_{c1}} + c_{y}$ (1)

现在要求 xc1 和 yc1, 由（1）得到
$x_{c1} = (x_{1}- c_{x}) * z_{c1} / f_{x}$ $y_{c1} = (y_{1}- c_{y}) * z_{c1} / f_{y}$

代码：

depth1_ori = cv2.imread("depth1.png", -1)  #uint16型
depth1 = cv2.split(depth1_ori)[0]
#p1点对应的相机坐标
zc1 = depth1[y1, x1] / 1000.0  #这里深度单位是mm
xc1 = (x1 - cx) * zc1 / fx
yc1 = (y1 - cy) * zc1 / fy

(2). p1 的相机1 坐标 --> 世界坐标

转换关系：相机坐标 = T * 世界坐标，世界坐标 = T^-1 * 相机坐标
其中 T 为world -> camera的转换矩阵。

如何求得转换矩阵 T ？先从概念介绍开始，

旋转矩阵R ：3 * 3矩阵
平移向量 t : 3 * 1矩阵
把R 和 t 拼成转换矩阵 T ：4 * 4矩阵，

$\begin{bmatrix} R & t\\ 0^{T}&1 \end{bmatrix}$

顺便提一下李群李代数，T是SE(3), R是SO(3).

话题回到坐标，(xc1, yc1, zc1)为相机1坐标，(xw, yw, zw) 为世界坐标，那么世界坐标转相机坐标为：

$\begin{bmatrix} x_{c1} \\ y_{c1}\\ z_{c1}\\ 1 \end{bmatrix} = T \cdot \begin{bmatrix} x_{w} \\ y_{w}\\ z_{w}\\ 1 \end{bmatrix}$

你肯定很好奇，为什么要加一维呢？
如果 $T$ 不加最后一行的 $\begin{bmatrix} 0^{T}&1 \end{bmatrix}$ ，坐标也不加最后一维的1，直接 $\begin{bmatrix} R & t \end{bmatrix}$ 也能计算，为什么一定要加一维？

$\begin{bmatrix} x_{c} \\ y_{c}\\ z_{c} \end{bmatrix} = T \cdot \begin{bmatrix} x_{w} \\ y_{w}\\ z_{w} \end{bmatrix}$ , 这里 $\begin{bmatrix}R & t\end{bmatrix}$

是这样的，现在是从世界坐标转相机1坐标，如果要把相机1坐标转世界坐标呢？
（我们现在要做的就是把 p1的相机1坐标转到世界坐标。）

那就需要这么计算了,

$\begin{bmatrix} x_{w} \\ y_{w}\\ z_{w} \end{bmatrix} = T^{-1}\cdot \begin{bmatrix} x_{c} \\ y_{c}\\ z_{c} \end{bmatrix}$ ，这里 $\begin{bmatrix}R & t\end{bmatrix}$ ，无法求逆矩阵

求 T 的逆矩阵，T 必须是square（行数 = 列数）的，不能是3 * 4, 必须是4 * 4的。

所以加上一行，凑成 4 * 4 矩阵

$\begin{bmatrix} R & t\\ 0^{T}&1 \end{bmatrix}$

那么相机坐标 --> 世界坐标就变为：

$\begin{bmatrix} x_{w} \\ y_{w}\\ z_{w}\\ 1 \end{bmatrix} = T^{-1} \cdot \begin{bmatrix} x_{c} \\ y_{c}\\ z_{c}\\ 1 \end{bmatrix}$

有的程序中会使用Twc, Tcw这样的称呼，这里w指world, 是世界坐标，c指camera, 是相机坐标。
T表示转换矩阵，至于Twc 是world转camera 还是camera转world, 需要根据实际情况而定（每个开发者习惯不一样）。

实际中，到了这里估计还是不知如何计算 T，问题在哪呢？

我们拿到的相机外参一般会是一个四元数+平移向量的形式，其中并没有R矩阵。
相机外参：(qw, qx, qy, qz, tx, ty, tz), （这个顺序要根据实际情况而定，有的相机顺序并不是这样）。

这里用四元数 q = (qw, qx, qy, qz) 代替了R矩阵，
原因在于R是3 * 3矩阵，有9个量，而一次旋转只有3个自由度，这种表达方式是冗余的，四元数的表达更紧凑。

上面是涉及到的相关概念，现在开始计算T。

计算转换矩阵 T

现在要先把 q 转为 R，再由R, t 得到T。
q = (qw, qx, qy, qz), （一定是qw, qx, qy ,qz的顺序，不是的先调整到这个顺序）
t = (tx, ty, tz), 这里要注意t 的单位，如果是mm, 需要 / 1000.0.

如果用Eigen库，可以这么得到T，
Isometry3d是4 * 4 欧式变换矩阵，就是T的格式（参考）

Eigen::Quaterniond q(qw, qx, qy, qz);
Eigen::Isometry3d T(q);
//先设置的旋转矩阵，下面平移要在旋转前的坐标系上平移，所以是pretranslate
T.pretranslate(Eigen::Vector3d(tx, ty, tz));

如果用Sophus::SE3d

SE3d T = SE3d(Quaterniond(qw, qx, qy, qz),Vector3d(tx, ty, tz)));

直接计算的话，由四元数 q 到旋转矩阵 R 的公式为（转此处的图）：
这里q0, q1, q2, q3分别对应 qw, qx, qy, qz.

在这里插入图片描述

结合 (tx, ty, tz), 下面再加一行 $\begin{bmatrix} 0^{T}&1 \end{bmatrix}$ ，得到T1 （由相机1的外参得到）。

T1 = np.array([[1 - 2 * q2 ** 2 - 2 * q3 ** 2,2 * q1 * q2 - 2 * q0 * q3,2 * q1 * q3 + 2 * q0 * q2,tx,  #注意单位，如果是mm,要/1000.0],[2 * q1 * q2 + 2 * q0 * q3,1 - 2 * q1 ** 2 - 2 * q3 ** 2,2 * q2 * q3 - 2 * q0 * q1,ty,  #注意单位，如果是mm,要/1000.0],[2 * q1 * q3 - 2 * q0 * q2,2 * q2 * q3 + 2 * q0 * q1,1 - 2 * q1 ** 2 - 2 * q2 ** 2,tz,  #注意单位，如果是mm,要/1000.0],[0,0,0,1],])

已经得到了T1，下面可把相机坐标转为世界坐标

$\begin{bmatrix} x_{w} \\ y_{w}\\ z_{w}\\ 1 \end{bmatrix} = T_{1}^{-1} \cdot \begin{bmatrix} x_{c1} \\ y_{c1}\\ z_{c1}\\ 1 \end{bmatrix}$

代码：

p1_c = np.array([xc1, yc1, zc1, 1])
p_w = np.matmul(np.linalg.inv(T1), np.expand_dims(p1_c,1))

(3). 世界坐标 --> 相机2坐标

上面已经说明了如何由世界坐标转相机坐标。
注意上面求的T1 是由相机1的外参得到，
这里要用到相机2的外参，camera2: (qw2, qx2, qy2, qz2, tx2, ty2, tz2),
求得T2 后，由下式得到 P 的相机2坐标

$\begin{bmatrix} x_{c2} \\ y_{c2}\\ z_{c2}\\ 1 \end{bmatrix} = T_{2} \cdot \begin{bmatrix} x_{w} \\ y_{w}\\ z_{w}\\ 1 \end{bmatrix}$

p2_c = np.matmul(T2, p_w)

(4) 相机2坐标 --> 像素坐标2

相机内参（fx, fy, cx, cy)

$x_{2} = f_{x}\frac{x_{c2}}{z_{c2}} + c_{x}$ , $y_{2} = f_{y}\frac{y_{c2}}{z_{c2}} + c_{y}$

xc2 = p2_c[0]
yc2 = p2_c[1]
zc2 = p2_c[2]
x2 = xc2 * fx / zc2 + cx
y2 = yc2 * fy / zc2 + cy

这样就得到了图像 I2 上的映射点 p2的坐标。

世界坐标系，相机坐标系，像素坐标系转换详细说明（附代码）

整体思路：

具体步骤：

相关文章：

世界坐标系，相机坐标系，像素坐标系转换详细说明（附代码）

计算机毕业设计基于SpringBoot的企业内部网络管理系统的设计与实现 Java实战项目附源码+文档+视频讲解

CISP模拟试题（三）

前端调取摄像头并实现拍照功能

android —— 阴影效果和跑马灯效果Textview

多态语法详解

Python大数据之linux学习总结——day11_ZooKeeper

C语言——函数的嵌套调用

4种经典的限流算法与集群限流

网工内推 | 国企、港企网工，年底双薪，NA以上认证即可

【华为HCIP | 华为数通工程师】刷题日记1116（一个字惨）

软考-高级-系统架构设计师教程（清华第2版）【第7章系统架构设计基础知识（263~285）-思维导图】

⑩⑥ 【MySQL】详解触发器TRIGGER，协助确保数据的完整性，日志记录，数据校验等操作。

数据结构与算法编程题3

Go基础面经大全(持续补充中)

uniapp heckbox-group实现多选

读懂：“消费报销”模式新零售打法，适用连锁门店加盟的营销方案

一个基本的http客户端

html-网站菜单-点击菜单展开相应的导航栏，加减号可切换

2.FastRunner定时任务Celery+RabbitMQ

从WWDC看苹果产品发展的规律

练习（含atoi的模拟实现,自定义类型等练习）

FastAPI 教程：从入门到实践

Opencv中的addweighted函数

MODBUS TCP转CANopen 技术赋能高效协同作业

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

TRS收益互换：跨境资本流动的金融创新工具与系统化解决方案

HBuilderX安装（uni-app和小程序开发）

LLM基础1_语言模型如何处理文本

Map相关知识