当前位置：首页 > news >正文

《视觉SLAM十四讲》-- 建图

news 2026/2/10 6:47:43

11 建图

11.1 概述

（1）地图的几类用处：

定位：
导航：机器人在地图中进行路径规划；
避障
重建
交互：人与地图之间的互动

（2）几类地图

稀疏地图
稠密地图
语义地图

在这里插入图片描述

11.2 单目稠密重建

11.2.1 立体视觉

（1）稠密重建中，我们需要知道每个像素（或大部分像素）的距离，对此有以下几种方案：

使用单目相机，估计相机运动，并且三角化计算像素的距离；
使用双目相机，利用左右目的视差计算像素的距离；
使用 RGB-D 相机直接获取像素距离。

前两种方式称为立体视觉，在 RGB-D 相机无法很好应用的室外、大型场景中，仍有较好的表现。

11.2.2 极线搜索与块匹配

对于一个单目相机，假设我们观察测到了某个像素 $p_1$ ，显然，还是无法确定它的深度信息，但这个像素对应的空间点应该分布在某条射线上。从另一个视角，这条线的投影也形成了图像平面上的一条线，称为极线。当知道两个相机之间的运动时，这条极线也是可以确定的。但问题是，极线上的哪个点才是 $p_1$ 对应的点呢？

在这里插入图片描述

在 $p_1$ 周围取 $\times w$ 大小的像素块，在极线上也取相同大小的块，依次进行比较，直至找到 $p_2$ ，这就是所谓的 块匹配。当然这种方法的前提是 图像块灰度不变性，相较于像素灰度不变性，假设更强了。

把 $p_1$ 周围的像素块记为 $\boldsymbol{A} \in \mathbb{R}^{w \times w}$ ，把极线上的 $n$ 个小块记为 $\boldsymbol{B}_i，i=1,2,...,n$ ，计算二者之间的差异：

SAD（Sum of Absolute Difference），两个小块的差的绝对值之和：

$S(\boldsymbol{A},\boldsymbol{B})_{\mathrm{SAD}}=\sum_{i,j}|\boldsymbol{A}(i,j)-\boldsymbol{B}(i,j)| \tag{11-1}$

SSD（Sum of Squared Distance），即平方和：

$S(\boldsymbol{A},\boldsymbol{B})_{\mathrm{SSD}}=\sum_{i,j}(\boldsymbol{A}(i,j)-\boldsymbol{B}(i,j))^2 \tag{11-2}$

NCC（Normalized Cross Correlation），归一化互相关，计算两个小块的相关性：

$S(\boldsymbol{A}, \boldsymbol{B})_{\mathrm{NCC}}=\frac{\sum_{i, j} \boldsymbol{A}(i, j) \boldsymbol{B}(i, j)}{\sqrt{\sum_{i, j} \boldsymbol{A}(i, j)^{2} \sum_{i, j} \boldsymbol{B}(i, j)^{2}}} \tag{11-3}$

相关性越接近于 0 表示越不相似，接近 1 表示相似。

现在，我们在极线上计算了 $\boldsymbol{A}$ 与每一个 $\boldsymbol{B}_i$ 的相似性度量。这里假设使用 NCC 进行度量，那么，将得到一个沿极线的 NCC分布。我们将使用概率分布描述深度值，而非某个单一数值。于是，问题转化为在不断对不同图像进行极线搜索时，我们估计的深度分布将发生怎样的变化———这就是所谓的 深度滤波器。

在这里插入图片描述

11.2.3 高斯分布的深度滤波器

像素点深度的估计，也是一个状态估计问题，于是有滤波器和非线性优化两种方式。但由于 SLAM 实时性要求和算力的限制，一般在建图时采用计算量较小的滤波器进行优化。

假设深度 $d$ 符合 高斯分布（也可能是其他分布）：

$P(d)=N(\mu, \sigma^2) \tag{11-4}$

每当新的数据到来，我们都会观测它的深度，假设它也符合高斯分布：

$P(d_{\mathrm{obs}})=N(\mu_{\mathrm{obs}}, \sigma_{\mathrm{obs}}^2) \tag{11-5}$

根据观测到的数据更新原先 $d$ 的分布，也就是两个分布相乘，得到融合后的分布 $N(\mu_{\mathrm{fuse}}, \sigma_{\mathrm{fuse}}^2)$ ，即

$\mu_{\text {fuse }}=\frac{\sigma_{\mathrm{obs}}^{2} \mu+\sigma^{2} \mu_{\mathrm{obs}}}{\sigma^{2}+\sigma_{\mathrm{obs}}^{2}}, \quad \sigma_{\text {fuse }}^{2}=\frac{\sigma^{2} \sigma_{\mathrm{obs}}^{2}}{\sigma^{2}+\sigma_{\mathrm{obs}}^{2}} \tag{11-6}$

现在关键在于计算 $\mu_{\mathrm{obs}}$ 和 $\sigma_{\mathrm{obs}}^2$ 。假设我们找到了 $\boldsymbol{p}_1$ 对应的点 $\boldsymbol{p}_2$ ，从而观测到了 $\boldsymbol{p}_1$ 的深度，认为 $\boldsymbol{p}_1$ 对应的三维点为 $\boldsymbol{P}$ 。记 $\boldsymbol{O_1P}$ 为 $\boldsymbol{p}$ ， $\boldsymbol{O_1 O_2}$ 为相机平移 $\boldsymbol{t}$ ， $\boldsymbol{O_2P}$ 为 $\boldsymbol{a}$ ，两个夹角分别为 $\alpha$ 、 $\beta$ 。现在考虑极线 $l_2$ 上存在一个像素大小的误差，使点 $\boldsymbol{p}_2$ 变为 $\boldsymbol{p}_2'$ ，使 $\beta$ 角变为 $\beta '$ 。我们要考虑的是，这个像素误差会导致距离 $\boldsymbol{p}$ 和 $\boldsymbol{p'}$ 产生多大差距。

在这里插入图片描述

根据几何关系，

$\boldsymbol{a}=\boldsymbol{p}-\boldsymbol{t}$

$\alpha=\arccos \langle\boldsymbol{p}, \boldsymbol{t}\rangle$

$\beta=\arccos \langle\boldsymbol{a}, \boldsymbol{-t}\rangle \tag{11-7}$

对 $\boldsymbol{p}_2$ 扰动一个像素，使 $\beta$ 变为 $\beta '$ ，根据几何关系

$\beta'=\arccos \langle\boldsymbol{O_2p_2'}, \boldsymbol{-t}\rangle$

$\gamma=\pi-\alpha-\beta' \tag{11-8}$

由正弦定理

$\|\boldsymbol{p'}\|=\|\boldsymbol{t}\| \frac{\sin\beta'}{\sin \gamma} \tag{11-9}$

这样，我们就确定了由单个像素的不确定引起的深度不确定性，如果认为极线搜索的块匹配仅有一个像素的误差，那么可以设

$\sigma_{\mathrm{obs}}=\|\boldsymbol{p}\|-\|\boldsymbol{p'}\| \tag{11-10}$

当极线搜索的不确定性大于一个像素时，可按此推导放大这个不确定性。当不确定性小于某个阈值时，就可认为深度数据收敛。

因此，估计稠密深度的完整过程为：

① 假设所有的像素深度都满足某个初始的高斯分布；
② 当新数据产生时，通过极线搜索和块匹配确定投影点的位置；
③ 根据几何关系计算三角化后的深度及不确定性；
④ 将当前观测融合进上一次估计中，若收敛则停止，否则返回第二步。

需要注意的是，这里的深度是指 $O_1P$ 的长度，而针孔相机的深度是指像素的 $z$ 值。

11.3 实践：单目稠密重建

11.4 RGB-D 稠密建图

（1）点云：直接由 RGB-D 图像生成，不需要额外处理。

（2）网格/面片

（3）八叉树地图

（4）TSDF

11.4.1 八叉树地图

点云有几个明显的缺点：一是规模太大，有很多无效信息，占据大量空间；二是无法处理运动的物体。因此提出了一种灵活的、可压缩的、能随时更新的地图形式：八叉树地图（Octo-tree）。

在这里插入图片描述

左图显示了一个大立方体不断被均分成八块，直到变为最小的块为止。于是，可以将整个大方块看做根节点，最小的块看做叶子结点，当由下一层节点往上走一层时，地图体积就扩大八倍。当某个方块的所有子节点都被占据或都不被占据时，就没必要展开这个节点，例如地图开始为空白，就只需要一个根节点，而不需要完整的树，所以说八叉树比点云更节省空间。

用概率的形式来表达节点是否被占据，比如初始值为 0.5，如果不断观测到它被占据，则值不断增大；如果不断观测到它是空白，则不断减小。当然，如果这个值不断增大或减小，就可能超出 $[0, 1]$ 之外，因此，我们采用 概率对数值 来描述。设 $y\in \mathbb{R}$ 为概率对数值， $x$ 为 0~1 的概率，定义

$y=\mathrm{logit}(x)=\log(\frac{x}{1-x}) \tag{11-11}$

其反变换为：

$x=\mathrm{logit}^{-1}(y)=\frac{\exp(y)}{\exp(y)+1} \tag{11-12}$

可以看出，当 $y$ 从 $-\infty$ 到 $+\infty$ 时， $x$ 范围为 0~1，当 $y$ 取 0 时， $x$ 取 0.5。因此，不妨用 $y$ 来表达节点是否被占据，再将其转换为概率 $x$ 即可。假设某节点 $n$ ，观测数据为 $z$ ，那么从开始到 $t$ 时刻该节点的概率对数值为 $L(n|z_{1:t})$ ， $t + 1$ 时刻为

$L(n|z_{1:t+1})=L(n|z_{1:t-1})+L(n|z_{t}) \tag{11-13}$

将其写成概率形式（也就是 $x$ ），

$P\left(n \mid z_{1: T}\right)=\left[1+\frac{1-P\left(n \mid z_{T}\right)}{P\left(n \mid z_{T}\right)} \frac{1-P\left(n \mid z_{1: T-1}\right)}{P\left(n \mid z_{1: T-1}\right)} \frac{P(n)}{1-P(n)}\right]^{-1} \tag{11-14}$

有了对数概率，就可根据 RGB-D 数据更新八叉树地图。假设在 RGB-D 图像中某个像素带有深度 $d$ ，就说明：在深度值对应的空间点上观察到了一个占据数据，并且，从相机光心出发到这个点的线段上应该是没有物体的（否则被遮挡）。

11.4.2 TSDF 地图和 Fusion 系列

实时三维重建

《视觉SLAM十四讲》-- 建图

11 建图 11.1 概述 （1）地图的几类用处： 定位：导航：机器人在地图中进行路径规划；避障重建交互：人与地图之间的互动 （2）几类地图稀疏地图稠密地图语义地图 11.2 单目…...

编程日记 2023/11/21 2:07:13

智能配电箱柜管理系统

智能配电箱柜管理系统是一个综合性的管理系统，专门设计用于监控和控制智能配电箱和柜的运行。这个系统集成了先进的技术和智能化功能，以确保配电系统的正常运行并提高其效率。依托电易云-智慧电力物联网，以下是智能配电箱柜管理系统的主要特点…...

编程日记 2023/11/21 2:06:12

聊聊近些年 CPU 在微架构、IO 速率上的演进过程

大家好，我是飞哥！ 在上一篇《深入了解 CPU 的型号、代际架构与微架构》中我们介绍了我手头的一颗 Intel(R) Core(TM) i5 的型号规则，以及它的物理硬件的 Die 图结构。以及它对应的 Skylake 核的微架构实现。不少同学开始问我其它型号的 CPU…...

编程日记 2023/11/21 2:05:11

PS学习笔记——移动工具

文章目录介绍文档内移动文档间移动介绍移动工具：用于移动图层中的对象，并且同一图层中的所有对象都将一起移动选中移动工具后，选项栏中会出现“显示变换控件”，勾选后即可看见图层中的对象周围出现边框，可以进行缩…...

编程日记 2023/11/21 2:04:09

信息中心网络提出的背景、研究现状及研究内容

信息中心网络什么时候提出的？未来发展前景？有什么著名实验室在做？ 1、提出背景： 互联网产生于上世纪60年代： （1）网络设备数量呈指数性增长截至2022年底全球范围内预计将有超过280亿台终端设…...

编程日记 2023/11/21 2:01:06

【计算机视觉】24-Object Detection

文章目录 24-Object Detection1. Introduction2. Methods2.1 Sliding Window2.2 R-CNN: Region-Based CNN2.3 Fast R-CNN2.4 Faster R-CNN: Learnable Region Proposals2.5 Results of objects detection 3. SummaryReference 24-Object Detection 1. Introduction Task Defin…...

编程日记 2023/11/21 1:59:03

【mac 解决eclipse意外退出】

打开eclipse时提示报错信息应用程序"Eclipse.app"无法打开（这里忘了截图就不上图了）。点击 “好” 的按钮后会弹出发送报告的弹窗终端输入：sudo codesign --force --deep --sign - /Applications/Eclipse.app/ 就可以解决了...

编程日记 2023/11/21 1:58:02

mysql innodb buffer pool缓冲池命中率和命中了哪些表？—— 筑梦之路

环境说明 mysql 5.7及以上公式 # InnoDB缓冲区缓存的命中率计算公式100 * (1 - (innodb_buffer_pool_reads/innodb_buffer_pool_read_requests ))注意: 对于具有大型缓冲池的系统，既要关注该比率，也要关注OS页面读写速率的变化可以更好地跟踪差异。s…...

编程日记 2023/11/21 1:57:01

牛掰的dd命令，cpi0配合find备份（不会主动备份），od查看

dd if设备1或文件 of设备2或文件 blocknsize countn 还原就是把设备1,2调过来这里想到dump的还原是命令restore，想起来就写一下，省的总忘记可以针对整块磁盘进行复制，对于新创建的分区，也不用格式化，可以直接…...

编程日记 2023/11/21 1:56:00

pip list 和 conda list的区别

PS : 网上说conda activate了之后就可以随意pip了可以conda和pip混用但是安全起见还是尽量用pip 这样就算activate了，进入base虚拟环境了 conda与pip的区别来源 Conda和pip通常被认为几乎完全相同。虽然这两个工具的某些功能重叠，但它们设计用于不…...

编程日记 2023/11/21 1:53:57

多目标应用：基于多目标灰狼优化算法MOGWO求解微电网多目标优化调度（MATLAB代码）

一、微网系统运行优化模型微电网优化模型介绍： 微电网多目标优化调度模型简介_IT猿手的博客-CSDN博客二、多目标灰狼优化算法MOGWO 多目标灰狼优化算法MOGWO简介： 三、多目标灰狼优化算法MOGWO求解微电网多目标优化调度 （1&#xff09…...

编程日记 2023/11/21 1:52:56

LangChain 2模块化prompt template并用streamlit生成网站实现给动物取名字

上一节实现了 LangChain 实现给动物取名字， 实际上每次给不同的动物取名字，还得修改源代码，这周就用模块化template来实现。 1. 添加promptTemplate from langchain.llms import OpenAI # 导入Langchain库中的OpenAI模块 from langchain.p…...

编程日记 2023/11/21 1:51:55

linux nas

挂载到本地 mkdir -p /mnt/mountnasdir mount -t nfs 192.168.62:/cnas_id10086_vol10010_dev/ /mnt/mountnasdir...

编程日记 2023/11/21 1:50:54

控制您的音乐、视频等媒体内容

跨多个 Chrome 标签页播放音乐或声音在计算机上打开 Chrome 。在标签页中播放音乐、视频或其他任何有声内容。您可以停留在该标签页上，也可以转到别处。要控制声音，请在右上角点击“媒体控件”图标。您可暂停播放、转到下一首歌曲/下一个视频&#xf…...

编程日记 2023/11/21 1:49:53

xlua源码分析（三）C#访问lua的映射

xlua源码分析（三）C#访问lua的映射上一节我们主要分析了lua call C#的无wrap实现。同时我们在第一节里提到过，C#使用LuaTable类持有lua层的table，以及使用Action委托持有lua层的function。而在xlua的官方文档中，推荐使…...

编程日记 2023/11/21 1:48:52

2023 极术通讯-汽车“新四化”路上，需要一片安全山海

导读：极术社区推出极术通讯，引入行业媒体和技术社区、咨询机构优质内容，定期分享产业技术趋势与市场应用热点。芯方向【Armv9】-动态TrustZone技术的介绍动态 TrustZone 是提供多租户安全媒体 pipeline 的绝佳工具。完全不受操作系统、虚…...

编程日记 2023/11/21 1:47:51

Spring Boot接口设计规范

接口参数处理及统一结果响应 1、接口参数处理 1、普通参数接收这种参数接收方式是比较常见的，由于是GET请求方式，所以在传参时直接在路径后拼接参数和参数值即可。例如：localhost:8080/api/product/list?key1value1&key2value2 /…...

编程日记 2023/11/21 1:46:48

美创科技与南京大数据安全技术有限公司达成战略合作

近日，美创科技与南京大数据安全技术有限公司正式签署战略合作协议，优势力量共享、共拓共创共赢。美创科技CEO柳遵梁、副总裁罗亮亮、副总裁王利强，南京大数据安全技术有限公司总经理潘杰、市场总监刘莉莎、销售总监王皓月、技术总监薛松等出…...

编程日记 2023/11/21 1:45:47

2.4路由日志管理

2.4路由/日志管理一、静态路由和动态路由路由器在转发数据时，需要现在路由表中查找相应的路由，有三种途径 （1）直连路由：路由器自动添加和自己直连的路由 （2）静态路由：管理员手动…...

编程日记 2023/11/21 1:43:45

归并排序详解：递归实现+非递归实现（图文详解+代码）

文章目录归并排序1.递归实现2.非递归实现3.海量数据的排序问题归并排序时间复杂度：O ( N * logzN ) 每一层都是N,有log2N层空间复杂度：O（N），每个区间都会申请内存，最后申请的数组大小和array大小相同稳定…...

编程日记 2023/11/21 1:42:44

生成xcframework

打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式，可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。使用 Xcode 命令行工具打包通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...

编程新知 2025/10/5 2:30:38

理解 MCP 工作流：使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP？ 模型控制协议 (MCP) 是一种创新的协议，旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议，它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。可以把它想象成你的 AI 模型和想要使用它…...

编程新知 2026/2/10 5:21:30

【项目实战】通过多模态+LangGraph实现PPT生成助手

PPT自动生成系统基于LangGraph的PPT自动生成系统，可以将Markdown文档自动转换为PPT演示文稿。功能特点 Markdown解析：自动解析Markdown文档结构PPT模板分析：分析PPT模板的布局和风格智能布局决策：匹配内容与合适的PPT布局自动…...

编程新知 2026/2/3 22:50:07

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章参考资料源码： https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

编程新知 2026/1/31 14:55:53

基于SpringBoot在线拍卖系统的设计和实现

摘要随着社会的发展，社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。在线拍卖系统，主要的模块包括管理员；首页、个人中心、用户管理、商品类型管理、拍卖商品管理、历史竞拍管理、竞拍订单…...

编程新知 2026/1/26 13:25:02

基于Java+VUE+MariaDB实现（Web）仿小米商城

仿小米商城环境安装 nodejs maven JDK11 运行 mvn clean install -DskipTestscd adminmvn spring-boot:runcd ../webmvn spring-boot:runcd ../xiaomi-store-admin-vuenpm installnpm run servecd ../xiaomi-store-vuenpm installnpm run serve 注意：运行前…...

编程新知 2026/1/31 4:37:40

解析奥地利 XARION激光超声检测系统：无膜光学麦克风 + 无耦合剂的技术协同优势及多元应用

在工业制造领域，无损检测（NDT)的精度与效率直接影响产品质量与生产安全。奥地利 XARION开发的激光超声精密检测系统，以非接触式光学麦克风技术为核心，打破传统检测瓶颈，为半导体、航空航天、汽车制造等行业提供了高灵敏…...

编程新知 2026/2/3 15:45:51

LUA+Reids实现库存秒杀预扣减记录流水以及自己的思考

目录 lua脚本记录流水记录流水的作用流水什么时候删除我们在做库存扣减的时候，显示基于Lua脚本和Redis实现的预扣减这样可以在秒杀扣减的时候保证操作的原子性和高效性 lua脚本 // ... 已有代码 ...Overridepublic InventoryResponse decrease(Inventor…...

编程新知 2025/9/24 10:06:05