当前位置：首页 > news >正文

经典文献阅读之--MSC-VO(曼哈顿和结构约束VIO)

news 2026/2/10 6:14:42

0. 简介

对于视觉里程计而言，在面对低纹理场景时，往往会出现退化的问题，究其原因是人造环境往往很难找到足够数量的点特征。而其他的几何视觉线索则是比较容易找到，在城市等场景中，通常表现出结构规律，如平行性或正交性，满足曼哈顿世界的假设。之前我们已经在《经典文献阅读之–PL-SLAM》文中介绍了点线SLAM的形式，相关的具体代码我们可以在Github上找到
在这里插入图片描述

1. 文章贡献

在本文章中，我们则进一步介绍MSC-VO，一种基于rgb-d的视觉里程计方法，它结合了点和线特征，如果存在，可以利用这些结构规正和场景的曼哈顿轴。此外我们需要着重注意的是，这些结构约束最初被用来准确地估计提取的线的三维位置。这些约束还与估计的曼哈顿轴和点和线的重投影误差相结合，通过局部地图优化来细化相机姿态。这种组合使我们的方法即使在没有上述约束的情况下也能够运行，从而允许该方法在更广泛的场景中工作。具体的主要贡献如下

提出了一种鲁棒的针对低纹理环境的RGB-DVO框架，可以在场景中存在结构规律和MA对齐时提高姿态精度。否则，我们的解决方案仍然可以运行，这将在实验结果部分中显示。
一种基于场景中所呈现的结构信息的三维线端点计算方法。
一种精确、高效的三维局部地图优化策略，它将重投影误差与结构约束和MA对齐相结合。
一种新颖的MA初始化过程，通过在多图非线性最小二乘公式中使用多帧观测来改进传统采用的平均位移算法的估计。

2. 详细内容

MSC-VO建立在ORB-SLAM2[2]的跟踪和局部映射组件之上。因此，它包含两个并行运行的线程，如图2所示。其一开始结构和PL-SLAM类似，我们主要就介绍三维特征位置估计以及曼哈顿轴估计这两个部分。
在这里插入图片描述

2.1 三维特征位置估计

一旦检测到点和线并对其进行描述，就可以得到它们在摄像机坐标中的三维位置。将点 $p_i$ 在 $ItdI^d_t$ 中的2D位置对应的值作为深度进行反向投影。由此得到的摄像机坐标中的3D位置表示为 $PicP^c_i$ 。由于线条比点更容易受到深度不连续性和遮挡的影响，这个简单的过程可能会导致不准确的3D线条。为了降低这种影响，提出了一种鲁棒的两步法来计算三维直线端点。

首先，对于每个线段 $j$ ，通过反向投影符合图像中直线的点子集，计算其端点的初始3D位置，记为 ${Sjc,Ejc}\{S^c_j, E^c_j\}$ ，然后执行[14]中的鲁棒拟合步骤。三维归一化直线 $LjcL^c_j$ 的计算类似于等式1。然后，利用场景的结构约束来细化每条检测到的直线;我们首先把平行线和垂直线联系起来。为此，对于当前图像中检测到的每一对直线 $(Lmc,Lnc)(L^c_m, L^c_n)$ ，我们通过点积计算两个方向向量之间夹角的余弦:
在这里插入图片描述
我们只选择那些余弦值接近0或1的线段对， $(Lmc,Lnc)(L^c_m, L^c_n)$ 分别代表垂直线或平行线。对选定的直线对采用非线性优化方法优化其直线端点。为此，采用g2o[20]实现的Levenberg-Marquardt算法。形式上，我们定义直线 $LmcL^c_m$ 和 $LncL^c_n$ 之间的方向差异 $d$ 为:
在这里插入图片描述
我们分别表示 $L⊥\mathbb{L}_⊥$ 和 $L∣∣\mathbb{L}_{||}$ 为有效垂直线对和有效平行线对的集合。假设一对 $(Lmc,Lnc)∈L⊥(L^c_m, L^c_n)∈\mathbb{L}_⊥$ ，误差项 $Lm,n⊥\mathbb{L}_{m,n}^⊥$ 为:

…详情请参照古月居

经典文献阅读之--MSC-VO(曼哈顿和结构约束VIO)

0. 简介对于视觉里程计而言，在面对低纹理场景时，往往会出现退化的问题，究其原因是人造环境往往很难找到足够数量的点特征。而其他的几何视觉线索则是比较容易找到，在城市等场景中，通常表现出结构规律，如平…...

编程日记 2023/2/22 15:08:15

华为OD机试真题Python实现【字母计数】真题+解题思路+代码（20222023

字母计数题目给出一个只包含字母的字符串, 不包含空格,统计字符串中各个子字母(区分大小写)出现的次数, 并按照字母出现次数从大到小的顺序输出各个字母及其出现次数如果次数相同,按照自然顺序排序,且小写字母在大写字母之前 🔥🔥🔥🔥🔥👉👉👉👉👉�…...

编程日记 2023/2/22 15:07:10

在中国市场，假如Teradata像Nutanix那样“退出操作”，谁来“接盘”呢？

【引言】：看它的选择，是数据仓库发展必然还是偶然呢？【全球存储观察 ｜ 热点关注】前些天，将逐步结束在中国市场直接运营的Teradata引发了业界大量关注与讨论。作为全球数据仓库领域的绝对领导者，为什么会退…...

编程日记 2023/2/22 15:06:05

使用vs2022编译yolov5+tensorRT+cuda+cudnn代码进行混合编译

首先依赖有cuda、cudnn、tensorrt、protobuf，从Linux的代码直接移植过来这些库是没法使用的，需要下载对应win的下的版本，其中cuda、cudnn和tensorrt直接从官方下载即可，但是protobuf需要自己编译一下（protobuf3.11.4&a…...

编程日记 2023/2/22 15:04:59

记一次：request请求总结

前言：和前端联调的时候发现前端人员请求的方式不对，固做此总结问题：request请求方式有多少种？答：Java后端查看有8种，spring-web中的java枚举图如下而使用PostMan查看有15种，如下图GET&#xff0…...

编程日记 2023/2/22 15:03:53

2023年全国最新会计专业技术资格精选真题及答案2

百分百题库提供会计专业技术资格考试试题、会计考试预测题、会计专业技术资格考试真题、会计证考试题库等，提供在线做题刷题，在线模拟考试，助你考试轻松过关。二、多项选择题 1.下列各项中，属于企业流动负债的有（&am…...

编程日记 2023/2/22 15:02:43

每日英语-20230221

TV series ˈsɪriːz 系列片 greate documentary 很棒的纪录片 menstruation ˌmenstruˈeɪʃn 生理期 sexuality ˌsekʃuˈləti 性关系 which is a worldwise project giving a voice to 2000 women across 50 different countries motherhood 母亲身份 financial indepen…...

编程日记 2023/2/22 15:01:34

学习系统编程No.4【环境变量】

引言： 北京时间：2023/2/20/22:15，昨天晚上，看了一晚上的cs：go，主要原因是因为我的好舍友，叫我开箱子，然后就不可言语，看了一晚上的开箱子和精彩剪辑，不过这个…...

编程日记 2023/2/22 15:00:28

通过Docker部署rancher

先创建k8s集群 https://blog.csdn.net/weixin_44371237/article/details/123974335 环境准备一台linux主机，4G内存通过Docker部署rancher 启动rancher docker run --privileged -d --restartunless-stopped -p 80:80 -p 443:443 rancher/rancher查看本地镜像…...

编程日记 2023/2/22 14:59:24

【二叉树】

1，利用类来构建结点，利用函数递归来构建树2，因为左子树的结点编号是父节点的2倍，右子树的结点编号是父节点的2倍1，所以可以用数组模拟建树的过程构建二叉树第一种构建方式class treenode():#二叉树节点def __init__(se…...

编程日记 2023/2/22 14:58:18

华为OD机试 - 入栈出栈（C++） | 附带编码思路【2023】

刷算法题之前必看参加华为od机试，一定要注意不要完全背诵代码，需要理解之后模仿写出，通过率才会高。华为 OD 清单查看地址：https://blog.csdn.net/hihell/category_12199283.html 华为OD详细说明：https://dream.blog.csdn.net/article/details/128980730 华为OD机试题…...

编程日记 2023/2/22 14:57:13

【设计模式】对象行为型模式

行为创建型模式系列综述： 来源：该系列是主要参考《大话设计模式》和《设计模式(可复用面向对象软件的基础)》，其他详细知识点拷验来自于各大平台大佬的博客。总结：汇总篇如果对你有用，希望关注点赞收藏一波。文章目…...

编程日记 2023/2/22 14:56:02

「TCG 规范解读」第11章 TPM工作组 TCG算法注册表

可信计算组织（Ttrusted Computing Group,TCG）是一个非盈利的工业标准组织，它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立，并采纳了由可信计算平台联盟（the Trusted Computing Platform Alli…...

编程日记 2023/2/22 14:54:55

华为OD机试 - 事件推送（C++） | 附带编码思路【2023】

编程日记 2023/2/22 14:53:50

Java ”框架 = 注解 + 反射 + 设计模式“ 之注解详解

Java ”框架注解反射设计模式“ 之注解详解每博一文案刹那间我真想令时光停住，好让我回顾自己，回顾失去的年华，缅怀哪个穿一身短小的连衣裙和瘦窄的短衫的小女孩。让我追悔少年时代，我心灵的愚钝无知，它轻易…...

编程日记 2023/2/22 14:52:39

【拦截器、过滤器、springAop】那些不为人知的隐秘

首先说到这几个词的时候，大家肯定都很熟悉了，甚至觉得这几个的区别刚刚毕业都能回答了，但是我想大家在实际应用过程中是真得会真正的使用吗？换言之，什么时候用过滤器什么时候使用拦截器，什么时候使用spring…...

编程日记 2023/2/22 14:50:24

记录charles手机端配置https的成功过程

1.百度 https://www.likecs.com/show-204025787.html https://blog.csdn.net/enthan809882/article/details/117572094?spm1001.2101.3001.6650.6&utm_mediumdistribute.pc_relevant.none-task-blog-2defaultBlogCommendFromBaiduRate-6-117572094-blog-122959902.pc_rele…...

编程日记 2023/2/22 14:49:19

经典文献阅读之--MSC-VO(曼哈顿和结构约束VIO)

华为OD机试真题Python实现【字母计数】真题+解题思路+代码（20222023

在中国市场，假如Teradata像Nutanix那样“退出操作”，谁来“接盘”呢？

使用vs2022编译yolov5+tensorRT+cuda+cudnn代码进行混合编译

记一次：request请求总结

2023年全国最新会计专业技术资格精选真题及答案2

每日英语-20230221

学习系统编程No.4【环境变量】

通过Docker部署rancher

【二叉树】

华为OD机试 - 入栈出栈（C++） | 附带编码思路【2023】

【设计模式】对象行为型模式

「TCG 规范解读」第11章 TPM工作组 TCG算法注册表

华为OD机试 - 事件推送（C++） | 附带编码思路【2023】

Java ”框架 = 注解 + 反射 + 设计模式“ 之注解详解

【拦截器、过滤器、springAop】那些不为人知的隐秘

记录charles手机端配置https的成功过程

你知道这几种常见的JVM调优场景吗？

华为OD机试真题Python实现【最长连续子串】真题+解题思路+代码（20222023）

Vue使用distpicker插件实现省市级下拉框三级联动

stm32G473的flash模式是单bank还是双bank？

高频面试之3Zookeeper

React Native在HarmonyOS 5.0阅读类应用开发中的实践

MVC 数据库

《基于Apache Flink的流处理》笔记

AspectJ 在 Android 中的完整使用指南

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理）

C++使用 new 来创建动态数组

华为OD机试-最短木板长度-二分法(A卷,100分)

认识CMake并使用CMake构建自己的第一个项目

经典文献阅读之--MSC-VO(曼哈顿和结构约束VIO)

0. 简介

1. 文章贡献

2. 详细内容

2.1 三维特征位置估计

…详情请参照古月居

相关文章：