当前位置: 首页 > news >正文

第10讲 后端2

主要目标:理解滑动窗口法、位姿图优化、带IMU紧耦合的优化、掌握g2o位姿图。

第9讲介绍了以为BA为主的图优化。BA能精确优化每个相机位姿与特征点位置。不过在更大的场景中,大量特征点的存在会严重降低计算效率,导致计算量越来越大,无法实时化。本讲第一部分介绍一种简化的BA:位姿图

目录

0、名词解释

1、滑动窗口滤波与优化

1.1 实际环境下的BA结构

1.2 滑动窗口法

2、位姿图

2.1 位姿图的意义

2.2 位姿图的优化

3、实践:位姿图优化

3.1 g2o原生位姿图

3.2 李代数上的位姿图优化

3.3 小结


0、名词解释

  • SfM(Structure from Motion)是一种从多个视角拍摄的对象或场景中重建其三维结构的方法。
  • VO(Visual Odometry)或VIO(Visual-Inertial Odometry)系统:解决的是里程计问题,里程计部分是由惯导,轮速计,视觉,激光等多传感器融合完成。

1、滑动窗口滤波与优化

1.1 实际环境下的BA结构

  • 控制计算规模的方法
    • 从连续的视频中抽出一部分作为关键帧,仅构造关键帧与路标点之间的BA,非关键帧只用于定位,对建图则无贡献。
    • 按照某种原则,取时间上靠近当前时刻,空间上又可以展开的关键帧,从而保证相机即使在停止不动时,BA结构也不至于缩成一团。
    • 定义共视图(与现在的相机存在共同观测的关键帧构成的图)结构,在BA优化时,按照某些原则在共视图内取关键帧和路标优化。例如,仅优化于当前帧有20个共视路标的关键帧,其余部分固定不变。
    • 滑动窗口也好,共视图也好,都是对实时计算的某种工程上的折中。

1.2 滑动窗口法

  • 滑动窗口法比较适合VO系统,而不适合大规模建图的系统。
  • 在边缘化时,我们考虑关键帧的位姿,即:[x_1,...,x_N]\sim N([\mu _1,...,\mu _N]^T,\sum ),其中\mu _k是第k个关键帧的位姿均值,\sum为所有关键帧的协方差矩阵。均值部分是指BA迭代之后的结果,而\sum就是对整个BA的H矩阵进行边缘化之后的结果,即上一讲的S矩阵。
  • 当窗口结构发生改变,这些状态变量如何变化?
    • 需要在窗口新增一个关键帧,以及它观测到的路标点。
    • 需要把窗口中的一个旧的关键帧删除,也可能删除它观测到的路标点。
  •  新增一个关键点和路标点
    • 只需按照正常BA流程处理即可,对所有点进行边缘化时,即得到这N+1个关键帧的高斯分布参数。
  • 删除一个旧的关键帧
    • 若考虑边缘化旧的关键帧x_1,那么Schur消元过程相当于通过矩阵行和列操作消去非对角线处几个非零矩阵块,显然将导致右下角路标矩阵块不再是非对角矩阵。这个过程称为边缘化中的填入(Fill-in)。这时BA无法按照先前的稀疏方式迭代求解。
    • 若对边缘化过程进行一些改造,也可以保持滑动窗口BA的稀疏性。例如,在边缘化某个旧的关键帧时,同时边缘化它观测到的路标点。这样,路标点的信息就会转换成剩下那些关键帧之间的共视信息,从而保持右下角部分的对角块结构。
    • 还有其他更复杂的边缘化策略,例如OKVIS。
  •  SWF中边缘化的直观解释
    • 边缘化在概率上的意义就是指条件概率。所以,我们边缘化某个关键帧,即“保持这个关键帧当前的估计值,求其他状态变量以这个关键帧为条件的条件概率”。
      • 当某个关键帧被边缘化,它观测到的路标点就会产生一个“这些路标应该在哪里”的先验信息,从而影响其余部分的估计值。
      • 如果再边缘化这些路标点,那么它们的观测者将得到一个“观测它们的关键帧应该在哪里”的先验信息。
      • p(x_1,...x_4,y_1,...y_6)=p(x2,...,x_4,y_1,...y_6|x_1)\underbrace{p(x_1)},然后舍去被边缘化部分的信息。
    •  滑动窗口法比较适合VO系统,而不适合大规模建图系统。
    • g2o和 ceres还未直接支持滑动窗口法中的边缘化操作,这里只讲理论部分。

2、位姿图

2.1 位姿图的意义

  • 根据前面的讨论,我们发现特征点在优化问题中占据了绝大部分,实际上,经过若干次观测之后,收敛的特征点位置变换很小,发散的外点则已被剔除。因此更倾向于在优化几次之后就把特征点固定住,只把它们看做位姿估计的约束,不在实际地优化它们的位置估计。
  • 因此,完全可以构建一个只有轨迹的图优化,而位姿节点之间的边,可以由两个关键点之间通过特征匹配后的得到的运动估计来给定初始值,之后不再优化那些路标点的位置,只关心所有相机位姿之间的联系。如此,省去大量特征点优化的计算,只保留关键帧的估计,从而构建位姿图(Pose Graph)。
  • 如果我们有额外测量Pose的传感器,那么位姿图也是一种常见的融合Pose测量的方法。

2.2 位姿图的优化

  • 位姿图优化的节点表示相机位姿,边是两个位姿节点之间相对运动的估计,该估计可以来自于特征点法或直接法,也可以来自GPS或IMU积分。
  • 假设我们估计了T_iT_j之间的一个运动\Delta T_{ij}。该运动表达可以是:\Delta \xi_{ij}=\xi^{-1}\circ \xi_j=ln(T_i^{-1}T_j)^{\vee},或按李群的写法:T_{ij}=T_i^{-1}T_j
  • 上述等式不会精确成立,因此我们设立最小二乘误差,讨论误差关于优化变量的导数。误差:e_{ij}=\Delta \xi_{ij}ln(T_{ij}^{-1}T_i^{-1}T_j)^{\vee}
  • e_{ij}对两个优化变量\xi_i,\xi_j的导数。\hat{e}_{ij}=e_{ij}+\frac{\partial e_{ij}}{\partial \delta \xi_i}\delta \xi_i+\frac{\partial e_{ij}}{\partial \delta \xi_j}\delta \xi_j
    • \frac{\partial e_{ij}}{\partial \delta \xi_i}=-J_r^{-1}(e_{ij})Ad(T_j^{-1})
    • \frac{\partial e_{ij}}{\partial \delta \xi_i}=J_r^{-1}(e_{ij})Ad(T_j^{-1})
    •  若误差接近0,左右雅可比可以近似为II+\frac{1}{2}\begin{bmatrix} \phi _e^{\wedge} & \rho _e^{\wedge}\\ 0 & \phi _e^{\wedge} \end{bmatrix}
  • 雅可比求导后,剩下就和普通图优化一样了。
  • 综上,所有位姿顶点和位姿-位姿边构成一个图优化,本质上是一个最小二乘问题,优化变量为各个顶点的位姿,边来自于位姿观测约束。记\varepsilon为所有边集合,则总体目标函数min\frac{1}{2}\sum_{i,j\in \varepsilon }^{}e_{ij}^T\sum_{ij}^{-1} e_{ij}。可以用高斯牛顿法或列文伯格-马夸尔特方法求解此问题。

3、实践:位姿图优化

3.1 g2o原生位姿图

g2o_viewer 在g2o/bin下未找到,未安装成功。安装libqglviewer-dev-qt5 后,重新安装g2o解决。参考以下文档
E: 软件包 libqglviewer-dev 没有可安装候选解决方法-CSDN博客

3.2 李代数上的位姿图优化

Sophus表达李代数,用到g2o中定义顶点和边。

运行代码时,误差大于书中描述误差,暂未查出具体原因?

3.3 小结

  • PTAM(Parallel Tracking and Mapping)提出以来,人们意识到后端优化没必要实时响应前端的图像数据,人们倾向于把前端后端分开,运行于两个独立线程之中,称为跟踪和建图。前端需要实时响应视频的速度,而优化不必,只要在优化完成时把结果返回前端即可。所有通常不会对后端提出很高的速度要求。

相关文章:

第10讲 后端2

主要目标:理解滑动窗口法、位姿图优化、带IMU紧耦合的优化、掌握g2o位姿图。 第9讲介绍了以为BA为主的图优化。BA能精确优化每个相机位姿与特征点位置。不过在更大的场景中,大量特征点的存在会严重降低计算效率,导致计算量越来越大&#xff0…...

统计学习方法与实战——统计学习方法概论

统计学习方法概论 文章目录 统计学习方法概论前言章节目录导读 实现统计学习方法的步骤统计学习方法三要素模型模型是什么? 策略损失函数与风险函数常用损失函数ERM与SRM 算法 模型评估与模型选择过拟合与模型选择 正则化与交叉验证泛化能力生成模型与判别模型生成方法判别方法…...

人体红外传感器简介

人体红外传感器的工作原理是利用热释电效应,将人体发出的特定波长的红外线转化为电信号,从而实现对人体的检测和感知。 具体来说,人体红外传感器主要由滤光片、热释电探测元和前置放大器组成。滤光片的作用是使特定波长的红外辐…...

【JAVA入门】Day35 - 方法引用

【JAVA入门】Day35 - 方法引用 文章目录 【JAVA入门】Day35 - 方法引用一、方法引用的分类1.引用静态方法2.引用成员方法2.1 引用其他类的成员方法2.2 引用本类和父类的成员方法2.3 引用构造方法2.4 使用类名引用成员方法2.5 引用数组的构造方法 二、方法引用的例题 方法引用就…...

集合及映射

1、集合类图 1)ArrayList与LinkedList 区别 LinkedList 实现了双向队列的接口,对于数据的插入速度较快,只需要修改前后的指向即可;ArrayList对于特定位置插入数据,需要移动特定位置后面的数据,有额外开销 …...

软考基础知识之计算机网络

目录 前言 网络架构与协议 网络互联模型 1、OSI/RM 各层的功能 2、TCP/IP 结构模型 常见的网络协议 1、应用层协议 2、传输层协议 3、网络层协议 IPv6 前言 从古代的驿站、 八百里快马, 到近代的电报、 电话, 人类对于通信的追求从未间断&…...

云手机怎样简化海外社媒平台运营

随着越来越多的卖家希望拓展海外市场,运营TikTok、Facebook等社交媒体平台已经成为吸引流量和促进销售的重要手段。然而,在管理海外社媒账号的过程中,许多人会面临网络连接的问题。这时,使用一款高效便捷的云手机工具就显得尤为便…...

创业者必读!选择拍卖源码还是自建开发,哪种方案更安全?

在当今数字化时代,拍卖平台作为一种独特的电子商务模式,正逐渐成为人们关注的焦点。随着互联网技术的发展,网络安全问题变得越来越突出。如何保障用户数据安全,防止信息泄露及攻击事件的发生,已经成为拍卖软件开发者面…...

Spring Cloud Gateway整合基于STOMP协议的WebSocket实战及遇到问题解决

本实例介绍了Spring Cloud Gateway整合基于STOMP协议的WebSocket的实现。开发了聊天功能,和用户在线状态。解决了协议gateway整合websocket出现的问题 技术点 Spring Cloud GatewayNacosWebSocketSTOMPWebSocket与STOMP协议详解 1. WebSocket WebSocket 是一种通信协议,提…...

软考高级:系统架构设计师——软件架构设计 Chapter 笔记

软考高级:系统架构设计师——软件架构设计 1 软件架构设计—基本概念架构所处的位置架构发展历程架构的“41”视图例题 架构描述语言(ADL)例题 2软件架构设计—架构风格数据流风格调用/返回 风格独立构件风格虚拟机风格仓库风格(以…...

PageHelper组件 实现前端分页查询功能

Hi~!这里是一颗小谷粒,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~💥💥个人主页:一颗小谷粒💥💥所属专栏:Web前端开发 💥💥博主…...

线性回归与逻辑回归在模型参数优化上的比较

概述 线性回归和逻辑回归是两种基础且广泛应用的预测模型。尽管它们在很多方面有相似之处,如都使用梯度下降算法来优化模型参数,但在优化目标和方法上存在一些关键差异。本文将探讨这两种模型在参数优化上的差异,并提供相应的代码示例。 线…...

JavaWeb JavaScript 10.日程管理 第一期

自我消耗,敏感是我, 明媚是我, 我横跳在不同的情绪中 —— 24.8.31 一、登录页及校验 1.校验账号格式 // 校验账号格式function checkUsername(){// 定义正则表达式表示字符串规则var usernameReg /^[a-zA-Z0-9]{5,10}$/;// 获取用户名输入…...

redis为什么快

春内存访问,相比数据库访问磁盘要快单线程,避免上下文切换带来的cpu开销渐进式Rehash。减少阻塞网络模型多路复用,reactor模型 常用基本数据类型 5个基本数据类型2个高级数据结构(bitmaps、hyperlog) redis高级功能…...

十分钟学会Kubernetes(K8S) 部署SpringBoot3.0

1、十分钟学会Kubernetes(K8S) 部署SpringBoot3.0 本课程以 Java 后端开发的视角,带着大家从零基础入门 k8s 实战,掌握企业级容器化管理平台的各种实战应用,以及 Prometheus 监控告警、ELK 日志收集、DevOps 等众多实战课程内容,大…...

顺序表的插入与删除

一.插入&#xff1a;插入前先移动后面的元素 1.图解&#xff1a; 在b和d之间插入c&#xff0c;此时就需要把d&#xff0c;e&#xff0c;f都向后移一位&#xff0c;腾出一个位置后插入c。 2.代码实现&#xff1a; #include<stdio.h> #define MaxSize 10 //定义最大长度…...

FFMPEG -- 音频开发

1&#xff1a;前言 在进行音频开发之前需要先知道一些基础知识&#xff0c;一些有必要的指导的概念。 1.1 声音的产生、获取和转换 声音的产生的本质是靠震动&#xff0c;声音的传播需要借助媒介&#xff0c;比如空气、液体、固体等媒介。在自然界中声音的可视化为音波的形式&…...

lxml官方入门教程(The lxml.etree Tutorial)翻译

lxml官方入门教程&#xff08;The lxml.etree Tutorial&#xff09;翻译 说明&#xff1a; 首次发表日期&#xff1a;2024-09-05官方教程链接&#xff1a; https://lxml.de/tutorial.html使用KIMI和豆包机翻水平有限&#xff0c;如有错误请不吝指出 这是一个关于使用lxml.et…...

string详解

Golang详解string 文章目录 Golang详解stringGolang中为什么string是只读的&#xff1f;stirng和[]byte的转化原理[]byte转string一定需要内存拷贝吗&#xff1f;字符串拼接性能测试 Golang中为什么string是只读的&#xff1f; 在Go语言中&#xff0c;string其实就是一个结构体…...

基于约束大于规范的想法,封装缓存组件

架构&#xff1f;何谓架构&#xff1f;好像并没有一个准确的概念。以前我觉得架构就是搭出一套完美的框架&#xff0c;可以让其他开发人员减少不必要的代码开发量&#xff1b;可以完美地实现高内聚低耦合的准则;可以尽可能地实现用最少的硬件资源&#xff0c;实现最高的程序效率…...

超短脉冲激光自聚焦效应

前言与目录 强激光引起自聚焦效应机理 超短脉冲激光在脆性材料内部加工时引起的自聚焦效应&#xff0c;这是一种非线性光学现象&#xff0c;主要涉及光学克尔效应和材料的非线性光学特性。 自聚焦效应可以产生局部的强光场&#xff0c;对材料产生非线性响应&#xff0c;可能…...

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

在实际项目中,用户注册、登录、修改密码等操作,都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输,在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...

抖音增长新引擎:品融电商,一站式全案代运营领跑者

抖音增长新引擎&#xff1a;品融电商&#xff0c;一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中&#xff0c;品牌如何破浪前行&#xff1f;自建团队成本高、效果难控&#xff1b;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

微服务商城-商品微服务

数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...

uniapp微信小程序视频实时流+pc端预览方案

方案类型技术实现是否免费优点缺点适用场景延迟范围开发复杂度​WebSocket图片帧​定时拍照Base64传输✅ 完全免费无需服务器 纯前端实现高延迟高流量 帧率极低个人demo测试 超低频监控500ms-2s⭐⭐​RTMP推流​TRTC/即构SDK推流❌ 付费方案 &#xff08;部分有免费额度&#x…...

AI书签管理工具开发全记录(十九):嵌入资源处理

1.前言 &#x1f4dd; 在上一篇文章中&#xff0c;我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源&#xff0c;方便后续将资源打包到一个可执行文件中。 2.embed介绍 &#x1f3af; Go 1.16 引入了革命性的 embed 包&#xff0c;彻底改变了静态资源管理的…...

C++.OpenGL (20/64)混合(Blending)

混合(Blending) 透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...

基于Springboot+Vue的办公管理系统

角色&#xff1a; 管理员、员工 技术&#xff1a; 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能&#xff1a; 该办公管理系统是一个综合性的企业内部管理平台&#xff0c;旨在提升企业运营效率和员工管理水…...

破解路内监管盲区:免布线低位视频桩重塑停车管理新标准

城市路内停车管理常因行道树遮挡、高位设备盲区等问题&#xff0c;导致车牌识别率低、逃费率高&#xff0c;传统模式在复杂路段束手无策。免布线低位视频桩凭借超低视角部署与智能算法&#xff0c;正成为破局关键。该设备安装于车位侧方0.5-0.7米高度&#xff0c;直接规避树枝遮…...

MySQL的pymysql操作

本章是MySQL的最后一章&#xff0c;MySQL到此完结&#xff0c;下一站Hadoop&#xff01;&#xff01;&#xff01; 这章很简单&#xff0c;完整代码在最后&#xff0c;详细讲解之前python课程里面也有&#xff0c;感兴趣的可以往前找一下 一、查询操作 我们需要打开pycharm …...