SLAIM:一个实时的RGB-D NeRF-SLAM系统

SLAIM:一个实时的RGB-D NeRF-SLAM系统与现有的NeRF-SLAM系统相比,我们的方法在跟踪性能上始终表现出更强的竞争力。我们的方法采用体积密度表示,并引入了一种新的KL正则化器在射线终止分布上,将场景几何限制为空隙空间和不透明表面。
https://mp.weixin.qq.com/s/YzUdxIIvgebqpszaL1okLA
01 引言
尽管最近的NeRF-SLAM系统在跟踪和3D重建方面取得了进展,但它们的跟踪性能通常仍然不如传统的SLAM系统。一些最近的工作通过使用高斯金字塔滤波器来平滑输入信号,从而扩大了优化损失函数的吸引域,以避免陷入局部最小值。
本文提出了一种名为SLAIM的基于神经辐射场(NeRF)的鲁棒稠密实时RGB-D SLAM系统,该系统能够在线进行跟踪和建图。作者指出,现有的NeRF-SLAM系统在跟踪性能上通常不如传统的SLAM系统。为了解决这个问题,作者提出了一种新的基于NeRF的粗细粒度跟踪和建图方法。

02 方法
作者提出了一个基于高斯金字塔滤波的粗细粒度跟踪和建图方法。他们首先在重建的图像和真实图像上都应用了高斯金字塔滤波器,以在早期迭代中有效平滑输入信号,从而扩大优化损失函数的吸引域,避免陷入局部最小值。然后,他们通过在多个金字塔层上采样像素,并计算对应的颜色和深度值,来限制NeRF像素重建的范围。

2.1 NeRF pre-requisites
该节介绍了NeRF的预先要求,包括:
· 使用多分辨率哈希网格表示场景几何,并使用两个浅层MLP解码器来估计给定3D输入位置的颜色和密度。
· 定义了射线终止分布,并通过采样方法将其近似为高斯分布。
![]()
![]()
· 渲染颜色和深度像素时,使用alpha合成沿射线的值。
· 场景被限制在单位立方体内,并且使用固定步长进行均匀采样。

2.2 Depth Supervision
该节介绍了使用深度监督的重要性。使用直接对深度值进行回归的方法可能会导致在只有有限视角的区域出现重构错误。因此,作者提出了一种新的方法,通过在射线终止分布上应用KL正则化,使其成为单峰分布,并将其中心对准深度测量。

2.3 Coarse-to-fine Tracking and Mapping
该节提出了一种基于高斯金字塔滤波的粗细粒度跟踪和建图方法。使用高斯金字塔滤波器平滑输入信号,以在早期迭代中扩大优化损失函数的吸引域,避免陷入局部最小值。在重建图像和真实图像上都应用了高斯金字塔滤波器。
· 高斯金字塔滤波:作者在重建的图像和真实图像上都应用了高斯金字塔滤波器,以在早期迭代中有效平滑输入信号,从而扩大优化损失函数的吸引域,避免陷入局部最小值。具体来说,作者在重建图像上使用了卷积滤波器,在真实图像上使用了中值滤波器。
· 像素采样:作者在多个金字塔层上采样像素,并计算对应的颜色和深度值,来限制NeRF像素重建的范围。这个采样范围对应于原始图像的某一感受野。
· 粗细粒度跟踪和建图:作者将这种粗细粒度的策略应用于跟踪和建图过程中。在跟踪过程中,作者首先在粗粒度图像上进行局部束调整,然后在细粒度图像上进行全局束调整,以获得最佳的跟踪和重建结果。在建图过程中,作者首先在粗粒度图像上进行局部优化,然后在细粒度图像上进行全局优化。

03 实验
作者在多个数据集(ScanNet, TUM, Replica)上进行了实验,结果表明,与仅使用粗粒度或细粒度的方法相比,这种联合使用可以获得更好的跟踪和重建性能。



04 结论
本论文介绍SLAIM,一个鲁棒的实时的RGB-D NeRF-SLAM系统,能够在实时中进行在线跟踪和建图。与现有的NeRF-SLAM系统相比,我们的方法在跟踪性能上始终表现出更强的竞争力。我们的方法采用体积密度表示,并引入了一种新的KL正则化器在射线终止分布上,将场景几何限制为空隙空间和不透明表面。我们的解决方案实现了局部和全局束调整,以产生一个稳健(粗细粒度)和准确(KL正则化)的SLAM解决方案。
我们在多个数据集(ScanNet, TUM, Replica)上进行了实验,结果显示,在跟踪和重建准确性方面,我们的方法取得了最先进的结果。我们的方法是第一个在跟踪和3D重建方面同时达到最先进水平的NeRF-SLAM系统。
相关文章:
SLAIM:一个实时的RGB-D NeRF-SLAM系统
SLAIM:一个实时的RGB-D NeRF-SLAM系统与现有的NeRF-SLAM系统相比,我们的方法在跟踪性能上始终表现出更强的竞争力。我们的方法采用体积密度表示,并引入了一种新的KL正则化器在射线终止分布上,将场景几何限制为空隙空间和不透明表面…...
PWN入门之Stack Overflow
Stack Overflow是一种程序的运行时(runtime)错误,中文翻译过来叫做“栈溢出”。栈溢出原理是指程序向栈中的某个变量中写入的字节数超过了这个变量本身所申请的字节数,导致与其相邻的栈中的变量值被改变。 在本篇文章中ÿ…...
QT:label标签/进度条的使用
文章目录 设置不同格式的文本显示图片文本对齐/自动换行/缩进/边距LCDNumber倒计时 ProgressBar进度条 设置不同格式的文本 在文本格式中,存在富文本,makedown格式的文本,还有纯文本,下面就依据这三个进行举例 #include "w…...
网络初始化配置
IPADDR192.168.23.10 #新的ip地址,ip的网段要与nat模式下的网段一致 NETMASK255.255.255.0 #子网掩码 GATEWAY192.168.23.2 #网关 DNS1114.114.114.114 #域名解析:配置为国内114.114.114.114,国外8.8.8.8 ONBOOTtrue 启动时该网卡…...
在Ubuntu上搭建并通过systemctl管理Minecraft Java版服务器
本教程将详细介绍如何在Ubuntu操作系统上搭建一个Minecraft Java版服务器,并使用systemctl服务来管理服务器的启动、停止和重启。同时,我们还将探讨如何通过NGINX设置TCP/UDP转发,使得玩家能够通过域名方便地连接到你的Minecraft服务器。 准…...
【C++PCL】点云处理ESF描述符
作者:迅卓科技 简介:本人从事过多项点云项目,并且负责的项目均已得到好评! 公众号:迅卓科技,一个可以让您可以学习点云的好地方 重点:每个模块都有参数如何调试的讲解,即调试某个参数对结果的影响是什么,大家有问题可以评论哈,如果文章有错误的地方,欢迎来指出错误的…...
鸿蒙应用开发系列 篇二:鸿蒙系统开发工具与环境
文章目录 系列文章硬件与软件需求DevEco Studio扩展工具与框架开发资源系列文章 鸿蒙应用开发系列 篇一:鸿蒙系统概述 鸿蒙应用开发系列 篇二:鸿蒙系统开发工具与环境 (系列计划预告) 鸿蒙系统UI/UX设计 鸿蒙系统应用开发基础 鸿蒙系统高级开发技术 鸿蒙系统特色功能开发 …...
“A”分心得:我的云计算HCIE学习之路
大家好,我是誉天云计算HCIE周末班梁同学,在誉天老师和同学们的帮助下,我终于在4月24日顺利通过了云计算3.0 HCIE的认证考试,而且获得了A,这是让我特别惊喜的,功夫不负有心人。 我日常的工作是网络运维&…...
现代信号处理8_递归的最小二乘(CSDN_20240505)
递归的最小二乘大约出现在50年前。递归,就是在已经算出的结果的基础下,当新的数据到来时,不需要再对数据进行一次完整的运算,而是在已有结果的基础上做一些简单的调整,就能得到新的结果。使用递归的好处: …...
2024年全国保密宣传教育月的主题是()。A.贯彻落实保密法。你我都是护密人B.国家利益高于一切,保密责任重于泰山C.筑牢保密防线,维护国家安全
2024年全国保密宣传教育月的主题是()。点击查看答案 A.贯彻落实保密法。你我都是护密人B.国家利益高于一切,保密责任重于泰山 C.筑牢保密防线,维护国家安全D.共筑保密防线,公民人人有责 坚持不懈开展保密宣传教育,是保密工作实…...
一个通过照片识别地理位置的应用
一个通过照片识别地理位置的应用 引言 最近发现一个能根据照片进行地理位置判定的应用,在全球范围内能够非常准确地进行空间位置识别。我分3个尺度进行了测试,分别是城市街景(来源google和腾讯街景)、野外街景和我自己拍摄的照片…...
wordpress外贸独立站建站10要10不要
创建一个成功的WordPress外贸独立站需要注意很多因素。以下是zhanyes根据多年建站经验总结的wordpress外贸独立站建站的10个建议和10个避免的事项,以帮助您建立一个高质量的外贸网站: 10个要: 1. 要选择合适的域名:确保您的域名…...
搬运5款小众,无广告,实用性拉满的软件
你是否喜欢一些小众且无广告的软件?如果是的话,我这边有一些给你推荐的。 1.屏幕录制——OBS Studio OBS Studio是一款广泛使用的实时流媒体和屏幕录制软件,适用于Windows、MacOS、Linux平台。它采用C、C和Qt编写,提供高质…...
TCP重传,滑动窗口,流量控制,拥塞控制
TCP重传,滑动窗口,流量控制,拥塞控制 TCP重传机制: 超时重传快速重传SACKD-SACK 通过序列号与确认应答判断是否要重传 超时重传: 超过指定时间没有收到确认应答报文,就会重发该数据 触发超时重传的情况…...
云手机对出海企业有什么帮助?
近些年,越来越多的企业开始向海外拓展,意图发掘更广阔的市场。在这过程中,云手机作为一个新型工具为很多企业提供了助力,尤其在解决海外市场拓展过程中的诸多挑战方面发挥着作用。 首先,云手机的出现解决了企业在海外拓…...
Android Studio实现简单的自定义钟表
项目目录 一、项目概述二、开发环境三、详细设计3.1、尺寸设置3.2、绘制表盘和指针3.3、动态效果 四、运行演示五、总结展望六、源码获取 一、项目概述 在安卓开发中,当系统自带的View已经无法满足项目需求时,就要自定义View。在Android中是没有与钟表有…...
C语言 举例说明循环嵌套
今天 我们来说循环的嵌套 如果一个循环体内 又包含了另一个循环结构 我们称之为循环的嵌套 我们之前学的 While do-while for 都可以进行相互的嵌套 如下图 在 While 循环语句中再嵌套一个 While 循环语句 do-while 中嵌套 do-while for中嵌套 for 例如 我们做一个九九乘法…...
一、ESP32基础知识
1、乐鑫产品线 系列特点ESP8266无ESP32无ESP32-S2无ESP32-C3无ESP32-S3无ESP32-C2/ESP8684无ESP32-C6无ESP32-H2无 2、开发方式 2.1、ESP-IDF (1)面向专业开发者。乐鑫官方开发框架,专门为ESP32系列芯片设计。支持C/C语言,并提供一套完整的API&#…...
我希望未来10年,人工智能可以帮我解决这4件小事
生活在一线大城市的我,现在几乎整天被大数据、人工智能、机器学习、智慧生活的词汇环绕立体包围着,让我时刻感觉到,再过10年,我们五一假期真的可以摆脱现在擦肩接踵的旅游盛况了。但我其实要求倒是没这么高,我真心希望…...
使用jdbc方式操作ClickHouse
1、创建测试表,和插入测试数据 create table t_order01(id UInt32,sku_id String,total_amount Decimal(16,2),create_time Datetime ) engine MergeTreepartition by toYYYYMMDD(create_time)primary key (id)order by (id,sku_id);insert into t_order01 values …...
基于LangChain与本地LLM构建私有化知识库问答系统实践
1. 项目概述:从零构建一个垂直领域的知识库与问答系统最近在整理个人技术资料时,我遇到了一个非常典型的问题:手头积累了大量来自不同渠道的电子书、技术文档、知乎专栏文章以及各种开源项目的README,内容虽然优质,但过…...
AI记忆库CoPaw-Memory:向量检索与结构化存储融合实践
1. 项目概述:当AI学会“记笔记”,一个开源记忆库的诞生最近在折腾AI应用开发的朋友,可能都遇到过同一个痛点:如何让AI记住我们说过的话?无论是构建一个长期陪伴的聊天机器人,还是开发一个能理解复杂上下文的…...
从PCB布线到外壳开孔:一个智能硬件产品的EMC设计避坑全记录
从PCB布线到外壳开孔:一个智能硬件产品的EMC设计避坑全记录 在智能硬件产品的研发过程中,电磁兼容性(EMC)设计往往是决定产品能否顺利通过认证测试的关键因素。作为一名经历过多次EMC整改的硬件工程师,我想通过一个真实…...
AS5600磁编码器与STM32的闭环步进电机控制(硬件设计+软件滤波+减速比处理)
1. AS5600磁编码器与STM32的闭环控制方案设计 第一次接触AS5600磁编码器时,我被它12位分辨率、非接触式测量的特性吸引。相比传统光电编码器,这个指甲盖大小的芯片能直接输出数字信号,特别适合集成到步进电机系统中。当时为了给实验室的3D打印…...
颠覆性英雄联盟智能助手:如何用League Akari告别繁琐操作,专注游戏核心
颠覆性英雄联盟智能助手:如何用League Akari告别繁琐操作,专注游戏核心 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit …...
跨设备可用!北大提出UniMM-HAR数据集:补齐毫米波雷达人体运动分析实用短板!
点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【顶会/顶刊】投稿交流群添加微信号:CVer2233,小助手拉你进群!扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶…...
AI智能体通信基站:统一HTTP请求管理,提升开发效率与稳定性
1. 项目概述:一个为AI智能体构建的“通信基站”如果你正在开发一个AI智能体(Agent),并且需要让它与各种外部服务(比如OpenAI、Anthropic的Claude,或者任何自定义的HTTP API)进行对话,…...
Adobe-GenP 3.0:解锁Adobe全家桶功能的5分钟终极指南 [特殊字符]
Adobe-GenP 3.0:解锁Adobe全家桶功能的5分钟终极指南 🚀 【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP Adobe-GenP 3.0是一款强大的Adobe C…...
BilibiliDown实战指南:3大核心功能深度解析与高效下载方案
BilibiliDown实战指南:3大核心功能深度解析与高效下载方案 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirro…...
ARM CoreSight调试架构中的ROM表解析与应用
1. ARM CoreSight调试架构中的ROM表解析在嵌入式系统调试领域,ARM CoreSight架构已经成为事实上的行业标准。作为该架构的核心组件,ROM表(ROM Table)扮演着系统调试资源的"导航地图"角色。想象一下,当你面对…...
