基于深度学习的点云三维目标检测方法综述
-
论文标题:基于深度学习的点云三维目标检测方法综述
-
作者:郭毅锋1,2†,吴帝浩1,魏青民1
-
发表日期: 2023 1
-
阅读日期 :2023 11 29
-
研究背景:点云作为一种三维环境数据因其具有较高的精度一直被广泛关注并应用于多种场景任务之中。近年来,深度学习进入点云领域,让点云数据处理得到快速发展。针对基于深度学习的点云三维目标检测任务,首先分析了点云数据的特性并列举了日常任务中常用的点云数据集;随后通过单模态的三维目标检测与多模态的三维目标检测两个方向进行分类阐述,并通过单模态与多模态方法在数据集上的表现作比对;最后对当前点云三维目标检测研究的发展趋势进行展望与总结。
三维目标检测 -
方法和性质:
2.1 单模态数据目标检测方法
2.1.1 基于体素化的三维目标检测
2.1.2 基于原始点云的三维目标检测
2.1.3 基于体素与原始点云混合的点云三维目标检测
2.2 多模态数据融合

-
研究结果:
单模态方法中,基于原始点云的检测方法准确率比基于体素的检测方法要高,因为点云经过体素化的下采样之后不可避免地丢失了点云的特征,而原始点云能保留更多目标的边界信息,所以能更准确地预测三维包围框信息。相对而言,基于点云与体素的混合目标检测方法结合了体素化方法具有较高运算效率和原始点云方法中丰富语义信息的优点,拥有不错的运算效率以及单模态方法中最高的准确率。
图像加点云的多模态数据融合方法在三维目标检测任务中的表现暂时不如基于点云的单模态方法,其中有多方面的原因,如没能合理利用信息、特征融合困难、网络设计难度大等。但随着技术的不断发展,多模态的目标检测算法因为拥有比单模态方法更全面的信息而成为重要的发展方向。 -
创新点:
-
数据:
1.2.1 室外数据集
1)KITTI数据集
2)Waymo数据集
3)ApolloScape数据集
4)Semantic3D
5)KAIST数据集
6)nuScenes数据集
1.2.2 室内数据集
1)SUNRGB-D数据集
2)ShapeNetPart
3)Multisensorialindoormappingandpositioningdataset
4)NYU-Depth
5)ScanNet
6)SUN3D -
结论:
三维目标检测是点云数据应用中非常重要的研究领域之一,具有巨大的研究价值以及发展前景。近年来,由于深度学习融入点云的研究,让基于点云的三维目标检测算法一直处于快速发展阶段。本文首先介绍了点云的数据特点以及常用于研究的数据集;随后从基于单模态与多模态两个方向阐述了点云融合深度学习在三维目标检测任务中的运用;最后对未来点云在三维目标检测方向的发展研究提出展望。 -
挑战:
1.1 三维点云数据特征
1)无序性 点云数据是一组无序的向量集合,其输入的顺序会因设备采集方式、读入数据方式的不同而千差万别。
2)非结构化 与二维图像数据不同,三维点云没有固定的存储结构。
3)稀疏性 现实场景、物体表面形状等方面的差异让点云数据所具有的空间属性不尽相同。
这些手工提取点云特征的方法主要依靠设计者大量实验得到的先验知识,同时缺少了对邻域中点与点之间关系的考虑,因此点云中存在的噪声对分类结果产生较大的影响,鲁棒性并不高。模型过度依赖研究人员手工设计的规则,只能对特定的场景表现出较好的适用性, -
研究展望:
a)多模态数据融合。
b)充分利用点云。
c)自监督学习 -
重要性:
-
写作方法:
相关文章:
基于深度学习的点云三维目标检测方法综述
论文标题:基于深度学习的点云三维目标检测方法综述 作者:郭毅锋1,2†,吴帝浩1,魏青民1 发表日期: 2023 1 阅读日期 :2023 11 29 研究背景&…...
Linux命令中的符号
目录 1 管道符 | 1.1 | grep [要检索的东西] 1.2 echo | tee 2 重定向 2.1 输出重定向覆盖 > 2.2 输出重定向添加 >> 2.3 文件输入重定向 < 2.4 多行文本输入重定向 << 2.5 常用搭配 2.5.1 终端不显示 > /dev/null 1 管道符 | 我们…...
BTCPay Server:免费、安全、开源的比特币支付处理器 | 开源日报 No.90
MunGell/awesome-for-beginners Stars: 58.0k License: NOASSERTION 这个项目是一个收集开源项目的列表,旨在帮助初学者找到可以贡献代码的机会。该列表按编程语言分类,并列出了每个项目以及其标签 (如 “good-first-issue”、“beginner” 等)。主要功…...
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第三次作业
Written Part 1. 基于表 1 1 1 回答下列问题(min_sup40%, min_conf75%): Transaction IDItems Bought0001{a, d, e}0024{a, b, c, e}0012{a, b, d, e}0031{a, c, d, e}0015{b, c, e}0022{b, d, e}0029{c, d}0040{a, b, c}0033{a, d, e}0038…...
Windows挂载NFS
ubuntu开启nfs 安装 sudo apt install nfs-kernel-server编辑 /etc/exports /data/share *(rw,no_root_squash)重启服务 sudo systemctl restart nfs-server.service验证 showmount -e localhostwindows连接NFS 选择控制面板 > 程序 > 启用或关闭 Windows 功能 添加…...
数据结构第五课 -----二叉树的代码实现
作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 🎂 作者介绍: 🎂🎂 🎂 🎉🎉🎉…...
优橙内推北京专场——5G网络优化(中高级)工程师
可加入就业QQ群:801549240 联系老师内推简历投递邮箱:hrictyc.com 内推公司1:西安长河通讯有限责任公司 内推公司2:北京电旗通讯技术股份有限公司 内推公司3:润建股份有限公司 西安长河通讯有限责任公司 西安长河…...
Mysql DDL语句建表及空字符串查询出0问题
DDL语句建表 语法: create table 指定要建立库的库名.新建表名 (... 新建表的字段以及类型等 ...)comment 表的作用注释 charset 表编译格式 row_format DYNAMIC create table dev_dxtiot.sys_url_permission (id integer …...
深入ArkTS:应用状态管理与LocalStorage装饰器详解【鸿蒙专栏-11】
文章目录 ArkTS 应用状态管理详解LocalStorage: 页面级 UI 状态存储使用规则概述:装饰器详解:限制条件:使用场景:1. 应用逻辑使用 LocalStorage2. 从 UI 内部使用 LocalStorageArkTS 应用状态管理进阶LocalStorage 装饰器详解1. @LocalStorageProp2. @LocalStorageLink观察…...
管理Android12系统的WLAN热点
大家好!我是编码小哥,欢迎关注,持续分享更多实用的编程经验和开发技巧,共同进步。 要创建一个APK管理Android 12系统的WLAN热点,你需要遵循以下步骤: 1. 获取必要的权限和API访问权限。在AndroidManifest.xml文件中添加以下权限: ```xml <uses-permission android:…...
从0开始学习JavaScript--JavaScript 中 `let` 和 `const` 的区别及最佳实践
在JavaScript中,let 和 const 是两个用于声明变量的关键字。尽管它们看起来很相似,但它们之间有一些重要的区别。本篇博客将深入探讨 let 和 const 的用法、区别,并提供一些最佳实践,以确保在代码中正确使用它们。 let 和 const …...
【上海大学数字逻辑实验报告】二、组合电路(一)
一、 实验目的 熟悉TTL异或门构成逻辑电路的基本方式;熟悉组合电路的分析方法,测试组合逻辑电路的功能;掌握构造半加器和全加器的逻辑测试;学习使用可编程逻辑器件的开发工具 Quartus II设计电路。 二、 实验原理 异或门是数字…...
lodash中foreach踩坑
什么是lodash Lodash 是一个 JavaScript 实用工具库,提供了很多用于处理数据、简化开发等方面的功能。它提供了一组常用的工具函数,用于处理数组、对象、字符串等常见数据结构,同时也包含了一些函数式编程的工具。对于前端开发来说ÿ…...
Unity C++交互
一、设置Dll输出。 两种方式: 第一:直接创建动态链接库工程第二:创建的是可执行程序,在visual studio,右键项目->属性(由exe改成dll) 二、生成Dll 根据选项Release或Debug,运行完上面的生成解决方案后…...
人工智能-优化算法之动量法
对于嘈杂的梯度,我们在选择学习率需要格外谨慎。 如果衰减速度太快,收敛就会停滞。 相反,如果太宽松,我们可能无法收敛到最优解。 泄漏平均值 小批量随机梯度下降作为加速计算的手段。 它也有很好的副作用,即平均梯度…...
【MySQL】InnoDB中的索引
目录标题 索引底层的数据结构:B树B树与B树的区别InnoDB与MyISAM在B树使用索引结构的不同? 聚簇索引非聚簇索引联合索引 B树索引适用的条件查询全值匹配匹配左边的列匹配列前缀匹配范围的值精确匹配某一列并范围匹配另外一列避免使用隐式转换 排序必须按照…...
《软件工程原理与实践》复习总结与习题——软件工程
软件生命周期 软件生命周期分为三个时期、八个阶段 软件定义时期: 1)问题定义阶段:要解决什么问题 2)可行性研究阶段:确定软件开发可行 3)需求分析阶段:系统做什么 软件开发时期:…...
软工2021上下午第六题(组合模式)
阅读下列说明和Java代码,将应填入(n)处的字句写在答题纸的对应栏内。 【说明】 层叠菜单是窗口风格的软件系统中经常采用的一种系统功能组织方式。层叠菜单中包含的可能是一个菜单项(直接对应某个功能),也可…...
在Spring Boot中使用不同的日志
前言,本篇就是介绍在Java中使用相关的日志,适合初学者看,如果对这篇不感兴趣的可以移步了,本篇主要围绕我们Java中的几种日志类型,也说不上有多深入,算的上浅入浅出吧,如果你有一段时间的开发经…...
运维知识点-openResty
openResty 企业级实战——畅购商城SpringCloud-网站首页高可用解决方案-openRestynginxlua——实现广告缓存测试企业级实战——畅购商城SpringCloud-网站首页高可用解决方案-openRestynginxlua——OpenResty 企业级实战——畅购商城SpringCloud-网站首页高可用解决方案-openRes…...
BGE-Large-Zh效果可视化:向量维度投影图+相似度分布直方图双模展示
BGE-Large-Zh效果可视化:向量维度投影图相似度分布直方图双模展示 1. 项目概述 BGE-Large-Zh是一款专为中文语义理解设计的本地化向量化工具,基于BAAI的bge-large-zh-v1.5模型开发。这个工具能够将中文文本转换为1024维的语义向量,并通过计…...
3步解锁百度网盘SVIP特权:macOS用户必备的高速下载解决方案
3步解锁百度网盘SVIP特权:macOS用户必备的高速下载解决方案 【免费下载链接】BaiduNetdiskPlugin-macOS For macOS.百度网盘 破解SVIP、下载速度限制~ 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduNetdiskPlugin-macOS 还在为百度网盘Mac客户端的龟速…...
SystemVerilog断言(SVA)避坑指南:从‘能用’到‘好用’,我踩过的那些Glue Logic和变量延时坑
SystemVerilog断言进阶实战:破解Glue Logic与动态延时的工程困局 当你的SVA断言从实验室demo走向真实芯片验证时,总会遇到这样的时刻:精心编写的断言在仿真中突然失效,或是让仿真速度下降了30%,又或是变成团队里没人敢…...
专业术语统计报告_多种能源发电协同发展管控模型及大数据分析研究
专业术语统计报告_多种能源发电协同发展管控模型及大数据分析研究 一、概要简析 【概要分析】 本文档《多种能源发电协同发展管控模型及大数据分析研究》围绕研究主题展开系统性的探讨。文档总字符数达141569,其中中文字符80856个,英文字词5332个&#x…...
CSS如何利用--marker旋转列表图标_通过伪元素调整图标方向与间距
<p>::marker 不能用 transform 旋转,因其非完整 DOM 节点,仅支持 content、color、font-* 和 list-style-type;Chrome/Firefox 忽略 transform 等属性,Firefox 119 仅支持 rotate 新属性且兼容性差;可靠方案是用…...
Nano-Banana模型安全防护:对抗样本检测与防御
Nano-Banana模型安全防护:对抗样本检测与防御 在AI模型日益普及的今天,安全性已成为不可忽视的核心议题。Nano-Banana模型通过引入先进的对抗样本检测与防御机制,在鲁棒性上实现了显著突破,有效提升了模型在复杂环境下的可靠性。…...
基于条件风险价值CVaR的微网/虚拟电厂多场景随机规划 摘要:构建了含风、光、燃、储的微网/虚...
基于条件风险价值CVaR的微网/虚拟电厂多场景随机规划 摘要:构建了含风、光、燃、储的微网/虚拟电厂优化调度模型,在此基础上,考虑多个风光出力场景,构建了微网随机优化调度模型,并在此基础上,基于条件风险价…...
PowerShell-Suite终极指南:10个高级Windows安全工具深度解析
PowerShell-Suite终极指南:10个高级Windows安全工具深度解析 【免费下载链接】PowerShell-Suite My musings with PowerShell 项目地址: https://gitcode.com/gh_mirrors/po/PowerShell-Suite PowerShell-Suite是一个功能强大的Windows安全工具集合ÿ…...
Java中的修饰符,类,接口,多态
最近学了Java中的修饰符,类,接口,多态1.修饰符学了public,默认,protected,private。public是公用的,都能访问。默认的话只能在同类中和同包中调用,而protected则可以在同类中&#x…...
GLM-4.1V-9B-Base部署指南:模型权重校验+SHA256完整性验证流程
GLM-4.1V-9B-Base部署指南:模型权重校验SHA256完整性验证流程 1. 模型简介 GLM-4.1V-9B-Base是智谱开源的视觉多模态理解模型,支持以下核心功能: 图像内容识别与描述场景理解与分析目标检测与问答中文视觉理解任务 该模型采用9B参数规模&…...
