Para-Lane: 首个真实世界多车道数据集,目的评估自动驾驶系统中的新型视角合成能力。
2025-02-22,阿里巴巴集团菜鸟自动驾驶实验室和百度研究院共同创建了一个名为 Para-Lane 的真实世界多车道数据集。该数据集目的评估自动驾驶系统中的新型视角合成(NVS)能力,通过提供大量真实世界的数据,弥补了现有合成数据集在真实性方面的不足,为自动驾驶技术的发展和仿真提供了重要支持。
一、研究背景
自动驾驶技术的发展离不开对复杂场景的精确感知和仿真测试。新型视角合成(NVS)技术在自动驾驶系统中扮演着重要角色,它不仅能够帮助训练感知模型,还能生成各种视角的传感器数据,用于闭环仿真。然而,现有的 NVS 数据集大多基于合成场景,缺乏真实世界数据的复杂性和真实性,这限制了 NVS 技术在实际应用中的性能评估和发展。
目前遇到困难和挑战:
真实世界数据采集难度大:在真实世界中,采集多车道数据需要复杂的硬件设备和精确的传感器校准,同时还要面对动态物体、光照变化等挑战。
多传感器数据对齐复杂:自动驾驶系统中涉及多种传感器(如 LiDAR、摄像头等),这些传感器的数据需要精确对齐,但现有的对齐方法在处理多模态数据时存在精度不足的问题。
缺乏真实世界多车道数据集:现有的数据集大多集中在单一路况或合成场景,缺乏真实世界多车道场景的数据,这使得 NVS 技术在跨车道场景下的性能评估变得困难。
数据集地址:Para-Lane|自动驾驶数据集|多传感器数据融合数据集
二、让我们一起来看一下Para-Lane数据集
Para-Lane 是首个真实世界多车道数据集,目的是评估自动驾驶系统中的新型视角合成能力。
Para-Lane 数据集包含 25 组关联序列,涵盖 16,000 张前视图像、64,000 张环视图像和 16,000 帧 LiDAR 数据。所有数据均经过精确标注,区分了动态物体和静态元素。数据集通过多传感器数据对齐,提供了真实世界多车道场景下的精确数据,为自动驾驶仿真和 NVS 技术评估提供了重要资源。
数据集构建:
数据集的构建采用了多阶段姿态优化机制,首先通过 LiDAR 映射构建参考坐标系下的 LiDAR 地图,然后将相机帧注册到 LiDAR 地图中,实现多模态数据的精确对齐。具体步骤包括:
LiDAR 映射:利用 RTK/INS 传感器的初始轨迹,通过离线 LiDAR odometry 和回环闭合优化,构建高精度的 LiDAR 地图。
相机帧注册:将相机帧通过粗初始化和精细优化,注册到 LiDAR 地图中,实现多模态数据的精确对齐。
数据特点:
真实世界数据:数据集来源于真实世界多车道场景,具有高度的真实性和复杂性。
多模态数据对齐:通过多阶段姿态优化,实现了 LiDAR 和相机数据的精确对齐。
精确标注:所有数据均经过精确标注,区分了动态物体和静态元素,方便后续研究和应用。
基准测试:
数据集提供了多种基准测试,包括单车道回归、相邻车道预测、第二相邻车道预测、双车道训练的相邻车道预测和夹层车道预测。基准测试使用了多种评估指标,如峰值信噪比(PSNR)、结构相似性指数(SSIM)和学习感知图像块相似性(LPIPS),以全面评估 NVS 方法的性能。

我们的工作引入了第一个真实世界的多车道数据集,用于评估最近的自动驾驶重建方法的新型视图合成能力。使用三个激光扫描仪、一个前视摄像头和四个环视摄像头的多通道轨迹扫描公共城市道路。通过 LiDAR 映射和多模态 Structure-from-Motion 技术精确对齐逐帧姿势。

我们的数据收集无人车的传感器组件和样本框,右侧鱼眼相机对称安装在左侧鱼眼的对面,后鱼眼位于背面的中心。

LiDAR 映射的定量指标。我们选择对拼接的 LiDAR 框架(以厘米为单位)的 MAE 和 RMSE 进行采样和评估。

LiDAR 地图拼接质量在彩虹中 20 厘米周期性高度斜坡(左列)和 10 厘米 cividis 颜色图中可视化,反映距离与重建网格(右列)。误差图和放大视图都反映出,与初始 RTK 轨迹(第一行)相比,这些改进的 LiDAR 帧姿势(第二行)由于帧姿势更好,实现了更薄的拼接云和更少的悬停噪声点。

姿态估计的定量指标。我们选择重投影误差(以像素为单位)作为常见的 SfM 指标 [31] 来评估相机帧之间的相干性,并选择 NID 损失 [30] 来评估相机帧和 LiDAR 映射之间的相干性。

我们的跨模态姿态优化框架中使用的因素,我们通过将彩色强度图的 alpha 混合到相应的相机帧上来可视化 LiDAR 相机的对准质量。我们建议读者参考我们的补充视频,了解我们的 LiDAR 地图和多相机帧的数据对齐质量。

使用不同泳道组合的 5 个评估轨道,用于训练(蓝色)和测试(红色)。

我们提出的 Para-Lane 数据集上不同高斯重建方法的定量结果。

不同方法和设计之间的 NVS 质量比较,有关更多序列的结果,请参阅我们的补充视频

我们提出的带有动态对象的 Para-Lane 数据集的定量结果。我们在有和没有面罩的情况下进行重建以进行消融研究。

EmerNeRF 和 PVG 在单通道测试中 NVS 质量的比较。
三、让我们一起来看一下Para-Lane 数据集应用场景
自动驾驶仿真中的视角合成测试
比如你正在开发一种新的自动驾驶算法,用于在多车道场景中进行路径规划和障碍物检测。以前,你只能使用合成数据集或单一路况数据集进行测试,这些数据集无法完全模拟真实世界中的复杂情况。然而,有了Para-Lane数据集,研究人员可以利用其真实世界多车道场景的数据,进行以下改进:
1、数据加载与对齐 你可以直接加载Para-Lane数据集中的LiDAR和相机数据,并利用其预对齐的多模态数据进行仿真测试。这避免了手动对齐数据的繁琐过程,节省了大量时间和精力。
2、真实场景下的性能评估 通过在Para-Lane数据集上测试自动驾驶算法,你可以评估算法在真实世界多车道场景中的性能。例如,你可以测试算法在不同车道视角下的障碍物检测能力,以及在复杂光照和动态物体条件下的鲁棒性。
3、优化算法性能 基于Para-Lane数据集的测试结果,你可以发现算法在真实世界场景中的不足之处,并针对性地进行优化。例如,你可以改进算法在处理动态物体时的准确性,或者优化算法在不同车道视角下的路径规划能力。
4、提升仿真测试的泛化能力 Para-Lane数据集的多车道场景和真实世界数据,你能够测试算法在各种复杂场景下的性能。这有助于提升算法的泛化能力,使其在真实驾驶环境中表现更加稳定和可靠。
Para-Lane数据集为自动驾驶仿真测试提供了真实世界多车道场景的丰富资源,极大地改善了自动驾驶算法的测试和优化过程
知识小科普:
新型视角合成(Novel View Synthesis,NVS)能力是指从新的相机角度生成与一组图像合理一致的视图的技术。具体来说,给定源图像及源姿态,以及目标姿态,NVS 能够渲染生成目标姿态对应的图片。这项技术在 3D 重建、增强现实(AR)、虚拟现实(VR)等领域有着广泛的应用。
技术原理:
NVS 的一般步骤包括:
1、三维重建:从已有视角的图像中推断出场景的三维几何信息,包括物体的形状和位置。
2、渲染:利用三维重建的信息,通过渲染技术生成新视角下的图像,考虑光照和纹理等因素
应用场景:
自动驾驶:NVS 可以帮助生成不同视角的传感器数据,用于训练和测试自动驾驶模型,特别是在模拟不同驾驶场景时非常重要。
3D 重建:通过从多个视角生成图像,NVS 可以帮助构建更加完整和精确的 3D 模型。
AR/VR:在增强现实和虚拟现实应用中,NVS 可以生成沉浸式的体验,让用户从不同角度观察虚拟场景。
医学成像:NVS 技术可以用于提高医学成像中的 X 射线新视角合成的效率,减少患者和医生的等待时间,提高诊断效率。
更多开源的数据集,请打开:遇见数据集
遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。遇见数据集,领先的千万级数据集搜索引擎,实时追踪全球数据集,助力把握数据要素市场。
https://www.selectdataset.com/
相关文章:
Para-Lane: 首个真实世界多车道数据集,目的评估自动驾驶系统中的新型视角合成能力。
2025-02-22,阿里巴巴集团菜鸟自动驾驶实验室和百度研究院共同创建了一个名为 Para-Lane 的真实世界多车道数据集。该数据集目的评估自动驾驶系统中的新型视角合成(NVS)能力,通过提供大量真实世界的数据,弥补了现有合成…...
STM32--SPI通信讲解
前言 嘿,小伙伴们!今天咱们来聊聊STM32的SPI通信。SPI(Serial Peripheral Interface)是一种超常用的串行通信协议,特别适合微控制器和各种外设(比如传感器、存储器、显示屏)之间的通信。如果你…...
Maven 基础环境搭建与配置(一)
一、Maven 初印象 在 Java 开发的广袤天地里,Maven 就像是一位神通广大的 “大管家”,为开发者们排忧解难,让项目管理与构建变得轻松高效。它是一个强大的项目管理和构建自动化工具,基于项目对象模型(POM)…...
[算法--前缀和] 一维前缀和
目录 1. 前缀和: 是一种对暴力求解的优化.2. 前缀和? 如何利用前面的计算结果提高效率?3. 如何预处理前缀和数组(如何让处理前缀和数组的复杂度是O(N))?接下来, 我们开启一个新的专题 -> 前缀和, 第一道是模板题, 一维前缀和 1. 前缀和: 是一种对暴力求解的优化. 前缀和…...
大模型基础概念之神经网络宽度
在大模型中,神经网络宽度是提升模型容量的核心手段之一,与深度、数据规模共同构成性能的三大支柱。合理增加宽度可显著增强模型表达能力,但需结合正则化、硬件优化和结构设计进行平衡。未来趋势可能包括动态宽度调整、稀疏化宽度设计(如MoE)以及更高效宽度-深度复合缩放策…...
LeetCode 每日一题 2025/2/17-2025/2/23
记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 2/17 1287. 有序数组中出现次数超过25%的元素2/18 2080. 区间内查询数字的频率2/19 624. 数组列表中的最大距离2/20 2595. 奇偶位数2/21 2209. 用地毯覆盖后的最少白色砖块…...
《零基础学会!如何用 sql+Python 绘制柱状图和折线图,数据可视化一看就懂》
在数据驱动的时代,MySQL 是最常用的关系型数据库管理系统之一,广泛应用于各类数据存储和处理场景。数据分析的过程不仅仅是收集数据,还包括数据的清洗、转换、查询以及最终的报告和可视化。在本文中,我们将通过实际案例来介绍如何…...
【算法系列】归并排序详解
文章目录 归并排序详解1. 基本原理1.1 分治法策略1.2 归并排序步骤1.3 图解示例 2. 时间复杂度与空间复杂度2.1 时间复杂度2.2 空间复杂度 3. 稳定性4. Java 实现示例5. 归并排序的优点与缺点5.1 优点5.2 缺点 6. 总结 归并排序详解 归并排序(Merge Sort࿰…...
Vue的项目创建以及项目目录与组合式API
一.创建Vue 1.Vue-CLI:创建Vue的脚手架工具 2.Create-vue:是Vue官方提供的脚手架之一,底层采用官方自主研发的vite,快捷,开发方便。 3.准备工作:系统中需要安装nodejs环境,在该环境中提供npm包管理器 4.创建Vue项目的命令:npm init vuela…...
ubuntu-server 安装 navidia 显卡驱动
资料 https://juejin.cn/post/7362562720708280332 过程 ubuntu-drivers devices 选择ubuntu-server安装 rootroot:~# ubuntu-drivers devices udevadm hwdb is deprecated. Use systemd-hwdb instead. udevadm hwdb is deprecated. Use systemd-hwdb instead. udevadm hwd…...
【学习笔记】计算机网络(四)
第4章 网络层 文章目录 第4章 网络层4.1 网络层的几个重要概念4.1.1 网络层提供的两种服务虚电路服务(Virtual Circuit Service)数据报服务(Datagram Service) 4.1.2 网络层的两个层面 4.2 网际协议 IP - IPv44.2.1 虚拟互连网络4…...
DeepSeek-R1:通过强化学习激励大语言模型的推理能力
摘要 本文介绍了我们的第一代推理模型,DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是通过大规 模强化学习(RL)训练的模型,在没有使用监督微调(SFT)这个前置步骤的情况下,展示了卓越的推…...
Linux运维——网络管理
Linux网络管理 一、Linux网络应用要点二、命令常见用法2.1、curl2.1.1、发送GET请求2.1.2、发送POST请求2.1.3、设置请求头2.1.4、处理cookies2.1.5、处理重定向2.1.6、调试和详细信息2.1.7、使用代理2.1.8、文件上传2.1.9、其它常用选项2.1.10、综合示例 2.2、wget2.2.1、基本…...
洛谷 P8705:[蓝桥杯 2020 省 B1] 填空题之“试题 E :矩阵” ← 卡特兰数
【题目来源】 https://www.luogu.com.cn/problem/P8705 【题目描述】 把 1∼2020 放在 21010 的矩阵里。要求同一行中右边的比左边大,同一列中下边的比上边的大。一共有多少种方案? 答案很大,你只需要给出方案数除以 2020 的余数即可。 【答案提交】 …...
基于Flink SQL实现7天用户行为风险识别,结合滚动窗口预聚合与CEP复杂事件处理技术,根据用户7天的动作,包括交易,支付,评价等行为,识别用户的风险等级
一、数据建模与预聚合 1. 数据源定义 CREATE TABLE user_actions (user_id STRING,event_time TIMESTAMP(3),action_type STRING, -- 交易/支付/评价amount DOUBLE,status STRING, -- 交易状态(成功/失败)review_score INT, -- 评价分数&#x…...
【无标题】网络安全公钥密码体制
第一节 网络安全 概述 一、基本概念 网络安全通信所需要的基本属性“ 机密性;消息完整性;可访问性与可用性;身份认证。 二、网络安全威胁 窃听;插入;假冒;劫持;拒绝服务Dos和分布式拒绝服务…...
【含开题报告+文档+PPT+源码】基于SpringBoot的进销存管理系统的设计与实现
开题报告 本文提出并研发了一款基于Spring Boot框架构建的进销存管理系统,该系统集成了全方位的企业运营管理功能,涵盖了用户登录验证、系统公告管理、员工信息与权限管理、物料全流程(采购入库、销售出库、退货处理)控制、部门组…...
Linux-SaltStack配置
文章目录 SaltStack配置 🏡作者主页:点击! 🤖Linux专栏:点击! ⏰️创作时间:2025年02月24日20点51分 SaltStack配置 SaltStack 中既支持SSH协议也支持我们的一个客户端 #获取公钥(…...
DeepSeek-OpenSourceWeek-第二天-DeepEP
DeepSeek正在进行“开源周”活动,在第二天推出了DeepEP,这是一个面向混合专家(MoE)模型训练和推理的开源通信库。DeepSeek此前的成果已令人印象深刻,此次开源关键组件,体现了其对透明度、社区合作以及推动AI进步的决心,通过5个代码库(已发布2个)来展示这一承诺。 第一…...
事务的4个特性和4个隔离级别
事务的4个特性和4个隔离级别 1. 什么是事务2. 事务的ACID特性2.1 原子性2.2 一致性2.3 持久性2.4 隔离性 3. 事务的创建4. 事务并发时出现的问题4.1 DIRTY READ 脏读4.2 NON - REPEATABLR READ 不可重复读4.3 PHANTOM READ 幻读 5. 事务的隔离级别5.1 READ UNCOMMITTED 读未提交…...
对计算机中缓存的理解和使用Redis作为缓存
使用Redis作为缓存缓存例子缓存的引入 Redis缓存的实现 使用Redis作为缓存 缓存 什么是缓存,第一次接触这个东西是在考研学习408的时候,计算机组成原理里面学习到Cache缓存,用于降低由于内存和CPU的速度的差异带来的延迟。它是在CPU和内存…...
vue3 下载文件 responseType-blob 或者 a标签
在 Vue 3 中,你可以使用 axios 或 fetch 来下载文件,并将 responseType 设置为 blob 以处理二进制数据。以下是一个使用 axios 的示例: 使用 axios 下载文件 首先,确保你已经安装了 axios: npm install axios然后在你…...
SOME/IP-SD -- 协议英文原文讲解5
前言 SOME/IP协议越来越多的用于汽车电子行业中,关于协议详细完全的中文资料却没有,所以我将结合工作经验并对照英文原版协议做一系列的文章。基本分三大块: 1. SOME/IP协议讲解 2. SOME/IP-SD协议讲解 3. python/C举例调试讲解 5.1.2.5 S…...
lowagie(itext)老版本手绘PDF,包含页码、水印、图片、复选框、复杂行列合并等。
入口类:exportPdf package xcsy.qms.webapi.service;import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObject; import com.alibaba.nacos.common.utils.StringUtils; import com.ibm.icu.text.RuleBasedNumberFormat; import com.lowa…...
MySQL undo log,redo log和bin log日志文件的生成时间点、层级归属、存储位置及生命周期详解
问题: 假如库名叫做A库,表名叫B表,undo log,redo log和bin log,这些日志文件的生成的时间点是什么?是在mysql的哪一层生成的?哪些文件是有buffer的?哪些日志文件是存在磁盘上的?哪些…...
吃一堑长一智
工作中经历,有感触记录下 故事一 以前在一家公司时,自己是一名开发人员,遇到问题请教领导解决方案,当时领导给了建议,后来上线后出问题了,背了锅。心里想的是领导说这样做的呀,为什么出问题还…...
DeepSeek基础之机器学习
文章目录 一、核心概念总结(一)机器学习基本定义(二)基本术语(三)假设空间(四)归纳偏好(五)“没有免费的午餐”定理(NFL 定理) 二、重…...
达梦有没有类似oerr的功能
在oracle 23ai的sqlplus中,直接看异常信息说明: 达梦没有此功能,但是可以造一个 cd /home/dmdba cat >err.sql<<eof set echo off set ver off set timing off set lineshow off set feedback off select * from V\$ERR_INFO wher…...
实战-网安
面试感受:网安公司前端实习 今天我有幸面试了一家网络安全公司的前端开发实习岗位,整个过程让我受益匪浅,也让我对未来的职业发展有了更清晰的认识。 首先,面试官非常专业且友好,整个面试氛围轻松但不失严谨。面试一开始,面试官简单介绍了公司背景和团队文化,让我对公…...
一文掌握Splash的详细使用
文章目录 1. 安装与启动 Splash1.1 使用 Docker 安装1.2 直接安装 2. 基本用法2.1 访问 Splash 界面2.2 使用 Splash 渲染页面2.3 使用 Lua 脚本 3. 高级用法3.1 处理 JavaScript3.2 截图与 PDF3.3 处理 AJAX 请求3.4 设置请求头3.5 处理 Cookies 4. 与 Scrapy 集成4.1 安装 Sc…...
