自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录
1、引言
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
2.2、数据与技术特性对比
2.3、技术协同:构建全栈研发生态
2.4、应用场景与评估体系
2.5、总结与展望
3、参考文献
1、引言
- 随着自动驾驶技术向全栈化迈进,Motional 团队构建了涵盖 3D感知、2D检测 及 规划决策 的数据集矩阵,为自动驾驶系统提供了从环境感知到行为决策的全链路支持。
- nuScenes:多模态 3D 感知的行业标杆
- nuImages:大规模 2D 图像标注与时空信息拓展
- nuPlan:闭环验证下的长时规划与决策测试平台
三者相辅相成,形成了从单帧理解到长期决策的技术闭环,加速了自动驾驶算法的研发与落地。
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
-
nuScenes – 3D 感知标杆
- 核心任务:在复杂场景中实现多模态(激光雷达、摄像头、雷达融合)的 3D 检测与语义分割
- 数据特点:精选 1000 个场景,提供 23 类物体的 3D 边界框以及点云语义标注
-
nuImages – 2D 视觉的时空扩展
- 核心任务:构建大规模 2D 图像实例分割与视频理解数据集,重点覆盖长尾场景
- 数据特点:
- 93,000 张关键帧图像(涵盖雨雪、夜间等复杂天气条件)
- 超过 80 万实例分割标注及 10 万张语义分割(可行驶区域)
- 每个场景配有前后 13 帧的时序图像(2Hz 采样),支持动态目标分析
-
nuPlan – 规划决策的闭环测试平台
- 核心任务:实现长时轨迹预测与复杂交互决策的闭环验证
- 数据特点:覆盖 1200 小时真实驾驶数据,标注包括四城交通信号及各类挑战性场景,为规划与决策算法提供丰富素材
- 项目地址:GitHub - motional/nuplan-devkit: The devkit of the nuPlan dataset.
2.2、数据与技术特性对比
维度 | nuScenes | nuImages | nuPlan |
---|---|---|---|
数据规模 | 1000 场景(约 15 小时) | 93K 张图像(覆盖 500+ 日志) | 1200 小时驾驶数据 |
传感器配置 | 6 路摄像头、1 台激光雷达、5 路雷达、IMU/GPS | 6 路摄像头(支持时序图像采集) | 8 路摄像头、5 台激光雷达、IMU/GPS |
标注重点 | 3D 边界框、点云语义 | 2D 实例/语义分割及属性标注 | 驾驶轨迹、地图语义、交通灯状态 |
场景特性 | 高密度交通场景(每场景 20 秒左右) | 主动筛选长尾场景(雨雪、夜间等复杂条件) | 自然驾驶场景(涵盖常规与极端情况) |
地理覆盖 | 波士顿、新加坡 | 波士顿、新加坡(附带扩展日志) | 波士顿、匹兹堡、拉斯维加斯、新加坡 |
2.3、技术协同:构建全栈研发生态
-
感知层互补
- 2D-3D 融合预训练:利用 nuImages 丰富的实例分割标注,提升 nuScenes 3D 检测模型的泛化能力
- 时序信息融合:nuImages 提供的 13 帧时序数据有助于构建视频目标检测算法,与 nuScenes 的 2Hz 标注形成优势互补
-
规划层赋能
- 场景泛化素材:nuImages 中覆盖的长尾场景(如夜间行人)可为 nuPlan 提供极端情况测试数据
- 仿真环境输入:通过 nuImages 语义分割结果,构建更真实的仿真场景,提升 nuPlan 中规划算法的鲁棒性
-
工具链整合
- 统一数据格式:三大数据集采用相似的关系型数据库结构,有效降低多任务协同开发的门槛
- 可视化协同:结合 nuScenes 的 WebGL 查看器与 nuPlan 的 nuBoard,实现 2D/3D 数据的联动分析
2.4、应用场景与评估体系
-
nuScenes – 3D 感知核心验证平台
- 主要任务:
- 多模态 3D 目标检测(车辆、行人等)
- 点云语义分割(涵盖 32 类标签)
- 评估指标:mAP(3D 检测)、IoU(分割)、AMOTA(跟踪)
- 主要任务:
-
nuImages – 2D 视觉长尾挑战库
- 主要任务:
- 实例分割(23 类前景目标及可行驶区域)
- 视频目标检测(注重时序一致性)
- 属性识别(如行人姿态、车辆状态)
- 评估指标:COCO 风格 AP(实例分割)、VPQ(视频全景质量)
- 主要任务:
-
nuPlan – 规划决策闭环考场
- 主要任务:
- 无保护左转决策测试
- 密集车流中的切入与交互决策
- 评估体系:碰撞率、乘坐舒适性(加速度/抖动)、规则遵守率等
- 主要任务:
2.5、总结与展望
nuScenes、nuImages 与 nuPlan 构成的“感知-检测-规划”数据三角,为自动驾驶技术研发提供了从环境理解到行为决策的全链路支持。未来的发展方向可能包括:
- 跨模态预训练:通过整合 nuImages 2D 标注,进一步增强 nuScenes 3D 模型的泛化与鲁棒性
- 端到端仿真:借助 nuPlan 的规划场景和 nuImages 的时序数据,实现虚实融合的闭环训练环境
- 开源社区共建:推动三大数据集在开发工具、数据格式及可视化分析方面的深度互通,促进行业生态协同发展
这一数据集矩阵将持续推动自动驾驶系统在复杂场景下的稳定性和泛化能力,为全行业的技术落地提供有力支撑。
3、参考文献
- nuScenes: A multimodal dataset for autonomous driving (CVPR 2020)
- nuImages: A Multimodal Dataset for Robust Scene Understanding (ECCV 2022)
- nuPlan: A closed-loop ML-based planning benchmark (NeurIPS 2021 Workshop)
- nuPlan数据集介绍与快速入门 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台
- nuPlan新SOTA!清华提出Diffusion Planner:扩散模型重塑自动驾驶路径规划(ICLR'25)
相关文章:

自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…...
[LUA ERROR] bad light userdata pointer
Cocos2d项目,targetSdkVersion30,在 android 13 设备运行报错: [LUA ERROR] bad light userdata pointer ,导致黑屏。 参考 cocos2dx 适配64位 arm64-v8a 30 lua 提示 bad light userdata pointer 黑屏-CSDN博客的方法 下载最新的Cocos2dx …...
【Java八股】JVM
JVM 1. jvm内存区域分为哪些部分 线程私有的:程序计数器、虚拟机栈、本地方法栈 程序计数器:指示当前线程执行到的字节码文件的行号,是线程切换后保证线程能恢复到正确的执行位置的关键 虚拟机栈:用于存储方法调用的数据&…...
集成学习(一):从理论到实战(附代码)
一、引言 在机器学习领域,打造一个独立、强大的算法是解决问题的关键。然而,集成学习提供了一种不同的视角:通过组合多个“弱”学习器来创建一个更强大的模型。本文探讨集成学习的思想、方法及其应用。 二、机器学习 vs 集成学习思想 传统…...
Netty:高性能网络应用框架的深度解析
引言 Netty 是由 JBoss 提供的一个开源的 Java NIO 客户端/服务器框架,它用以快速开发网络应用程序,如协议服务器和客户端。它的设计目标是提供异步事件驱动的网络应用程序框架,支持高效的网络通信和数据处理。Netty 在性能、可扩展性、安全…...

神经网络常见激活函数 3-ReLU函数(修正线性单元)
文章目录 ReLU函数求导函数和导函数图像优缺点pytorch 中的 ReLU 函数tensorflow 中的ReLU函数 ReLU 修正线性单元 (Rectified Linear Unit) 函数求导 ReLU函数 ReLU max ( 0 , x ) { x x ≥ 0 0 x < 0 \begin{aligned} \operatorname{ReL…...
Android开发获取缓存,删除缓存
Android开发获取缓存,删除缓存 app设置中往往有清理缓存的功能。会显示当前缓存时多少,然后可以点击清理缓存 直接上代码: object CacheHelper {/*** 获取缓存大小* param context* return* throws Exception*/JvmStaticfun getTotalCache…...

如何通过PHP接入DeepSeek的API
想知道如何通过PHP接入DeepSeek的API。看起来他对之前的Python步骤比较熟悉,但这次想用PHP实现。 首先,我需要回顾一下DeepSeek API的文档,确认它支持哪些方法和参数。假设用户已经配置了环境变量,比如API密钥,接下来…...

一种基于Leaflet.Legend的图例动态更新方法
目录 前言 一、场景再现 1、需求描述 2、核心方法介绍 3、存在的问题 二、问题解决 1、重复解决办法 2、图例不展示解决办法 3、成果展示 三、总结 前言 在当今数字化时代,地理信息系统(GIS)技术已经广泛应用于各个领域,…...
Spring Boot: 使用 @Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ
Spring Boot: 使用 Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ 在微服务架构中,确保消息的可靠性和一致性非常重要,尤其是在涉及到分布式事务的场景中。本文将演示如何使用 Spring Boot 的事务机制和 TransactionSynchron…...
LQB(2)-python-枚举
前言 python中的枚举一般有两个说法,一个是枚举算法(暴力求解法,算法层面),一个是遍历使用enumerate()函数或者enum模块创建()。 暴力求解法在之前的博文里面讲过了👇,…...

MongoDB开发规范
分级名称定义P0核心系统需7*24不间断运行,一旦发生不可用,会直接影响核心业务的连续性,或影响公司名誉、品牌、集团战略、营销计划等,可能会造成P0-P2级事故发生。P1次核心系统这些系统降级或不可用,会间接影响用户使用…...
为什么DeepSeek服务器繁忙?
致敬DeepSeek 用户层面 用户数量激增:DeepSeek 免费且功能强大,对普通用户和开发者都极具吸引力124。尤其是在新功能推出、新模型上线或相关热门活动期间,大量用户会在短时间内涌入9。例如春节期间,DeepSeek 的用户量达到四千万7。…...

律所录音证据归集工具:基于PyQt6与多线程的自动化音频管理解决方案
在律所日常工作中,音频证据的整理与归集是一个高频且复杂的任务。面对大量的案件录音文件,如何实现快速且准确的分类与存档,成为了律所提高效率、降低出错率的关键。本文将通过技术角度解析一款名为律所录音证据归集工具的项目,详…...

【含开题报告+文档+PPT+源码】基于SpringBoot+Vue旅游管理网站
开题报告 本论文探讨了一款采用现代Web开发技术构建的台州市旅游综合信息与服务平台的设计与实现。该系统基于SpringBoot框架,以其轻量级、快速开发和强大的企业级应用支持能力为核心后端技术支撑,结合Vue.js前端框架及ElementUI组件库,为用…...

unity碰撞的监测和监听
1.创建一个地面 2.去资源商店下载一个火焰素材 3.把procedural fire导入到自己的项目包管理器中 4.给magic fire 0 挂在碰撞组件Rigidbody , Sphere Collider 5.创建脚本test 并挂在magic fire 0 脚本代码 using System.Collections; using System.Collections.Generic; usi…...

DeepSeek-R1 32B Windows+docker本地部署
最近国产大模型DeepSeek兴起,本地部署了一套deepseek同时集成Open WebUI界面,给大家出一期教程。 软件:Ollama、docker、Open WebUI 一、用Ollama下载模型 首先我们需要安装Ollama,它可以在本地运行和管理大模型。 到Ollama官网 https://ol…...
C++11新特性之unique_ptr智能指针
本节继续介绍智能指针,不了解的读者可以先阅读——C11新特性之shared_ptr智能指针-CSDN博客 1.介绍 unique_ptr是C11标准提供的另一种智能指针。与shared_ptr不同的是,unique_ptr指针指向的堆内存无法同其他unique_ptr共享,也就是每一片堆内…...

Vue与Konva:解锁Canvas绘图的无限可能
前言 在现代Web开发中,动态、交互式的图形界面已成为提升用户体验的关键要素。Vue.js,作为一款轻量级且高效的前端框架,凭借其响应式数据绑定和组件化开发模式,赢得了众多开发者的青睐。而当Vue.js邂逅Konva.js,两者结…...
python绘图之柱状堆积图的绘制
本节来学习用python来绘制柱状堆积图. 使用的库为matplotlib.pyplot,numpy 代码如下 # 导入必要的库 import matplotlib.pyplot as plt # 用于绘图 import numpy as np # 用于数值计算# 模拟一些数据 x [数值{}.format(i) for i in range(10)] # 创建一个包含10个元素的列…...

wordpress后台更新后 前端没变化的解决方法
使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...

springboot 百货中心供应链管理系统小程序
一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,百货中心供应链管理系统被用户普遍使用,为方…...

大型活动交通拥堵治理的视觉算法应用
大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动(如演唱会、马拉松赛事、高考中考等)期间,城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例,暖城商圈曾因观众集中离场导致周边…...
java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别
UnsatisfiedLinkError 在对接硬件设备中,我们会遇到使用 java 调用 dll文件 的情况,此时大概率出现UnsatisfiedLinkError链接错误,原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用,结果 dll 未实现 JNI 协…...

Cinnamon修改面板小工具图标
Cinnamon开始菜单-CSDN博客 设置模块都是做好的,比GNOME简单得多! 在 applet.js 里增加 const Settings imports.ui.settings;this.settings new Settings.AppletSettings(this, HTYMenusonichy, instance_id); this.settings.bind(menu-icon, menu…...
python如何将word的doc另存为docx
将 DOCX 文件另存为 DOCX 格式(Python 实现) 在 Python 中,你可以使用 python-docx 库来操作 Word 文档。不过需要注意的是,.doc 是旧的 Word 格式,而 .docx 是新的基于 XML 的格式。python-docx 只能处理 .docx 格式…...
【AI学习】三、AI算法中的向量
在人工智能(AI)算法中,向量(Vector)是一种将现实世界中的数据(如图像、文本、音频等)转化为计算机可处理的数值型特征表示的工具。它是连接人类认知(如语义、视觉特征)与…...

莫兰迪高级灰总结计划简约商务通用PPT模版
莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...
es6+和css3新增的特性有哪些
一:ECMAScript 新特性(ES6) ES6 (2015) - 革命性更新 1,记住的方法,从一个方法里面用到了哪些技术 1,let /const块级作用域声明2,**默认参数**:函数参数可以设置默认值。3&#x…...

构建Docker镜像的Dockerfile文件详解
文章目录 前言Dockerfile 案例docker build1. 基本构建2. 指定 Dockerfile 路径3. 设置构建时变量4. 不使用缓存5. 删除中间容器6. 拉取最新基础镜像7. 静默输出完整示例 docker runDockerFile 入门syntax指定构造器FROM基础镜像RUN命令注释COPY复制ENV设置环境变量EXPOSE暴露端…...