自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录
1、引言
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
2.2、数据与技术特性对比
2.3、技术协同:构建全栈研发生态
2.4、应用场景与评估体系
2.5、总结与展望
3、参考文献
1、引言
- 随着自动驾驶技术向全栈化迈进,Motional 团队构建了涵盖 3D感知、2D检测 及 规划决策 的数据集矩阵,为自动驾驶系统提供了从环境感知到行为决策的全链路支持。
- nuScenes:多模态 3D 感知的行业标杆
- nuImages:大规模 2D 图像标注与时空信息拓展
- nuPlan:闭环验证下的长时规划与决策测试平台
三者相辅相成,形成了从单帧理解到长期决策的技术闭环,加速了自动驾驶算法的研发与落地。
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
-
nuScenes – 3D 感知标杆
- 核心任务:在复杂场景中实现多模态(激光雷达、摄像头、雷达融合)的 3D 检测与语义分割
- 数据特点:精选 1000 个场景,提供 23 类物体的 3D 边界框以及点云语义标注
-
nuImages – 2D 视觉的时空扩展
- 核心任务:构建大规模 2D 图像实例分割与视频理解数据集,重点覆盖长尾场景
- 数据特点:
- 93,000 张关键帧图像(涵盖雨雪、夜间等复杂天气条件)
- 超过 80 万实例分割标注及 10 万张语义分割(可行驶区域)
- 每个场景配有前后 13 帧的时序图像(2Hz 采样),支持动态目标分析
-
nuPlan – 规划决策的闭环测试平台
- 核心任务:实现长时轨迹预测与复杂交互决策的闭环验证
- 数据特点:覆盖 1200 小时真实驾驶数据,标注包括四城交通信号及各类挑战性场景,为规划与决策算法提供丰富素材
- 项目地址:GitHub - motional/nuplan-devkit: The devkit of the nuPlan dataset.

2.2、数据与技术特性对比
| 维度 | nuScenes | nuImages | nuPlan |
|---|---|---|---|
| 数据规模 | 1000 场景(约 15 小时) | 93K 张图像(覆盖 500+ 日志) | 1200 小时驾驶数据 |
| 传感器配置 | 6 路摄像头、1 台激光雷达、5 路雷达、IMU/GPS | 6 路摄像头(支持时序图像采集) | 8 路摄像头、5 台激光雷达、IMU/GPS |
| 标注重点 | 3D 边界框、点云语义 | 2D 实例/语义分割及属性标注 | 驾驶轨迹、地图语义、交通灯状态 |
| 场景特性 | 高密度交通场景(每场景 20 秒左右) | 主动筛选长尾场景(雨雪、夜间等复杂条件) | 自然驾驶场景(涵盖常规与极端情况) |
| 地理覆盖 | 波士顿、新加坡 | 波士顿、新加坡(附带扩展日志) | 波士顿、匹兹堡、拉斯维加斯、新加坡 |
2.3、技术协同:构建全栈研发生态
-
感知层互补
- 2D-3D 融合预训练:利用 nuImages 丰富的实例分割标注,提升 nuScenes 3D 检测模型的泛化能力
- 时序信息融合:nuImages 提供的 13 帧时序数据有助于构建视频目标检测算法,与 nuScenes 的 2Hz 标注形成优势互补
-
规划层赋能
- 场景泛化素材:nuImages 中覆盖的长尾场景(如夜间行人)可为 nuPlan 提供极端情况测试数据
- 仿真环境输入:通过 nuImages 语义分割结果,构建更真实的仿真场景,提升 nuPlan 中规划算法的鲁棒性
-
工具链整合
- 统一数据格式:三大数据集采用相似的关系型数据库结构,有效降低多任务协同开发的门槛
- 可视化协同:结合 nuScenes 的 WebGL 查看器与 nuPlan 的 nuBoard,实现 2D/3D 数据的联动分析
2.4、应用场景与评估体系
-
nuScenes – 3D 感知核心验证平台
- 主要任务:
- 多模态 3D 目标检测(车辆、行人等)
- 点云语义分割(涵盖 32 类标签)
- 评估指标:mAP(3D 检测)、IoU(分割)、AMOTA(跟踪)
- 主要任务:
-
nuImages – 2D 视觉长尾挑战库
- 主要任务:
- 实例分割(23 类前景目标及可行驶区域)
- 视频目标检测(注重时序一致性)
- 属性识别(如行人姿态、车辆状态)
- 评估指标:COCO 风格 AP(实例分割)、VPQ(视频全景质量)
- 主要任务:
-
nuPlan – 规划决策闭环考场
- 主要任务:
- 无保护左转决策测试
- 密集车流中的切入与交互决策
- 评估体系:碰撞率、乘坐舒适性(加速度/抖动)、规则遵守率等
- 主要任务:
2.5、总结与展望
nuScenes、nuImages 与 nuPlan 构成的“感知-检测-规划”数据三角,为自动驾驶技术研发提供了从环境理解到行为决策的全链路支持。未来的发展方向可能包括:
- 跨模态预训练:通过整合 nuImages 2D 标注,进一步增强 nuScenes 3D 模型的泛化与鲁棒性
- 端到端仿真:借助 nuPlan 的规划场景和 nuImages 的时序数据,实现虚实融合的闭环训练环境
- 开源社区共建:推动三大数据集在开发工具、数据格式及可视化分析方面的深度互通,促进行业生态协同发展
这一数据集矩阵将持续推动自动驾驶系统在复杂场景下的稳定性和泛化能力,为全行业的技术落地提供有力支撑。
3、参考文献
- nuScenes: A multimodal dataset for autonomous driving (CVPR 2020)
- nuImages: A Multimodal Dataset for Robust Scene Understanding (ECCV 2022)
- nuPlan: A closed-loop ML-based planning benchmark (NeurIPS 2021 Workshop)
- nuPlan数据集介绍与快速入门 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台
- nuPlan新SOTA!清华提出Diffusion Planner:扩散模型重塑自动驾驶路径规划(ICLR'25)
相关文章:
自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…...
设计模式 ->模板方法模式(Template Method Pattern)
模板方法模式 模板方法模式是一种行为设计模式,它在一个方法中定义一个操作的算法骨架,而将一些步骤延迟到子类中实现。它允许子类在不改变算法结构的情况下重新定义算法中的某些步骤 特点 算法骨架: 在基类中定义算法的框架延迟实现&…...
DeepSeekMoE 论文解读:混合专家架构的效能革新者
论文链接:DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models 目录 一、引言二、背景知识(一)MoE架构概述(二)现有MoE架构的问题 三、DeepSeekMoE架构详解(一&a…...
机器学习之心的创作纪念日
机缘 今天,是我成为创作者的第1460天。 在这段时间里,获得了很大的成长。 虽然日常忙碌但还在坚持创作、初心还在。 日常 创作已经成为我生活的一部分,尤其是在我的工作中,创作是不可或缺的,创作都是核心能力之一。…...
【python】简单的flask做页面。一组字母组成的所有单词。这里的输入是一组字母,而输出是所有可能得字母组成的单词列表
目录结构如下: https://github.com/kaede316/Pythons_pj.git 效果: 后续可扩展为工具网站: 更新 2025.02.09 1、增加等间距制作人 时间信息 2、增加判断润年的功能...
[权限提升] Linux 提权 维持 — 系统错误配置提权 - Sudo 滥用提权
关注这个专栏的其他相关笔记:[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01:Sudo 滥用提权原理 Sudo 是一个 Linux 系统管理命令,它允许系统管理员授予普通用户以指定身份执行指定命令的权限。该命令不仅减少了 Root 用户的登录时间和管理时…...
【算法】快速排序算法的实现:C 和 C++ 版本
1. 算法简介 快速排序(Quick Sort)是由英国计算机科学家霍尔(C.A.R. Hoare)在1960年提出的一种高效的排序算法。它采用了分治法(Divide and Conquer)策略,通常具有很好的性能。在平均情况下,快速排序的时间复杂度为 O(n log n),但在最坏情况下可能退化为 O(n^2),不过…...
如何修改IDEA的maven远程仓库地址
IDEA自动的maven的远程仓库地址为国外地址,导致下载依赖时很慢,通过如下方法可以将其修改为国内地址 选中模块,右击,创建setting.xml文件 添加阿里仓库地址 <mirrors><mirror><id>nexus-aliyun</id><…...
LLMs之DeepSeek r1:TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略
LLMs之DeepSeek r1:TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略 目录 TinyZero的简介 1、TinyZero的特点 TinyZero的安装和使用方法 1、安装 创建 conda 环境 数据准备 (倒计时任务) 训练执行 单GPU (适用于模型…...
亚博microros小车-原生ubuntu支持系列:23 人脸识别追踪
背景知识: 本节跟上一篇的物体识别追踪类似,换了opencv的函数来做人脸识别 函数定义如下: detectMultiScale(image, scaleFactor, minNeighbors, flags, minSize, maxSize)scaleFactor参数控制每个图像序列的缩放比例。该参数决定了在每个…...
[7] 游戏机项目说明
[7] 游戏机项目说明 在这节课中,我们将学习如何基于FreeRTOS开发一个简单的游戏项目。我们会使用一个开源项目nwatch,它是一个基于STM32的开源手表,包含了三个游戏。我们的目标是将这个游戏移植到我们的开发板上,并逐步使用FreeR…...
Kubernetes之kube-proxy运行机制分析
一、基础知识 1.Kubernetes再创建服务时会为服务分配一个虚拟IP地址,客户端通过这个虚拟Ip地址来访问服务,而服务则负责将请求转发到后端pod上。 2.上述阐述的过程为一个反向代理的过程,但是这个反向代理和普通的反向代理的区别是它的IP地址是…...
微信小程序调用企业微信客户服务插件联通企业微信客服
需求背景:用户在小程序页面点击按钮添加企业微信的客服 相关技术:基于uniapp开发的微信小程序 插件名称:企业微信客户服务插件「联系我」插件 - 文档 - 企业微信开发者中心 仔细阅读文档「联系我」插件 - 文档 - 企业微信开发者中心 以下是我的实例代码 1.首先先小程序管…...
如何解决 javax.xml.crypto.dsig.TransformException: 转换异常问题?亲测有效的解决方法!
1. 问题分析 1.1 异常描述 javax.xml.crypto.dsig.TransformException 是在使用 Java XML 加密和签名 API 时,发生的一个常见异常。它通常出现在 XML 数字签名的转换过程中,可能是由于签名、加密或验证过程中发生了错误。 1.2 异常场景 该异常通常发…...
【AI实践】deepseek支持升级git
当前Windows 11 WSL的git是2.17,Android Studio提示需要升级到2.19版本 网上找到指导文章 安装git 2.19.2 cd /usr/src wget https://www.kernel.org/pub/software/scm/git/git-2.19.2.tar.gz tar xzf git-2.19.2.tar.gz cd git-2.19.2 make prefix/usr/l…...
git 子模块管理(一个仓库中有多个子仓库)
使用 Git 子模块管理 B 和 C 仓库 在A仓库中维护B和C仓库 进入 A 仓库: 添加 B 和 C 作为子模块: git submodule add https://your-repo-url/B.git B-repo git submodule add https://your-repo-url/C.git C-repo git commit -m "Add B and C a…...
Maven 安装配置(完整教程)
文章目录 一、Maven 简介二、下载 Maven三、配置 Maven3.1 配置环境变量3.2 Maven 配置3.3 IDEA 配置 四、结语 一、Maven 简介 Maven 是一个基于项目对象模型(POM)的项目管理和自动化构建工具。它主要服务于 Java 平台,但也支持其他编程语言…...
w196Spring Boot高校教师科研管理系统设计与实现
🙊作者简介:多年一线开发工作经验,原创团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹赠送计算机毕业设计600个选题excel文…...
Flutter初相识
资料 1、中文官网:安装和环境配置 | Flutter 中文文档 - Flutter 中文开发者网站 - Flutter 2、线上编写网站:DartPad 构建第一个Flutter应用 class MyApp extends StatelessWidget {const MyApp({Key? key}) : super(key: key);overrideWidget bui…...
(1/100)每日小游戏平台系列
每日小游戏平台 项目简介以及地址 准备开发一个一百天小游戏平台,使用Flask构建的简单游戏导航网站,无需登录,让大家在返工的同时也可以愉快的摸鱼玩耍。 每天更新一个小游戏上传,看看能不能坚持一百天。 这些小游戏主要使用前端…...
IMX6ULL环境搭建遇到的问题和解答更新
IMX6ULL环境搭建遇到的问题 开发板:正点原子IMX6ULL 终端软件串口控制:MobaXterm 1、网络环境搭建三方互ping不通 电脑无网口,使用绿联USB转网口,接网线直连开发板,电脑WiFi上网 按文档设置的 IP 地址,以…...
具身智能学习规划
具身智能(Embodied Intelligence)强调智能体通过身体与环境的动态交互实现学习和决策,是人工智能、机器人学、认知科学和神经科学交叉的前沿领域。其核心在于打破传统AI的“离身认知”,将智能与物理实体、感知-运动系统紧密结合。…...
kafka生产端之拦截器、分区器、序列化器
文章目录 拦截器序列化器分区器 拦截器 拦截器(Interceptor)是早在Kafka0.10.0.0中就已经引入的一个功能,Kafka一共有两种拦截器:生产者拦截器和消费者拦截器。本节主要讲述生产者拦截器的相关内容,有关消费者拦截器的…...
BFS算法篇——广度优先搜索,探索未知的旅程(上)
文章目录 前言一、BFS的思路二、BFS的C语言实现1. 图的表示2. BFS的实现 三、代码解析四、输出结果五、总结 前言 广度优先搜索(BFS)是一种广泛应用于图论中的算法,常用于寻找最短路径、图的遍历等问题。与深度优先搜索(DFS&…...
FPGA VGA timing
概念 VGA(Video Graphics Array)时序是控制VGA接口显示图像的关键参数,它主要包括行时序和场时序两部分。以下是对VGA时序的详细解释: 一、VGA接口简介 VGA接口是IBM公司在1987年推出的一种使用模拟信号的视频传输标准,具有成本低、结构简单、应用灵活等优点,至今仍被广…...
pytest生成报告no tests ran in 0.01s
除了基本的环境配置、用例名要以test_开头,有个地方是我自己忽略了,在执行时没有指定用例文件,所以没有找到。 if __name__ __main__:pytest.main(["testcases/test_demo.py","-svq", __file__, --alluredir./allure-r…...
Django开发入门 – 0.Django基本介绍
Django开发入门 – 0.Django基本介绍 A Brief Introduction to django By JacksonML 1. Django简介 1) 什么是Django? 依据其官网的一段解释: Django is a high-level Python web framework that encourages rapid development and clean, pragmatic design. …...
数巅科技中标科学城数科集团AI辅助企业数字化转型评估诊断
自2023年以来,财政部和工信部连续发布通知,强调要做好中小企业数字化转型城市试点工作,鼓励试点城市大力支持优质数字化服务商,研发攻关一批“小快轻准”数字化产品和解决方案,助力制造业关键领域的中小企业实现数字化…...
Linux proc虚拟文件系统
文章目录 简介proc常用节点pid节点procfs接口参考 简介 测试环境:Linux dev-PC 5.18.17-amd64-desktop-hwe #20.01.00.10 SMP PREEMPT_DYNAMIC Thu Jun 15 16:17:50 CST 2023 x86_64 GNU/Linux proc虚拟文件系统是linux内核提供的一种让用户和内核内部数据结构进行交…...
idea整合deepseek实现AI辅助编程
1.File->Settings 2.安装插件codegpt 3.注册deepseek开发者账号,DeepSeek开放平台 4.按下图指示创建API KEY 5.回到idea配置api信息,File->Settings->Tools->CodeGPT->Providers->Custom OpenAI API key填写deepseek的api key Chat…...
