自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录
1、引言
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
2.2、数据与技术特性对比
2.3、技术协同:构建全栈研发生态
2.4、应用场景与评估体系
2.5、总结与展望
3、参考文献
1、引言
- 随着自动驾驶技术向全栈化迈进,Motional 团队构建了涵盖 3D感知、2D检测 及 规划决策 的数据集矩阵,为自动驾驶系统提供了从环境感知到行为决策的全链路支持。
- nuScenes:多模态 3D 感知的行业标杆
- nuImages:大规模 2D 图像标注与时空信息拓展
- nuPlan:闭环验证下的长时规划与决策测试平台
三者相辅相成,形成了从单帧理解到长期决策的技术闭环,加速了自动驾驶算法的研发与落地。
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
-
nuScenes – 3D 感知标杆
- 核心任务:在复杂场景中实现多模态(激光雷达、摄像头、雷达融合)的 3D 检测与语义分割
- 数据特点:精选 1000 个场景,提供 23 类物体的 3D 边界框以及点云语义标注
-
nuImages – 2D 视觉的时空扩展
- 核心任务:构建大规模 2D 图像实例分割与视频理解数据集,重点覆盖长尾场景
- 数据特点:
- 93,000 张关键帧图像(涵盖雨雪、夜间等复杂天气条件)
- 超过 80 万实例分割标注及 10 万张语义分割(可行驶区域)
- 每个场景配有前后 13 帧的时序图像(2Hz 采样),支持动态目标分析
-
nuPlan – 规划决策的闭环测试平台
- 核心任务:实现长时轨迹预测与复杂交互决策的闭环验证
- 数据特点:覆盖 1200 小时真实驾驶数据,标注包括四城交通信号及各类挑战性场景,为规划与决策算法提供丰富素材
- 项目地址:GitHub - motional/nuplan-devkit: The devkit of the nuPlan dataset.

2.2、数据与技术特性对比
| 维度 | nuScenes | nuImages | nuPlan |
|---|---|---|---|
| 数据规模 | 1000 场景(约 15 小时) | 93K 张图像(覆盖 500+ 日志) | 1200 小时驾驶数据 |
| 传感器配置 | 6 路摄像头、1 台激光雷达、5 路雷达、IMU/GPS | 6 路摄像头(支持时序图像采集) | 8 路摄像头、5 台激光雷达、IMU/GPS |
| 标注重点 | 3D 边界框、点云语义 | 2D 实例/语义分割及属性标注 | 驾驶轨迹、地图语义、交通灯状态 |
| 场景特性 | 高密度交通场景(每场景 20 秒左右) | 主动筛选长尾场景(雨雪、夜间等复杂条件) | 自然驾驶场景(涵盖常规与极端情况) |
| 地理覆盖 | 波士顿、新加坡 | 波士顿、新加坡(附带扩展日志) | 波士顿、匹兹堡、拉斯维加斯、新加坡 |
2.3、技术协同:构建全栈研发生态
-
感知层互补
- 2D-3D 融合预训练:利用 nuImages 丰富的实例分割标注,提升 nuScenes 3D 检测模型的泛化能力
- 时序信息融合:nuImages 提供的 13 帧时序数据有助于构建视频目标检测算法,与 nuScenes 的 2Hz 标注形成优势互补
-
规划层赋能
- 场景泛化素材:nuImages 中覆盖的长尾场景(如夜间行人)可为 nuPlan 提供极端情况测试数据
- 仿真环境输入:通过 nuImages 语义分割结果,构建更真实的仿真场景,提升 nuPlan 中规划算法的鲁棒性
-
工具链整合
- 统一数据格式:三大数据集采用相似的关系型数据库结构,有效降低多任务协同开发的门槛
- 可视化协同:结合 nuScenes 的 WebGL 查看器与 nuPlan 的 nuBoard,实现 2D/3D 数据的联动分析
2.4、应用场景与评估体系
-
nuScenes – 3D 感知核心验证平台
- 主要任务:
- 多模态 3D 目标检测(车辆、行人等)
- 点云语义分割(涵盖 32 类标签)
- 评估指标:mAP(3D 检测)、IoU(分割)、AMOTA(跟踪)
- 主要任务:
-
nuImages – 2D 视觉长尾挑战库
- 主要任务:
- 实例分割(23 类前景目标及可行驶区域)
- 视频目标检测(注重时序一致性)
- 属性识别(如行人姿态、车辆状态)
- 评估指标:COCO 风格 AP(实例分割)、VPQ(视频全景质量)
- 主要任务:
-
nuPlan – 规划决策闭环考场
- 主要任务:
- 无保护左转决策测试
- 密集车流中的切入与交互决策
- 评估体系:碰撞率、乘坐舒适性(加速度/抖动)、规则遵守率等
- 主要任务:
2.5、总结与展望
nuScenes、nuImages 与 nuPlan 构成的“感知-检测-规划”数据三角,为自动驾驶技术研发提供了从环境理解到行为决策的全链路支持。未来的发展方向可能包括:
- 跨模态预训练:通过整合 nuImages 2D 标注,进一步增强 nuScenes 3D 模型的泛化与鲁棒性
- 端到端仿真:借助 nuPlan 的规划场景和 nuImages 的时序数据,实现虚实融合的闭环训练环境
- 开源社区共建:推动三大数据集在开发工具、数据格式及可视化分析方面的深度互通,促进行业生态协同发展
这一数据集矩阵将持续推动自动驾驶系统在复杂场景下的稳定性和泛化能力,为全行业的技术落地提供有力支撑。
3、参考文献
- nuScenes: A multimodal dataset for autonomous driving (CVPR 2020)
- nuImages: A Multimodal Dataset for Robust Scene Understanding (ECCV 2022)
- nuPlan: A closed-loop ML-based planning benchmark (NeurIPS 2021 Workshop)
- nuPlan数据集介绍与快速入门 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台
- nuPlan新SOTA!清华提出Diffusion Planner:扩散模型重塑自动驾驶路径规划(ICLR'25)
相关文章:
自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…...
[LUA ERROR] bad light userdata pointer
Cocos2d项目,targetSdkVersion30,在 android 13 设备运行报错: [LUA ERROR] bad light userdata pointer ,导致黑屏。 参考 cocos2dx 适配64位 arm64-v8a 30 lua 提示 bad light userdata pointer 黑屏-CSDN博客的方法 下载最新的Cocos2dx …...
【Java八股】JVM
JVM 1. jvm内存区域分为哪些部分 线程私有的:程序计数器、虚拟机栈、本地方法栈 程序计数器:指示当前线程执行到的字节码文件的行号,是线程切换后保证线程能恢复到正确的执行位置的关键 虚拟机栈:用于存储方法调用的数据&…...
集成学习(一):从理论到实战(附代码)
一、引言 在机器学习领域,打造一个独立、强大的算法是解决问题的关键。然而,集成学习提供了一种不同的视角:通过组合多个“弱”学习器来创建一个更强大的模型。本文探讨集成学习的思想、方法及其应用。 二、机器学习 vs 集成学习思想 传统…...
Netty:高性能网络应用框架的深度解析
引言 Netty 是由 JBoss 提供的一个开源的 Java NIO 客户端/服务器框架,它用以快速开发网络应用程序,如协议服务器和客户端。它的设计目标是提供异步事件驱动的网络应用程序框架,支持高效的网络通信和数据处理。Netty 在性能、可扩展性、安全…...
神经网络常见激活函数 3-ReLU函数(修正线性单元)
文章目录 ReLU函数求导函数和导函数图像优缺点pytorch 中的 ReLU 函数tensorflow 中的ReLU函数 ReLU 修正线性单元 (Rectified Linear Unit) 函数求导 ReLU函数 ReLU max ( 0 , x ) { x x ≥ 0 0 x < 0 \begin{aligned} \operatorname{ReL…...
Android开发获取缓存,删除缓存
Android开发获取缓存,删除缓存 app设置中往往有清理缓存的功能。会显示当前缓存时多少,然后可以点击清理缓存 直接上代码: object CacheHelper {/*** 获取缓存大小* param context* return* throws Exception*/JvmStaticfun getTotalCache…...
如何通过PHP接入DeepSeek的API
想知道如何通过PHP接入DeepSeek的API。看起来他对之前的Python步骤比较熟悉,但这次想用PHP实现。 首先,我需要回顾一下DeepSeek API的文档,确认它支持哪些方法和参数。假设用户已经配置了环境变量,比如API密钥,接下来…...
一种基于Leaflet.Legend的图例动态更新方法
目录 前言 一、场景再现 1、需求描述 2、核心方法介绍 3、存在的问题 二、问题解决 1、重复解决办法 2、图例不展示解决办法 3、成果展示 三、总结 前言 在当今数字化时代,地理信息系统(GIS)技术已经广泛应用于各个领域,…...
Spring Boot: 使用 @Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ
Spring Boot: 使用 Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ 在微服务架构中,确保消息的可靠性和一致性非常重要,尤其是在涉及到分布式事务的场景中。本文将演示如何使用 Spring Boot 的事务机制和 TransactionSynchron…...
LQB(2)-python-枚举
前言 python中的枚举一般有两个说法,一个是枚举算法(暴力求解法,算法层面),一个是遍历使用enumerate()函数或者enum模块创建()。 暴力求解法在之前的博文里面讲过了👇,…...
MongoDB开发规范
分级名称定义P0核心系统需7*24不间断运行,一旦发生不可用,会直接影响核心业务的连续性,或影响公司名誉、品牌、集团战略、营销计划等,可能会造成P0-P2级事故发生。P1次核心系统这些系统降级或不可用,会间接影响用户使用…...
为什么DeepSeek服务器繁忙?
致敬DeepSeek 用户层面 用户数量激增:DeepSeek 免费且功能强大,对普通用户和开发者都极具吸引力124。尤其是在新功能推出、新模型上线或相关热门活动期间,大量用户会在短时间内涌入9。例如春节期间,DeepSeek 的用户量达到四千万7。…...
律所录音证据归集工具:基于PyQt6与多线程的自动化音频管理解决方案
在律所日常工作中,音频证据的整理与归集是一个高频且复杂的任务。面对大量的案件录音文件,如何实现快速且准确的分类与存档,成为了律所提高效率、降低出错率的关键。本文将通过技术角度解析一款名为律所录音证据归集工具的项目,详…...
【含开题报告+文档+PPT+源码】基于SpringBoot+Vue旅游管理网站
开题报告 本论文探讨了一款采用现代Web开发技术构建的台州市旅游综合信息与服务平台的设计与实现。该系统基于SpringBoot框架,以其轻量级、快速开发和强大的企业级应用支持能力为核心后端技术支撑,结合Vue.js前端框架及ElementUI组件库,为用…...
unity碰撞的监测和监听
1.创建一个地面 2.去资源商店下载一个火焰素材 3.把procedural fire导入到自己的项目包管理器中 4.给magic fire 0 挂在碰撞组件Rigidbody , Sphere Collider 5.创建脚本test 并挂在magic fire 0 脚本代码 using System.Collections; using System.Collections.Generic; usi…...
DeepSeek-R1 32B Windows+docker本地部署
最近国产大模型DeepSeek兴起,本地部署了一套deepseek同时集成Open WebUI界面,给大家出一期教程。 软件:Ollama、docker、Open WebUI 一、用Ollama下载模型 首先我们需要安装Ollama,它可以在本地运行和管理大模型。 到Ollama官网 https://ol…...
C++11新特性之unique_ptr智能指针
本节继续介绍智能指针,不了解的读者可以先阅读——C11新特性之shared_ptr智能指针-CSDN博客 1.介绍 unique_ptr是C11标准提供的另一种智能指针。与shared_ptr不同的是,unique_ptr指针指向的堆内存无法同其他unique_ptr共享,也就是每一片堆内…...
Vue与Konva:解锁Canvas绘图的无限可能
前言 在现代Web开发中,动态、交互式的图形界面已成为提升用户体验的关键要素。Vue.js,作为一款轻量级且高效的前端框架,凭借其响应式数据绑定和组件化开发模式,赢得了众多开发者的青睐。而当Vue.js邂逅Konva.js,两者结…...
python绘图之柱状堆积图的绘制
本节来学习用python来绘制柱状堆积图. 使用的库为matplotlib.pyplot,numpy 代码如下 # 导入必要的库 import matplotlib.pyplot as plt # 用于绘图 import numpy as np # 用于数值计算# 模拟一些数据 x [数值{}.format(i) for i in range(10)] # 创建一个包含10个元素的列…...
为什么说程序 = 算法 + 数据结构
什么是程序?理解了算法和数据结构是什么,我们就能更清晰地定义程序:程序是算法和数据结构在特定编程语言中的具体实现。它是一系列指令的集合,这些指令精确地描述了如何操作(算法)特定组织的数据࿰…...
OpenClaw技能商店:分享自定义nanobot模块开发经验
OpenClaw技能商店:分享自定义nanobot模块开发经验 1. 为什么需要自定义技能模块 去年夏天,当我第一次接触OpenClaw时,就被它的自动化能力所吸引。但很快我发现,官方提供的标准技能虽然强大,却无法完全满足我的个性化…...
Cosmos-Reason1-7B参数详解:上下文长度4096对长时序视频理解的实际价值
Cosmos-Reason1-7B参数详解:上下文长度4096对长时序视频理解的实际价值 1. 模型概述 Cosmos-Reason1-7B是NVIDIA开源的一款7B参数量的多模态物理推理视觉语言模型(VLM),作为Cosmos世界基础模型平台的核心组件,专注于物理理解与思维链(CoT)推…...
别再折腾了!Ubuntu 24.04 下用 TeX Live + VSCode 写论文,这份配置清单直接抄
Ubuntu 24.04 TeX Live VSCode:学术写作终极配置指南 如果你正在为毕业论文的格式调整而抓狂,或是厌倦了在不同教程间来回切换却始终无法解决中文乱码问题,那么这份指南就是为你准备的。作为一名在Linux环境下完成过三篇学术论文的老手&am…...
3个步骤解决老旧系统Python支持难题:Windows 7及以上系统兼容性解决方案
3个步骤解决老旧系统Python支持难题:Windows 7及以上系统兼容性解决方案 【免费下载链接】PythonVista Python 3.9 installers that support Windows 7 SP1 and Windows Server 2008 R2 项目地址: https://gitcode.com/gh_mirrors/py/PythonVista 在企业办公…...
Qwen2.5-7B-Instruct入门指南:7B模型对输入token长度的鲁棒性压力测试
Qwen2.5-7B-Instruct入门指南:7B模型对输入token长度的鲁棒性压力测试 1. 项目概述 Qwen2.5-7B-Instruct是阿里通义千问系列的旗舰级大模型,相比1.5B和3B轻量版本,7B参数规模带来了质的飞跃。这个模型在逻辑推理、长文本创作、复杂代码编写…...
Qwen3-Reranker-0.6B实战:一键部署,轻松提升企业知识库检索准确率
Qwen3-Reranker-0.6B实战:一键部署,轻松提升企业知识库检索准确率 1. 为什么企业需要专业级重排序技术? 在当今信息爆炸的时代,企业知识库的规模正以惊人的速度增长。传统的关键词匹配检索方式已经无法满足精准获取知识的需求。…...
C++ STL 容器内存管理机制
C STL容器内存管理探秘 在C开发中,STL(标准模板库)容器是高效数据处理的基石,其背后的内存管理机制直接影响程序性能与资源利用率。理解容器如何动态分配、释放内存,不仅能避免内存泄漏和碎片化问题,还能优…...
从游戏设计到算法实现:拆解睿抗CAIP编程赛‘游戏设计师’一题的BFS+离线查询思路
从游戏设计到算法实现:拆解睿抗CAIP编程赛‘游戏设计师’一题的BFS离线查询思路 在游戏开发中,角色移动和状态转换是最基础也最核心的机制之一。睿抗机器人开发者大赛CAIP编程技能赛的"游戏设计师"一题,巧妙地将这些游戏开发中的实…...
nlp_structbert_siamese-uninlu_chinese-base镜像免配置优势:自动检测CUDA/cuDNN版本并提示降级建议
nlp_structbert_siamese-uninlu_chinese-base镜像免配置优势:自动检测CUDA/cuDNN版本并提示降级建议 你是不是也遇到过这种头疼事?好不容易找到一个好用的AI模型,兴致勃勃地准备部署,结果一运行就报错——CUDA版本不匹配、cuDNN找…...
