自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录
1、引言
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
2.2、数据与技术特性对比
2.3、技术协同:构建全栈研发生态
2.4、应用场景与评估体系
2.5、总结与展望
3、参考文献
1、引言
- 随着自动驾驶技术向全栈化迈进,Motional 团队构建了涵盖 3D感知、2D检测 及 规划决策 的数据集矩阵,为自动驾驶系统提供了从环境感知到行为决策的全链路支持。
- nuScenes:多模态 3D 感知的行业标杆
- nuImages:大规模 2D 图像标注与时空信息拓展
- nuPlan:闭环验证下的长时规划与决策测试平台
三者相辅相成,形成了从单帧理解到长期决策的技术闭环,加速了自动驾驶算法的研发与落地。
2、主要内容
2.1、定位对比:感知与规划的全维覆盖
-
nuScenes – 3D 感知标杆
- 核心任务:在复杂场景中实现多模态(激光雷达、摄像头、雷达融合)的 3D 检测与语义分割
- 数据特点:精选 1000 个场景,提供 23 类物体的 3D 边界框以及点云语义标注
-
nuImages – 2D 视觉的时空扩展
- 核心任务:构建大规模 2D 图像实例分割与视频理解数据集,重点覆盖长尾场景
- 数据特点:
- 93,000 张关键帧图像(涵盖雨雪、夜间等复杂天气条件)
- 超过 80 万实例分割标注及 10 万张语义分割(可行驶区域)
- 每个场景配有前后 13 帧的时序图像(2Hz 采样),支持动态目标分析
-
nuPlan – 规划决策的闭环测试平台
- 核心任务:实现长时轨迹预测与复杂交互决策的闭环验证
- 数据特点:覆盖 1200 小时真实驾驶数据,标注包括四城交通信号及各类挑战性场景,为规划与决策算法提供丰富素材
- 项目地址:GitHub - motional/nuplan-devkit: The devkit of the nuPlan dataset.

2.2、数据与技术特性对比
| 维度 | nuScenes | nuImages | nuPlan |
|---|---|---|---|
| 数据规模 | 1000 场景(约 15 小时) | 93K 张图像(覆盖 500+ 日志) | 1200 小时驾驶数据 |
| 传感器配置 | 6 路摄像头、1 台激光雷达、5 路雷达、IMU/GPS | 6 路摄像头(支持时序图像采集) | 8 路摄像头、5 台激光雷达、IMU/GPS |
| 标注重点 | 3D 边界框、点云语义 | 2D 实例/语义分割及属性标注 | 驾驶轨迹、地图语义、交通灯状态 |
| 场景特性 | 高密度交通场景(每场景 20 秒左右) | 主动筛选长尾场景(雨雪、夜间等复杂条件) | 自然驾驶场景(涵盖常规与极端情况) |
| 地理覆盖 | 波士顿、新加坡 | 波士顿、新加坡(附带扩展日志) | 波士顿、匹兹堡、拉斯维加斯、新加坡 |
2.3、技术协同:构建全栈研发生态
-
感知层互补
- 2D-3D 融合预训练:利用 nuImages 丰富的实例分割标注,提升 nuScenes 3D 检测模型的泛化能力
- 时序信息融合:nuImages 提供的 13 帧时序数据有助于构建视频目标检测算法,与 nuScenes 的 2Hz 标注形成优势互补
-
规划层赋能
- 场景泛化素材:nuImages 中覆盖的长尾场景(如夜间行人)可为 nuPlan 提供极端情况测试数据
- 仿真环境输入:通过 nuImages 语义分割结果,构建更真实的仿真场景,提升 nuPlan 中规划算法的鲁棒性
-
工具链整合
- 统一数据格式:三大数据集采用相似的关系型数据库结构,有效降低多任务协同开发的门槛
- 可视化协同:结合 nuScenes 的 WebGL 查看器与 nuPlan 的 nuBoard,实现 2D/3D 数据的联动分析
2.4、应用场景与评估体系
-
nuScenes – 3D 感知核心验证平台
- 主要任务:
- 多模态 3D 目标检测(车辆、行人等)
- 点云语义分割(涵盖 32 类标签)
- 评估指标:mAP(3D 检测)、IoU(分割)、AMOTA(跟踪)
- 主要任务:
-
nuImages – 2D 视觉长尾挑战库
- 主要任务:
- 实例分割(23 类前景目标及可行驶区域)
- 视频目标检测(注重时序一致性)
- 属性识别(如行人姿态、车辆状态)
- 评估指标:COCO 风格 AP(实例分割)、VPQ(视频全景质量)
- 主要任务:
-
nuPlan – 规划决策闭环考场
- 主要任务:
- 无保护左转决策测试
- 密集车流中的切入与交互决策
- 评估体系:碰撞率、乘坐舒适性(加速度/抖动)、规则遵守率等
- 主要任务:
2.5、总结与展望
nuScenes、nuImages 与 nuPlan 构成的“感知-检测-规划”数据三角,为自动驾驶技术研发提供了从环境理解到行为决策的全链路支持。未来的发展方向可能包括:
- 跨模态预训练:通过整合 nuImages 2D 标注,进一步增强 nuScenes 3D 模型的泛化与鲁棒性
- 端到端仿真:借助 nuPlan 的规划场景和 nuImages 的时序数据,实现虚实融合的闭环训练环境
- 开源社区共建:推动三大数据集在开发工具、数据格式及可视化分析方面的深度互通,促进行业生态协同发展
这一数据集矩阵将持续推动自动驾驶系统在复杂场景下的稳定性和泛化能力,为全行业的技术落地提供有力支撑。
3、参考文献
- nuScenes: A multimodal dataset for autonomous driving (CVPR 2020)
- nuImages: A Multimodal Dataset for Robust Scene Understanding (ECCV 2022)
- nuPlan: A closed-loop ML-based planning benchmark (NeurIPS 2021 Workshop)
- nuPlan数据集介绍与快速入门 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台
- nuPlan新SOTA!清华提出Diffusion Planner:扩散模型重塑自动驾驶路径规划(ICLR'25)
相关文章:
自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…...
[LUA ERROR] bad light userdata pointer
Cocos2d项目,targetSdkVersion30,在 android 13 设备运行报错: [LUA ERROR] bad light userdata pointer ,导致黑屏。 参考 cocos2dx 适配64位 arm64-v8a 30 lua 提示 bad light userdata pointer 黑屏-CSDN博客的方法 下载最新的Cocos2dx …...
【Java八股】JVM
JVM 1. jvm内存区域分为哪些部分 线程私有的:程序计数器、虚拟机栈、本地方法栈 程序计数器:指示当前线程执行到的字节码文件的行号,是线程切换后保证线程能恢复到正确的执行位置的关键 虚拟机栈:用于存储方法调用的数据&…...
集成学习(一):从理论到实战(附代码)
一、引言 在机器学习领域,打造一个独立、强大的算法是解决问题的关键。然而,集成学习提供了一种不同的视角:通过组合多个“弱”学习器来创建一个更强大的模型。本文探讨集成学习的思想、方法及其应用。 二、机器学习 vs 集成学习思想 传统…...
Netty:高性能网络应用框架的深度解析
引言 Netty 是由 JBoss 提供的一个开源的 Java NIO 客户端/服务器框架,它用以快速开发网络应用程序,如协议服务器和客户端。它的设计目标是提供异步事件驱动的网络应用程序框架,支持高效的网络通信和数据处理。Netty 在性能、可扩展性、安全…...
神经网络常见激活函数 3-ReLU函数(修正线性单元)
文章目录 ReLU函数求导函数和导函数图像优缺点pytorch 中的 ReLU 函数tensorflow 中的ReLU函数 ReLU 修正线性单元 (Rectified Linear Unit) 函数求导 ReLU函数 ReLU max ( 0 , x ) { x x ≥ 0 0 x < 0 \begin{aligned} \operatorname{ReL…...
Android开发获取缓存,删除缓存
Android开发获取缓存,删除缓存 app设置中往往有清理缓存的功能。会显示当前缓存时多少,然后可以点击清理缓存 直接上代码: object CacheHelper {/*** 获取缓存大小* param context* return* throws Exception*/JvmStaticfun getTotalCache…...
如何通过PHP接入DeepSeek的API
想知道如何通过PHP接入DeepSeek的API。看起来他对之前的Python步骤比较熟悉,但这次想用PHP实现。 首先,我需要回顾一下DeepSeek API的文档,确认它支持哪些方法和参数。假设用户已经配置了环境变量,比如API密钥,接下来…...
一种基于Leaflet.Legend的图例动态更新方法
目录 前言 一、场景再现 1、需求描述 2、核心方法介绍 3、存在的问题 二、问题解决 1、重复解决办法 2、图例不展示解决办法 3、成果展示 三、总结 前言 在当今数字化时代,地理信息系统(GIS)技术已经广泛应用于各个领域,…...
Spring Boot: 使用 @Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ
Spring Boot: 使用 Transactional 和 TransactionSynchronization 在事务提交后发送消息到 MQ 在微服务架构中,确保消息的可靠性和一致性非常重要,尤其是在涉及到分布式事务的场景中。本文将演示如何使用 Spring Boot 的事务机制和 TransactionSynchron…...
LQB(2)-python-枚举
前言 python中的枚举一般有两个说法,一个是枚举算法(暴力求解法,算法层面),一个是遍历使用enumerate()函数或者enum模块创建()。 暴力求解法在之前的博文里面讲过了👇,…...
MongoDB开发规范
分级名称定义P0核心系统需7*24不间断运行,一旦发生不可用,会直接影响核心业务的连续性,或影响公司名誉、品牌、集团战略、营销计划等,可能会造成P0-P2级事故发生。P1次核心系统这些系统降级或不可用,会间接影响用户使用…...
为什么DeepSeek服务器繁忙?
致敬DeepSeek 用户层面 用户数量激增:DeepSeek 免费且功能强大,对普通用户和开发者都极具吸引力124。尤其是在新功能推出、新模型上线或相关热门活动期间,大量用户会在短时间内涌入9。例如春节期间,DeepSeek 的用户量达到四千万7。…...
律所录音证据归集工具:基于PyQt6与多线程的自动化音频管理解决方案
在律所日常工作中,音频证据的整理与归集是一个高频且复杂的任务。面对大量的案件录音文件,如何实现快速且准确的分类与存档,成为了律所提高效率、降低出错率的关键。本文将通过技术角度解析一款名为律所录音证据归集工具的项目,详…...
【含开题报告+文档+PPT+源码】基于SpringBoot+Vue旅游管理网站
开题报告 本论文探讨了一款采用现代Web开发技术构建的台州市旅游综合信息与服务平台的设计与实现。该系统基于SpringBoot框架,以其轻量级、快速开发和强大的企业级应用支持能力为核心后端技术支撑,结合Vue.js前端框架及ElementUI组件库,为用…...
unity碰撞的监测和监听
1.创建一个地面 2.去资源商店下载一个火焰素材 3.把procedural fire导入到自己的项目包管理器中 4.给magic fire 0 挂在碰撞组件Rigidbody , Sphere Collider 5.创建脚本test 并挂在magic fire 0 脚本代码 using System.Collections; using System.Collections.Generic; usi…...
DeepSeek-R1 32B Windows+docker本地部署
最近国产大模型DeepSeek兴起,本地部署了一套deepseek同时集成Open WebUI界面,给大家出一期教程。 软件:Ollama、docker、Open WebUI 一、用Ollama下载模型 首先我们需要安装Ollama,它可以在本地运行和管理大模型。 到Ollama官网 https://ol…...
C++11新特性之unique_ptr智能指针
本节继续介绍智能指针,不了解的读者可以先阅读——C11新特性之shared_ptr智能指针-CSDN博客 1.介绍 unique_ptr是C11标准提供的另一种智能指针。与shared_ptr不同的是,unique_ptr指针指向的堆内存无法同其他unique_ptr共享,也就是每一片堆内…...
Vue与Konva:解锁Canvas绘图的无限可能
前言 在现代Web开发中,动态、交互式的图形界面已成为提升用户体验的关键要素。Vue.js,作为一款轻量级且高效的前端框架,凭借其响应式数据绑定和组件化开发模式,赢得了众多开发者的青睐。而当Vue.js邂逅Konva.js,两者结…...
python绘图之柱状堆积图的绘制
本节来学习用python来绘制柱状堆积图. 使用的库为matplotlib.pyplot,numpy 代码如下 # 导入必要的库 import matplotlib.pyplot as plt # 用于绘图 import numpy as np # 用于数值计算# 模拟一些数据 x [数值{}.format(i) for i in range(10)] # 创建一个包含10个元素的列…...
基于算法竞赛的c++编程(28)结构体的进阶应用
结构体的嵌套与复杂数据组织 在C中,结构体可以嵌套使用,形成更复杂的数据结构。例如,可以通过嵌套结构体描述多层级数据关系: struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...
linux 下常用变更-8
1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行,YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID: YW3…...
ElasticSearch搜索引擎之倒排索引及其底层算法
文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...
EtherNet/IP转DeviceNet协议网关详解
一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...
c#开发AI模型对话
AI模型 前面已经介绍了一般AI模型本地部署,直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型,但是目前国内可能使用不多,至少实践例子很少看见。开发训练模型就不介绍了&am…...
自然语言处理——循环神经网络
自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元(GRU)长短期记忆神经网络(LSTM)…...
Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...
【Redis】笔记|第8节|大厂高并发缓存架构实战与优化
缓存架构 代码结构 代码详情 功能点: 多级缓存,先查本地缓存,再查Redis,最后才查数据库热点数据重建逻辑使用分布式锁,二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...
【MATLAB代码】基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),附源代码|订阅专栏后可直接查看
文章所述的代码实现了基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),针对传感器观测数据中存在的脉冲型异常噪声问题,通过非线性加权机制提升滤波器的抗干扰能力。代码通过对比传统KF与MCC-KF在含异常值场景下的表现,验证了后者在状态估计鲁棒性方面的显著优…...
