当前位置: 首页 > article >正文

202106-nuPlan:面向自动驾驶汽车的闭环机器学习规划基准

第001/5页(英文原文)nuPlan: A closed-loop ML-based planning benchmark for autonomous vehiclesHolger Caesar Juraj Kabzan Kok Seang Tan Whye Kit Fong Eric Wolff Alex Lang Luke Fletcher Oscar Beijbom Sammy Omari MotionalAbstractIn this work, we propose the world’s first closed-loop ML-based planning benchmark for autonomous driving. While there is a growing body of ML-based motion planners, the lack of established datasets and metrics has limited the progress in this area. Existing benchmarks for autonomous vehicle motion prediction have focused on short-term motion forecasting, rather than long-term planning. This has led previous works to use open-loop evaluation with L2-based metrics, which are not suitable for fairly evaluating long-term planning. Our benchmark overcomes these limitations by introducing a largescale driving dataset, lightweight closed-loop simulator, and motion-planning-specific metrics. We provide a highquality dataset with 1500h of human driving data from 4 cities across the US and Asia with widely varying traffic patterns (Boston, Pittsburgh, Las Vegas and Singapore). We will provide a closed-loop simulation framework with reactive agents and provide a large set of both general and scenario-specific planning metrics. We plan to release the dataset at NeurIPS 2021 and organize benchmark challenges starting in early 2022.1. IntroductionLarge-scale human labeled datasets in combination with deep Convolutional Neural Networks have led to an impressive performance increase in autonomous vehicle (AV) perception over the last few years [9, 4]. In contrast, existing solutions for AV planning are still primarily based on carefully engineered expert systems, that require significant amounts of engineering to adapt to new geographies and do not scale with more training data. We believe that providing suitable data and metrics will enable ML-based planning and pave the way towards a full “Software 2.0” stack.Existing real-world benchmarks are focused on shortterm motion forecasting, also known as prediction [6, 4, 11, 8], rather than planning. This is evident in the lack of high-level goals, the choice of metrics, and the openloop evaluation. Prediction focuses on the behavior of other agents, while planning relates to the ego vehicle behavior.Figure 1. We show different driving scenarios to emphasize the limitations of existing benchmarks. The observed driving route of the ego vehicle in shown in white and the hypothetical planner route in red. (a) The absence of a goal leads to ambiguity at intersections. (b) Displacement metrics do not take into account the multi-modal nature of driving. © open-loop evaluation does not take into account agent interaction.Prediction is typically multi-modal, which means that for each agent we predict theNNNmost likely trajectories. In contrast, planning is typically uni-modal (except for contingency planning) and we predict a single trajectory. As an example, in Fig. 1a, turning left or right at an intersection are equally likely options. Prediction datasets lack a baseline navigation route to indicate the high-level goals of the agents. In Fig. 1b, the options of merging immediately or later are both equally valid, but the commonly used L2 distance-based metrics (minADE, minFDE, and miss rate) penalize the option that was not observed in the data. Intuitively, the distance between the predicted trajectory and the observed trajectory is not a suitable indicator in a multimodal scenario. In Fig. 1c, the decision whether to continue to overtake or get back into the lane should be based on the consecutive actions of all agent vehicles, which is not possible in open-loop evaluation. Lack of closed-loop evaluation leads to systematic drift, making it difficult to evaluate beyond a short time horizon (3-8s).We instead provide a planning benchmark to address these shortcomings. Our main contributions are:• The largest existing public real-world dataset for autonomous driving with high quality autolabeled tracks from 4 cities.• Planning metrics related to traffic rule violation, human driving similarity, vehicle dynamics, goal achievement, as well as scenario-based.• The first public benchmark for real-world data with a closed-loop planner evaluation protocol.第001/5页(中文翻译)nuPlan:面向自动驾驶汽车的闭环机器学习规划基准摘要In this work, we propose the world’s first closed-loop ML-based planning benchmark for autonomous driving.While there is a growing body of ML-based motion planners, the lack of established datasets and metrics has limited the progress in this area. Existing benchmarks for autonomous vehicle motion prediction have focused on short-term motion forecasting, rather than long-term planning. This has led previous works to use open-loop evaluation with L2-based metrics, which are not suitable for fairly evaluating long-term planning. Our benchmark overcomes these limitations by introducing a largescale driving dataset, lightweight closed-loop simulator, and motion-planning-specific metrics. We provide a highquality dataset with 1500h of human driving data from 4 cities across the US and Asia with widely varying traffic patterns (Boston, Pittsburgh, Las Vegas and Singapore). We will provide a closed-loop simulation framework with reactive agents and provide a large set of both general and scenario-specific planning metrics. We plan to release the dataset at NeurIPS 2021 and organize benchmark challenges starting in early 2022.在本工作中,我们提出了全球首个用于自动驾驶的闭环机器学习规划基准。尽管基于机器学习的运动规划器日益增多,但由于缺乏公认的数据集和评估指标,该领域的进展受到了限制。现有的自动驾驶汽车运动预测基准主要集中在短期运动预测,而非长期规划。这导致以往的研究采用开环评估和基于 L2 的指标,而这些方法并不适合公平地评估长期规划。我们的基准通过引入大规模驾驶数据集、轻量级闭环仿真器以及运动规划专用指标,克服了这些局限性。我们提供了一个高质量的数据集,包含来自美国和亚洲四个城市(波士顿、匹兹堡、拉斯维加斯和新加坡)的1500 小时人类驾驶数据,这些城市的交通模式差异显著。我们将提供一个具备反应式智能体的闭环仿真框架,并提供大量通用及场景特定的规划指标。我们计划于 NeurIPS 2021 发布该数据集,并从 2022 年初开始组织基准挑战赛。1. 简介大规模人工标注数据集与深度卷积神经网络相结合,在过去几年中显著提升了自动驾驶汽车(AV)感知的性能 [9, 4]。相比之下,现有的自动驾驶规划解决方案仍主要基于精心设计的专家系统,这些系统需要大量的工程工作才能适应新的地理环境,且无法随着训练数据的增加而扩展。我们相信,提供合适的数据和评估指标将推动基于机器学习的规划,并为实现完整的“软件 2.0"栈铺平道路。现有的现实世界基准测试专注于短期运动预测(也称为预测 [6, 4,11, 8], ),而非规划。这一点体现在缺乏高层目标、评估指标的选择以及开环评估上。预测关注其他智能体的行为,而规划则涉及自车的行为。图 1. 我们展示了不同的驾驶场景,以强调现有基准的局限性。自车的实际行驶路线以白色显示,假设的规划器路线以红色显示。(a) 缺乏目标会导致在交叉路口产生歧义。(b) 位移评估指标未考虑驾驶的多模态特性。© 开环评估未考虑智能体交互。预测通常是多模态的,这意味着对于每个智能体,我们预测其NNN最可能的轨迹。相比之下,规划通常是单模态的(应急规划除外),我们仅预测单一轨迹。例如,在图1a 中,在路口左转或右转是同等可能的选项。预测数据集缺乏基线导航路线来指示智能体的高层目标。在图1b 中,立即汇入或稍后汇入都是同样有效的选项,但常用的基于 L2 距离的评估指标(minADE、minFDE 和漏检率)会惩罚数据中未观察到的选项。直观地说,在多模态场景中,预测轨迹与观测轨迹之间的距离并不是合适的指标。在图1c 中,决定继续超车还是返回车道应基于所有车辆智能体的连续动作,而这在开环评估中是无法实现的。缺乏闭环评估会导致系统性漂移,使得难以评估超出短时间范围(3‑8 秒)的表现。相反,我们提供了一个规划基准以解决这些不足。我们的主要贡献包括:•现有最大的公开真实

相关文章:

202106-nuPlan:面向自动驾驶汽车的闭环机器学习规划基准

第001/5页(英文原文) nuPlan: A closed-loop ML-based planning benchmark for autonomous vehicles Holger Caesar Juraj Kabzan Kok Seang Tan Whye Kit Fong Eric Wolff Alex Lang Luke Fletcher Oscar Beijbom Sammy Omari Motional Abstract In this work, we propos…...

WSL2安装配置与优化:在Windows上流畅运行忍者像素绘卷:天界画坊

WSL2安装配置与优化:在Windows上流畅运行忍者像素绘卷:天界画坊 1. 前言:为什么选择WSL2 如果你是一名Windows平台的开发者或游戏爱好者,想要体验《忍者像素绘卷:天界画坊》这款Linux原生游戏,WSL2(Windo…...

罗茨风机行业专题研究:要10家靠谱的回转风机厂家或罗茨鼓风机厂家名单

随着我国工业现代化进程加速及环保政策趋严,罗茨风机作为污水处理、电力、化工等领域的关键设备,市场需求持续增长。据中国通用机械工业协会统计,2024年我国罗茨风机市场规模达82.3亿元,年复合增长率7.5%,行业呈现技术…...

魔兽争霸3优化终极指南:5分钟解决Windows 11兼容性问题

魔兽争霸3优化终极指南:5分钟解决Windows 11兼容性问题 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper WarcraftHelper是一款专为经典游戏…...

标定结果从2像素到0.13:一次双目标定失败到成功的“硬核”复盘

图准科技-HH 图准精度视界 在立体视觉的世界里,标定(Calibration)是最基础也是最关键的一步,很多人往往忽略了它的重要性。然而,正是那些被忽视的细节往往隐藏着最致命的问题,特别是在面对真实数据时——尤…...

抖音视频批量下载架构演进:从单点工具到企业级内容管理系统的技术突破

抖音视频批量下载架构演进:从单点工具到企业级内容管理系统的技术突破 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser…...

解密网易云音乐NCM格式:ncmdumpGUI让你的音乐库重获自由

解密网易云音乐NCM格式:ncmdumpGUI让你的音乐库重获自由 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾为网易云音乐的NCM加密格式而烦恼…...

2-2硬件组态

硬件组态就是将你需要的所有PLC模块,包括电源, CPU,开关量输入,输出,模拟量输入,输出,通讯模块等进行配置,然后给每个模块分配物理地址在博途上:订货号和版本要和plc一致…...

Agent 30 课程开发指南 - 第24课

Agent 30 课程开发指南 从零开始构建一个生产级 AI 助手框架。 本指南将带你从"向 LLM 问好"一步步走到一个完整的多提供者、多通道 AI 智能体,具备工具调用、记忆、安全防护和 Web 界面。每节课程都建立在上一节课的基础之上。每节课都包含可运行的代码和…...

mac系统使用cc switch

CC-Switch 是一款用于在 Mac 上一键管理和切换 AI 模型(Claude / GPT / GLM 等)API 配置的图形化工具。以下是完整的安装、设置与使用指南: 一、安装(两种方法) 方法 1:Homebrew 安装(推荐&am…...

5大核心模块构建的智能游戏自动化系统:BetterGI原神辅助工具终极指南

5大核心模块构建的智能游戏自动化系统:BetterGI原神辅助工具终极指南 【免费下载链接】better-genshin-impact 📦BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动刷本 | 自动采集/挖矿/锄地 | 一条龙 …...

cv_resnet101_face-detection_cvpr22papermogface一文详解:ModelScope配置文件自动加载机制

cv_resnet101_face-detection_cvpr22papermogface一文详解:ModelScope配置文件自动加载机制 1. 引言 你有没有遇到过这样的场景:拿到一个AI模型,光是配置环境、加载权重、处理输入输出格式,就花了大半天时间?好不容易…...

DoL汉化美化整合包构建指南:5分钟掌握自动化打包技巧

DoL汉化美化整合包构建指南:5分钟掌握自动化打包技巧 【免费下载链接】DOL-CHS-MODS Degrees of Lewdity 整合 项目地址: https://gitcode.com/gh_mirrors/do/DOL-CHS-MODS DoL-Lyra 构建系统是一个专为 Degrees of Lewdity 游戏打造的自动化打包工具&#x…...

HY-Motion 1.0在VR开发中的应用:手势交互与动作捕捉替代方案

HY-Motion 1.0在VR开发中的应用:手势交互与动作捕捉替代方案 1. 引言 想象一下,你正在开发一款VR游戏,需要让虚拟角色做出"挥手打招呼"的动作。传统方式可能需要昂贵的动作捕捉设备,专业的动捕演员,以及数…...

推推我自己研发的-厂内订餐小程序

简介想暴富,想过富人的生活,汇成以下简短诗句 人生不过三万天,过去一天少一天。 待问何时功成退,一摸兜里咱就废。 工厂订餐速度囧,风口抓住不松手, 程序推广钱就有,越推越来越富有&#xf…...

Windows Cleaner:一站式解决C盘爆红的终极免费清理工具

Windows Cleaner:一站式解决C盘爆红的终极免费清理工具 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是否也曾经历过这样的瞬间:当电脑…...

GPT-5未公开的因果短板曝光:基于ICML 2024盲测数据的4类反事实推理失效模式全解析

第一章:AGI的因果推理能力发展 2026奇点智能技术大会(https://ml-summit.org) 因果推理正从传统统计学习的关联建模,跃迁为通用人工智能(AGI)系统理解世界运行机制的核心认知支柱。当前主流大语言模型虽具备强大的模式匹配与条件…...

Dubbo 超时机制与集群容错机制详解:防止雪崩的利器

Dubbo 超时机制与集群容错机制详解:防止雪崩的利器 一、引言 在分布式系统中,服务间的远程调用充满不确定性——网络延迟、服务端GC停顿、瞬间流量洪峰等都可能导致调用失败或响应缓慢。如果没有合理的保护机制,一个服务的不稳定会像多米诺骨…...

OpenClaw中文版教程:nanobot gateway服务启动失败常见原因与修复方案

OpenClaw中文版教程:nanobot gateway服务启动失败常见原因与修复方案 1. 问题背景与重要性 如果你正在使用nanobot这个超轻量级的个人人工智能助手,可能会遇到一个让人头疼的问题:gateway服务启动失败。这个服务是连接QQ机器人和nanobot核心…...

Windows系统清理终极指南:5分钟解决C盘爆满问题

Windows系统清理终极指南:5分钟解决C盘爆满问题 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是否每天都要面对那个令人焦虑的红色警告&#xff1…...

二叉搜索树(BST)与哈夫曼树(HFM)

本篇,我们以搜索树和哈夫曼树为例,探究二叉树建立和遍历过程。 二叉树定义: 二叉树 是一种有限的、非线性的树形数据结构,每个节点最多只有两个子节点,分别称为:左孩子(左子树)、右孩…...

3大核心功能+5分钟上手:Lumafly让你的空洞骑士模组管理轻松又高效

3大核心功能5分钟上手:Lumafly让你的空洞骑士模组管理轻松又高效 【免费下载链接】Lumafly A cross platform mod manager for Hollow Knight written in Avalonia. 项目地址: https://gitcode.com/gh_mirrors/lu/Lumafly 还在为空洞骑士模组安装的繁琐流程…...

如何快速备份微信聊天记录:终极完整导出指南

如何快速备份微信聊天记录:终极完整导出指南 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 你是否曾因为手机丢失或更换设备,而遗憾地丢失了重要…...

如何在5分钟内免费创建专业EPUB电子书:EPubBuilder终极指南

如何在5分钟内免费创建专业EPUB电子书:EPubBuilder终极指南 【免费下载链接】EPubBuilder 一款在线的epub格式书籍编辑器 项目地址: https://gitcode.com/gh_mirrors/ep/EPubBuilder 想要制作专业电子书却苦于复杂的技术门槛?EPubBuilder为你提供…...

终极指南:用WarcraftHelper让魔兽争霸III在Windows 11完美运行

终极指南:用WarcraftHelper让魔兽争霸III在Windows 11完美运行 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸III在现代电…...

Linux基础命令(系统信息类)

今天给大家展示一下多用于查看系统状态信息的命令,分别是lscpu,free,df,uptime,uname以及wlscpu #查看cpu信息Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s…...

00华夏之光永存:黄大年茶思屋榜文解法 鸿蒙生态全场景通信核心卡脖子难题前瞻解析

华夏之光永存:黄大年茶思屋榜文解法「难题揭榜第9期 全5题」 鸿蒙生态全场景通信核心卡脖子难题深度解析 ——第0篇:题目全貌、卡脖子定位与技术价值前瞻 一、摘要 本文为华为黄大年茶思屋难题揭榜第9期前瞻解析篇(第0篇)&#xf…...

3步掌握Ryzen处理器终极调试:SMUDebugTool完全指南

3步掌握Ryzen处理器终极调试:SMUDebugTool完全指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitco…...

Realistic Vision V5.1 产品级应用展示:从概念草图到高清渲染图

Realistic Vision V5.1 产品级应用展示:从概念草图到高清渲染图 最近在尝试用AI辅助产品设计,发现Realistic Vision V5.1这个模型在生成写实风格图像方面,确实有点东西。它不像一些模型那样,生成的东西总带着一股“塑料感”或者“…...

当LLM输出准确率突破99.2%,内容运营KPI考核体系必须重写的4个硬性条件(奇点大会技术委员会强制建议稿)

第一章:当LLM输出准确率突破99.2%,内容运营KPI考核体系必须重写的4个硬性条件(奇点大会技术委员会强制建议稿) 2026奇点智能技术大会(https://ml-summit.org) 当大语言模型在标准行业测试集(如ContentQA-2025 v3.1&am…...