当前位置: 首页 > article >正文

地平线DiffusionDrive v1和v2的细节对比解读

点击下方卡片关注“自动驾驶之心”公众号戳我-领取自动驾驶近30个方向学习路线作者 | 三两声知乎编辑 | 自动驾驶之心原文链接https://zhuanlan.zhihu.com/p/2023721669739430016本文只做学术分享如有侵权联系删文自动驾驶前沿信息获取→自动驾驶之心知识星球本文结合DiffusionDrive和DiffusionDriveV2的开源代码进行对比解读希望能进一步加深理解。在阅读本文时如果对两篇论文的整体框架还不清楚欢迎大家参考扩散模型在自动驾驶中的应用——DiffusionDrive, DiffusionDriveV2——扩散模型加强化学习. 为了简洁起见下文使用DD表示DiffusionDrive使用DD2表示DiffusionDriveV2。策略梯度与DiffusionDrive的采样策略梯度的形式表示为在DD和DD2中每一步的去噪都被看做策略。DD和DD2中模型是直接来预测在DD中推理时采用的DDIM的采样方式是确定性采样。在DD2中每次训练时都同时进行多步采样。在DD2中训练时采用的多步采样和DD中DDIM的确定性采样不同在进行DDIM的确定性采样之后作者进行了人为加噪。DDPM和DDIM的采样的统一公式为预测的指向的方向随机噪声其中扩散过程中的累乘系数即。模型预测的噪声。控制采样随机性的超参数。需要注意的是DD和DD2中是直接预测,因此上对公式1进行变形得到预测的指向的方向随机噪声其中在DDPM的采样中1。在DDIM的采样中0完全去掉了随机项。在DD2中RL训练是采样的是DDPM的采样方式不过最后的随机噪声就像文中提到的采取的是横纵乘以随机系数的方式来进行加噪。确定性采样的部分得到那加噪后的轨迹表示为整理之后得到因此上假设采样得到, 进一步可以得到开源出来的代码使用的乘法的方式加噪但是开源出来的代码推导是错的式5才是正确的计算方式。Reward的计算与GRPO的优势函数如论文中提到的reward的采用最终的轨迹进行计算。整个计算过程采用的半闭环的方式。将自车的轨迹转换到全局坐标系然后使用LQR控制器进行轨迹的追踪得到闭环的轨迹。使用闭环轨迹计算轨迹的reward。其中环境信息是开环的是提前缓存好的。代码中采用并行计算的方式一次性将一个batch的轨迹计算其score。在代码中一共计算了6种类型的score分别为NO_COLLISION, DRIVABLE_AREA, PROGRESS, TTC, COMFORTABLE, DRIVING_DIRECTION.整个reward的计算流程为将训练的轨迹进行插值插值后的轨迹进行坐标转换转换到世界坐标系使用LQR进行轨迹的闭环追踪得到闭环轨迹使用闭环轨迹和缓存下来的环境信息计算得到每条轨迹的score为了清晰起见我会详细说明reward的计算逻辑.下图为5条去噪轨迹和原始的GT轨迹。图1 5条去噪轨迹和原始GT轨迹根据自车状态将所有的轨迹转到全局坐标系并且进行插值0.1S进行插值。图2 全局坐标转换和和插值后的轨迹为了进行对比将插值后的轨迹重新转到自车坐标系图3 插值后重新转为自车坐标系使用LQR进行闭环轨迹的追踪闭环的轨迹如下图所示图4 插值后重新转为自车坐标系挑选其中一条预测轨迹和闭环追踪轨迹进行对比图5 预测轨迹和LQR追踪轨迹最后根据闭环轨迹和环境信息计算score最后将score综合起来作为整条轨迹的score.作者引入了GRPO算法避免引入critic网络带来的开销GRPO算法的Loss表示为但是在作者开源出来的代码中并没有使用有些奇怪。结语这是一篇瑕不掩瑜的文章结合开源代码能否加深理解。为DIffusion和RL结合提供了很好的的思路很有启发性。自动驾驶之心求点赞求分享求喜欢

相关文章:

地平线DiffusionDrive v1和v2的细节对比解读

点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线作者 | 三两声知乎编辑 | 自动驾驶之心原文链接:https://zhuanlan.zhihu.com/p/2023721669739430016本文只做学术分享,如有侵权,联系删文>&g…...

Python数据分析教程笔记

Python数据分析教程笔记 【免费下载链接】mx-bili-plugin 项目地址: https://gitcode.com/gh_mirrors/mx/mx-bili-plugin 视频:Python数据分析入门 重点内容 [00:15:30] 数据清洗的基本步骤 处理缺失值处理异常值数据标准化 [00:28:45] Pandas数据处理技巧…...

标识标牌一般什么场景使用的最广泛?他的作用是什么?

标识标牌:设计、场景与作用全解析标识标牌作为视觉传达的重要元素,在各类场景中扮演着关键角色。合理的设计、广泛的应用场景以及多样的作用,使其成为现代环境中不可或缺的一部分。标识标牌的设计要点明确功能与信息:首先要清晰确…...

深圳会议酒店推荐|从福田CBD到前海,酒店哥哥一篇搞定你的办会选址难题

深圳办会的特殊性:一场选址决定成败的隐形战争在深圳这座“三天一层楼”的奇迹之城,每天有超过800场会议在不同角落上演。从福田CBD的金融峰会到前海自贸区的创业路演,从南山科技园的产学研对接会到宝安生态园的户外团建,每场会议…...

Obsidian Smart Connections 技术深度解析:如何构建零配置的AI笔记关联引擎

Obsidian Smart Connections 技术深度解析:如何构建零配置的AI笔记关联引擎 【免费下载链接】obsidian-smart-connections Chat with your notes & see links to related content with AI embeddings. Use local models or 100 via APIs like Claude, Gemini, C…...

-:RAG 入门-向量存储与企业级向量数据库 milvus

环境安装 pip install keystone-engine capstone unicorn 这3个工具用法极其简单,下面通过示例来演示其用法。 Keystone 示例 from keystone import * CODE b"INC ECX; ADD EDX, ECX" try:ks Ks(KS_ARCH_X86, KS_MODE_64)encoding, count ks.asm(CODE)…...

RDMA网卡如何化身‘内存搬运工’?深入拆解WRITE和READ操作的硬件执行流水线

RDMA网卡如何化身‘内存搬运工’?深入拆解WRITE和READ操作的硬件执行流水线 在数据中心和高性能计算领域,RDMA(远程直接内存访问)技术正悄然改变着分布式系统的通信范式。想象一下,当两个服务器需要交换数据时&#xf…...

【仅限首批200家企业的SITS2026白名单工具】:AI面试模拟器部署实录与ROI测算表

第一章:SITS2026专家:AI面试模拟器 2026奇点智能技术大会(https://ml-summit.org) SITS2026专家系统首次集成多模态AI面试模拟器,专为技术岗位候选人打造高保真、可配置、实时反馈的面试训练环境。该模拟器基于LLMASRTTS情感计算四维融合架…...

告别浏览器原生下载:如何用Motrix WebExtension实现高效下载管理

告别浏览器原生下载:如何用Motrix WebExtension实现高效下载管理 【免费下载链接】motrix-webextension A browser extension for the Motrix Download Manager and its forks 项目地址: https://gitcode.com/gh_mirrors/mo/motrix-webextension 在现代网络环…...

BUUCTF [HITCON 2017]SSRFme 1 深度解析:从代码审计到命令执行的完整攻击链

1. 代码审计:从沙盒逃逸到命令执行的突破口 拿到这道题目的源码时,我第一眼看到shell_exec和GET的组合就意识到事情不简单。先来看关键代码段: $sandbox "sandbox/" . md5("orange" . $_SERVER["REMOTE_ADDR"…...

Modbus调试工具实战指南:从入门到精通

1. Modbus调试工具入门指南 第一次接触Modbus调试工具时,我也是一头雾水。记得当时为了调试一个温控器,整整折腾了两天都没能成功通讯。后来才发现,原来是因为波特率设置错误。这种经历让我深刻理解到,掌握Modbus调试工具的基础知…...

FreeCAD绘图尺寸标注插件终极指南:如何快速掌握专业工程图纸标注

FreeCAD绘图尺寸标注插件终极指南:如何快速掌握专业工程图纸标注 【免费下载链接】FreeCAD_drawing_dimensioning Drawing dimensioning workbench for FreeCAD v0.16 项目地址: https://gitcode.com/gh_mirrors/fr/FreeCAD_drawing_dimensioning FreeCAD绘图…...

一图胜千言:从LSTM到BiLSTM的演进与实战

1. 从RNN到LSTM:为什么我们需要记忆门控? 记得我第一次用RNN处理文本数据时,遇到一个头疼的问题——模型总是记不住前文的关键信息。比如分析"虽然菜品一般,但服务态度很好"这样的句子时,模型总是被后半句的…...

BilibiliDown:跨平台B站视频下载解决方案全面解析

BilibiliDown:跨平台B站视频下载解决方案全面解析 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/Bi…...

让你的小爱音箱变身私人音乐管家:XiaoMusic项目完全指南

让你的小爱音箱变身私人音乐管家:XiaoMusic项目完全指南 【免费下载链接】xiaomusic 使用小爱音箱播放音乐,音乐使用 yt-dlp 下载。 项目地址: https://gitcode.com/GitHub_Trending/xia/xiaomusic 想象一下,每天早晨被自己喜欢的音乐…...

抖音素材备份神器:douyin-downloader 完整使用指南

抖音素材备份神器:douyin-downloader 完整使用指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support.…...

北斗短报文RDSS协议实战:手把手教你用C语言搞定中文GBK编码与浮点数传输

北斗短报文RDSS协议实战:手把手教你用C语言搞定中文GBK编码与浮点数传输 北斗短报文通信在野外监测、应急救灾等领域有着不可替代的作用。想象一下,当你在青藏高原部署的气象站需要回传数据,或是渔船在远海需要发送求救信息时,北斗…...

告别时钟漂移:用Verilog在Xilinx A7 FPGA上实现8B10B编码的完整流程与避坑指南

高速串行通信的时钟守护者:Xilinx A7 FPGA上8B10B编码实战全解析 时钟同步问题就像高速公路上突然出现的减速带——当你以Gbps速率传输数据时,哪怕微小的时钟漂移都可能导致整个通信链路崩溃。这就是为什么我在设计Xilinx Artix-7系列FPGA的高速接口时&a…...

如何让B站缓存视频重获新生?m4s-converter一键转换MP4全攻略

如何让B站缓存视频重获新生?m4s-converter一键转换MP4全攻略 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经遇到过这样的…...

Java Lambda里想改个变量值,编译器总报错?试试这3个绕过‘final’限制的实战技巧

Java Lambda变量修改难题:3种突破final限制的工程实践 刚接手一个多线程数据处理的Java项目时,我发现一个有趣的现象——在Lambda表达式里想修改外部变量,编译器就像个固执的安检员,死活不让通过。这不禁让我思考:为什…...

intv_ai_mk11 GPU部署避坑指南:解决乱码、延迟高、无响应等6类常见问题

intv_ai_mk11 GPU部署避坑指南:解决乱码、延迟高、无响应等6类常见问题 1. 环境准备与快速部署 在开始使用intv_ai_mk11 AI对话机器人前,确保您的GPU服务器满足以下基本要求: 操作系统:推荐Ubuntu 20.04/22.04 LTSGPU驱动&…...

域服务基础概念

(一)、域 定义:由DC(域控制器)统一管理用户基本信息,计算机,权限,组策略,安全策略的计算机逻辑组域是最小的安全边界域必须依赖DNS服务 (二)、三大…...

智能桌面分区革命:用NoFences打造你的Windows效率空间

智能桌面分区革命:用NoFences打造你的Windows效率空间 【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 还在为杂乱的桌面图标而烦恼吗?NoFences是一款创…...

2026南宁建筑行业AI获客落地指南:AI获客服务商参考、成本与时效全详解

2026年南宁建筑行业机遇与挑战并存:平陆运河、中国—东盟自贸区3.0版、城市更新等重大项目持续释放需求,但2025年本地新增建筑相关企业超1200家,传统获客模式效能断崖式下滑。数字化精准获客已成为南宁建筑企业生存发展的核心命题。本文基于2…...

TCP可靠传输的基石:从停止等待到滑动窗口,ARQ协议如何守护你的数据?

1. 从零理解ARQ协议:TCP可靠传输的守护者 想象你正在给朋友寄一封重要信件。如果只是简单地把信扔进邮筒,你怎么知道对方是否收到?现实中我们可能会要求对方签收后寄回回执——这正是ARQ协议(自动重传请求)的核心思想。…...

别再瞎调K-Means的K值了!用sklearn的silhouette_score和silhouette_samples帮你科学选簇数

科学选择K-Means聚类数量的实战指南:从轮廓系数到可视化诊断 第一次接触K-Means聚类时,很多人都会陷入一个误区——凭直觉选择K值。你可能见过这样的场景:数据科学家盯着肘部法则(Elbow Method)生成的折线图&#xff0…...

FPGA制造与测试全流程

FPGA制造与测试全流程(从设计到出货) FPGA是可编程逻辑芯片,核心结构含LUT、触发器、可编程互联、I/O、配置SRAM/Flash,制造与测试分前端设计→晶圆制造→晶圆测试(CP)→封装→封装测试(FT)→可靠性/系统测试→出货六大阶段&…...

AI赋能CI/CD:用Gemini一键生成高效脚本

技术文章大纲:Gemini实战——用AI写CI/CD脚本引言CI/CD在现代软件开发中的重要性传统编写CI/CD脚本的挑战(复杂性、维护成本)AI(如Gemini)如何简化脚本生成过程理解Gemini与CI/CDGemini的核心能力(自然语言…...

Excel公式美化终极指南:让复杂公式一目了然的免费工具

Excel公式美化终极指南:让复杂公式一目了然的免费工具 【免费下载链接】ExcelFormulaBeautifier Excel Formula Beautifer,make Excel formulas more easy to read,Excel公式格式化/美化,将Excel公式转为易读的排版 项目地址: https://gitcode.com/gh_mirrors/ex/…...

小米手表表盘设计终极指南:如何快速设计个性化表盘

小米手表表盘设计终极指南:如何快速设计个性化表盘 【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create 你是否厌倦了千篇一律的小米手表表盘&#xff1…...