从研发域到量产域的自动驾驶工具链探索与实践

导读
本文整理自 2023 年 9 月 5 日百度云智大会 - 智能汽车分论坛,百度智能云自动驾驶云研发高级经理徐鹏的主题演讲《从研发域到量产域的自动驾驶工具链探索与实践》。
全文中部段落附有演讲中 2 个产品演示视频的完整版,精彩不容错过。
(视频观看:https://mp.weixin.qq.com/s/qsgrgirWa_UiSPkF_P7NYQ)
全文3580,预计阅读时间9分钟。
百度作为国内最早布局自动驾驶的企业,一直积极向行业输出自动驾驶相关的产品、技术和服务。很荣幸今天有这样一个机会向大家去分享百度在自动驾驶工具链领域的实践经验,也希望把我们对自动驾驶工具链的理解同大家做一些共同的探讨。
自动驾驶是一门融合多项能力的复杂学科,如果没有扎实的技术沉淀和产业布局,很难破解自动驾驶快速落地的难题。百度从 2013 年便开始布局自动驾驶核心研发技术,2021 年我们向产业开放了在多年自动驾驶领域积累的经验形成系统化工具链产品。两年内,我们获得了国内外很多主机厂和 Tier1 的广泛认可。
这里也给大家分享几个案例:
第一个案例是云仿真平台。我们跟客户一起积累了 50w+ 的定制化场景,在不到一年的时间内帮助车企客户完成了 700 多版自动驾驶算法的迭代,实现了近千万公里的测试验证,让车企的量产智能驾驶落地时间大大提前。
第二个案例是数据闭环。我们在一年内帮助客户累计托管了 50 PB 数据,并且在平台中嵌入了 500 多个自动驾驶数据挖掘模型,完成上亿帧数据的高效处理,实现数据的价值提升和转化。
第三个是数据标注。对自动驾驶的研发训练而言,高质量和大数量的数据集获取,在传统条件下一般是人工逐帧标注。百度自主研发的 AI 智能标注模型,帮助客户累计标注了千万帧的数据,省去了上千万的人力成本。
这三个案例从左往右分别对应着数据应用、数据管理和数据生产过程。在和车企落地实践的过程中,我们认为,自驾的研发新模式就是能够让海量自驾数据在数据的应用、生产、管理上更高效的模式。这也是我们在逐步跟客户沟通过程中,逐步找到的工具链价值,也得到了客户们的认可。

刚才我们分享了早期基于研发域的工具链需求,以及和客户做探索和落地的一些思考。而随着智能化汽车逐步发展,尤其是以智能化为核心的下半场已经到来,智能汽车即将跨过发展临界点,迎来真正的大爆发。
因此如果要决胜智能驾驶市场,必须提前进行量产研发布局。
然而,目前行业大部分自动驾驶云产品,主要提供的是自动驾驶功能从无到有的研发能力。但在量产阶段,车企更关注自家算法从有到优,其中核心要解决的就是长尾问题。虽然长尾问题的比例可能只有 10%,但是解决长尾问题的成本和代价是非常高的,这也给车企带来了四大挑战:
-
首先是数据合规。根据自然资源部去年发布的 1 号文的要求,智能网联汽车在路上跑,已经明确为测绘行为,需要委托资质图商管控,保障地理信息数据安全,满足合规要求。所以对车企来说,量产回传的数据如何在符合监管政策的前提下回传到云端,帮助后端做研发就成了第一大挑战。
-
其次是效率问题。对量产车来说,每天需要回传百万台车的海量数据,这就对平台的处理效率提出了极高的要求。那么,如何从海量混杂的业务数据中挖掘出高质量数据,解决长尾问题,就成了车企面临的巨大挑战。
-
第三是服务问题。我们需要根据不同用户反馈,持续提升智能驾驶效果和乘车体验,实现千人千面的个性化服务能力。
-
最后是成本问题。城市道路场景复杂,测试尤为困难。汽车量产需要以低成本的方式拓展至全国各地,如何快速适应不同城市场景,也需要要有对应的处理方案。
所以,量产时代自动驾驶需要新的工具、新的服务。
百度作为国内最早布局自动驾驶的企业,率先完成了从研发域工具链到量产域服务的产品升级,致力于服务智驾量产,攻坚长尾难题,为车企赢得新的市场增长点。

百度作为最早进入自动驾驶的企业之一,目前已经率先完成了自动驾驶工具链从研发域到量产域的全面升级。
下图是百度智能云面向量产车全面升级的自动驾驶工具链的全套解决方案。
百度升级的自动驾驶工具链解决方案,为车企搭建了一条用于车辆智能化开发的智能驾驶产线,构建了面向自动驾驶全生命周期的云服务。这套方案为车企提供在智驾研发过程中的模型开发、模型训练、数据采集、数据标注、仿真测试、运营与监管等全栈工具平台,让自动驾驶开发变得更智能、更高效、更简单,助力车企快速开发和使用自动驾驶,实现数据闭环、问题闭环和场景闭环。
百度自动驾驶工具链经过了充分的实践验证。通过大量的自动驾驶道路测试数据,目前已经形成了千万量级的场景库;基于领先的 AI 大底座,已实现日行千万公里的自动驾驶仿真测试;同时,也已经支持百度 6000w+ 公里的自动驾驶实测里程,为百度自动驾驶技术的快速迭代、效果验证提供了有效支撑。
百度智能云提供的这一套解决方案,在工具链的基础之上,还为客户输出了百度在自驾研发过程中的一些实践和经验,将我们实践中积累的产品 Know-How 一并和用户分享,帮助车企始终走在智驾前沿,抢占智驾服务新市场。

下面我会从三个方面分别讲讲自动驾驶工具链在实践过程中的主要的一些思考。
第一点是工具链 + 合规服务。我们知道,合规是底线,只有数据安全,智驾行业才能健康快速发展。百度作为行业内唯一支既懂合规,又懂能提供完善的基础设施,同时还精通自动驾驶业务的公司,在打造自动驾驶工具链时,精准理解数据合规要求,同时满足客户业务创新需要,实现「原始数据不出车、测绘数据不出云、测绘成果不关联、资质图商全管控」的效果,帮助车企实现全流程的合规升级改造。
在「精准的合规」背后,百度设立了专业的合规保障团队,能够提供全生命周期的安全服务与多部门的「会诊」服务,解决各类疑难场景,为车企的智驾安全可持续发展保驾护航。

第二点是数据服务。在过去的几年的快速发展中,车企逐步积累了大量数据。如何在海量数据中快速、准确地挖掘出有价值的信息,是影响智驾迭代速度的关键。
传统的数据挖掘过程,更多的还是通过人工标注或者算法打标的方式进行流程式的挖掘,已无法满足客户对海量长尾数据的需求。
我们基于百度多年在搜索领域的积累,结合文心大模型实现了自动驾驶「数据智能搜索引擎」。数据服务从「流程式」向「检索式」升级,实现数据挖掘的“大海捞针”。

在检索式数据挖掘能力的帮助下,标签的能力更丰富。同时通过对数据场景的精准定义,可以基于图片、文字做一些更加精准的需求定义和检索能力,让数据资产快速从无到有,从有到优。传统特殊场景的挖掘,大概需要一周时间才可以开发完毕,而通过检索式的服务,基本可以实现场景的一键获取。

自动驾驶研发过程中,经常需要一些定制化的场景进行问题的复现。传统的解决防范是根据需要的场景来让研发人员写一些挖掘算法,然后再布置对应的任务工作流才能跑出来。而现在可以如视频中的所展示的,通过以图搜图、以文搜图或者场景检索等功能,直接从海量数据中把所需数据搜索出来,将无序的数据变成宝贵的数据资源。
第三点是仿真服务。我们观察到,行业中很多伙伴其实是缺乏数据积累的。我们也一直在思考,如何让缺乏数据积累的行业伙伴以低成本的方式快速进行自动驾驶的研发、测试和运营。此时,高精度和多场景的城市级仿真就是解决该问题的关键。
百度多年来已积累了海量的自动驾驶数据,一方面,我们基于百度地图大规模路网自动构建孪生城市,在孪生城市中实现高精度仿真还原,全面覆盖百城差异化场景;另一方面,百度目前已经积累了超过 6000w+ 公里的自动驾驶测试里程数据,并积累了千万级场景库。
百度智能云的仿真服务将为车企提供超过百城的真实路网、千万公里的场景数据,支持日行千万公里的大规模仿真测试。车企在云端就可轻松验证不同城市场景下的自动驾驶能力,解决因地理环境、路况差异带来的「智车出城难」问题,释放百亿价值数据,助力车企快速积累测试里程,大幅降低研发成本,研发效率提升 10 倍以上。

百度智能云的仿真平台自 2021 年正式对外发布以来,已经经过了多个版本的迭代。在这个过程中,非常感谢行业各位合作伙伴的信任。同时基于大模型技术的发展趋势,我们的仿真平台也新增了仿真场景的自动生成在内的很多新功能,后面也会逐步发布,并分享给更多的行业伙伴。
智能汽车的发展也即将跨越临界点,迎来真正的大爆发。百度智能云自动驾驶工具链通过提供「管家式」的云服务,切实解决智驾量产面临的诸多挑战。百度期待和行业伙伴一起,共同攻克自动驾驶技术难关,抓住增长机遇,共赴智驾量产新时代。
— END —
推荐阅读
大模型在代码缺陷检测领域的应用实践
通过Python脚本支持OC代码重构实践(二):数据项提供模块接入数据通路的代码生成
对话InfoQ,聊聊百度开源高性能检索引擎 Puck
浅谈搜索展现层场景化技术-tanGo实践
初识搜索:百度搜索产品经理的第一课
相关文章:
从研发域到量产域的自动驾驶工具链探索与实践
导读 本文整理自 2023 年 9 月 5 日百度云智大会 - 智能汽车分论坛,百度智能云自动驾驶云研发高级经理徐鹏的主题演讲《从研发域到量产域的自动驾驶工具链探索与实践》。 全文中部段落附有演讲中 2 个产品演示视频的完整版,精彩不容错过。 (视频观看&…...
404. 左叶子之和
原题链接:404. 左叶子之和 思路: 首先要注意是判断左叶子,不是二叉树左侧节点,所以不要上来想着层序遍历。 节点A的左孩子不为空,且左孩子的左右孩子都为空(说明是叶子节点),那么A节…...
基于SSM的课程管理系统
末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:Vue 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目:是 目录…...
【hcie-cloud】【5】华为云Stack规划设计之华为云Stack标准化配置、缩略语【下】
文章目录 前言、华为云Stack交付综述为云Stack标准组网华为云Stack标准化配置华为云Stack配置概览华为云Stack云服务全视图华为云Stack部署方案节点类型说明华为云Stack云服务组件部署场景管理节点部署原则云平台管理规格华为云Stack IaaS场景&高阶场景起步必选部署组件x86…...
搭建自己的MQTT服务器,实现设备上云(Ubuntu+EMQX)
一、EMQX介绍 这篇文章教大家在ECS云服务器上部署EMQX,搭建自己私有的MQTT服务器,配置EMQX实现设备上云,设备数据转发,存储;服务器我采用的华为云的ECS服务器,系统选择Ubuntu系统。 Windows版本的看这里: https://blog.csdn.net/xiaolong1126626497/article/details/1…...
web3案例中解决交易所中 ETH与token都是0问题 并帮助确认展示是否成功
可能写了这么久 很多人会发现一个问 我们前面的案例 个人在交易所中的 自定义token 和 ETH 一直是放了个0 大家也不太敢确认是否真的有效 那么 很简单 我们操作 存入一些进交易所 不就ok了 我们 来看之前交易所写的代码 我们写了 depositEther 存入 ETH 和 depositToken 存入…...
unreal engine oculus 在vr场景中fade in , fade out
https://www.youtube.com/watch?vxRA7hRiXwuA...
0. 前言与大纲
机器学习面试题汇总与解析——前言与大纲 故事引入专栏介绍作者介绍大纲 受众:本教程适合于Python已经入门的学生或人士,有一定的编程基础。 本教程适合于算法工程师、机器学习求职的学生或人士。 故事引入 蒋 豆 芽:老李,我们…...
家乡特色饮食体验系统的设计与实现-计算机毕设 附源码 27533
家乡特色饮食体验系统的设计与实现 摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对家乡特色…...
本地数据库迁移到云端服务器
工具迁移xtrabackup 创建云服务器——通过云服务器提供的公网地址远程连接XShell——利用迁移工具将数据库从本地迁移到云服务器 (1)创建云服务器 (2)远程连接XShell (3)yum安装mysql (4&…...
SpringCloudGateway--Sentinel限流、熔断降级
目录 一、概览 二、安装Sentinel 三、微服务整合sentinel 四、限流 1、流控模式 ①直接 ②关联 ③链路 2、流控效果 ①快速失败 ②Warm Up ③排队等待 五、熔断降级 1、慢调用比例 2、异常比例 3、异常数 一、概览 SpringCloudGateway是一个基于SpringBoot2.x的…...
ARMday02(汇编语法、汇编指令)
汇编语法 汇编文件中的内容 1.伪操作:在汇编程序中不占用存储空间,但是可以在程序编译时起到引导和标识作用 .text .global .glbal .if .else .endif .data .word.... 2.汇编指令:每一条汇编指令都用来标识一个机器码,让计算机做…...
docker容器中运行jar 出现invalid or corrupt jarfile
1,背景: 在本地java开发完毕之后,想要打包成docker镜像,方便安装。由于本地没有docker环境,也懒得装了。有一台测试的linux机器可以使用,所以先在本地打包生成xxx.jar,然后拷贝到有docker环境的…...
PHP+MySQL人才招聘小程序系统源码 带完整前端+后端搭建教程
在当今竞争激烈的人才市场中,招聘平台的需求日益增长。传统的招聘平台往往需要投入大量的人力物力进行维护和管理,这对于许多中小企业来说是一个沉重的负担。因此,开发一个简单易用、高效便捷的招聘平台显得尤为重要。 PHP是一种流行的服务器…...
MongoDB常用的语句
mongodb 可视化工具: Robo3T。 DataGrip,对mongodb的日期格式不友好。 MongoDB常用的语句: 注意,凡是涉及到日期类型的,最好都用这种格式 ISODate(“2023-03-27T16:00:00.000Z”) MongoDB倒序,查询&am…...
MIPSsim模拟器 使用说明
(一) 启动模拟器 双击MIPSsim.exe,即可启动该模拟器。模拟器启动时,自动将自己初始化为默认状态。所设置的默认值为: u所有通用寄存器和浮点寄存器为全0; u内存清零; u流水寄存器为全0ÿ…...
javascript用localStorage存储用户搜索词记录,并在搜索框下展显搜索词记录
//首先是storage的一封装 //storage.js文件 function storage(){//设置storage密钥this.ms"mystorage";}//以下为函数的原型方法//获得localStorage值storage.prototype.getLocalfunction(key){//先检查设置的localStorage的密钥var mydatalocalStorage.getItem(thi…...
20231108在Ubuntu22.04下编译安装cmake-3.27.7.tar.gz
20231108在Ubuntu22.04下编译安装cmake-3.27.7.tar.gz 2023/11/8 17:28 缘起,编译cv180zb的时候提示说cmake的版本低! OBJCOPY platform/generic/firmware/payloads/test.bin OBJCOPY platform/generic/firmware/fw_dynamic.bin OBJCOPY platfor…...
如此理解sed会简单
缘由 以前总觉得sed的语法过于难懂,用的时间都不一定会想起来怎么用。 每次都需要先查找帮助,然后才能应用,但随后又忘 😦 直到今天通过man sed链接到sed官网上对sed的介绍,才明白它竟然是如此的简单明了࿰…...
数据库-MySQL之数据库必知必会1-9章
检索数据 1.检索不重复的行 从 Customers 表中检索所有的 ID select DISTINCT cust_id from Customers;DISTINCT表示去掉重复的行 2.限制结果-分页 SELECT语句返回所有匹配的行,它们可能是指定表中的每个行。为了返回第一行或前几行,可使用LIMIT子句。…...
JavaSec-RCE
简介 RCE(Remote Code Execution),可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景:Groovy代码注入 Groovy是一种基于JVM的动态语言,语法简洁,支持闭包、动态类型和Java互操作性,…...
【杂谈】-递归进化:人工智能的自我改进与监管挑战
递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以?
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以? 在 Golang 的面试中,map 类型的使用是一个常见的考点,其中对 key 类型的合法性 是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...
模型参数、模型存储精度、参数与显存
模型参数量衡量单位 M:百万(Million) B:十亿(Billion) 1 B 1000 M 1B 1000M 1B1000M 参数存储精度 模型参数是固定的,但是一个参数所表示多少字节不一定,需要看这个参数以什么…...
.Net框架,除了EF还有很多很多......
文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...
selenium学习实战【Python爬虫】
selenium学习实战【Python爬虫】 文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装 四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码 五、报告文件爬取5.1 提…...
【Go语言基础【13】】函数、闭包、方法
文章目录 零、概述一、函数基础1、函数基础概念2、参数传递机制3、返回值特性3.1. 多返回值3.2. 命名返回值3.3. 错误处理 二、函数类型与高阶函数1. 函数类型定义2. 高阶函数(函数作为参数、返回值) 三、匿名函数与闭包1. 匿名函数(Lambda函…...
C++.OpenGL (20/64)混合(Blending)
混合(Blending) 透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...
MinIO Docker 部署:仅开放一个端口
MinIO Docker 部署:仅开放一个端口 在实际的服务器部署中,出于安全和管理的考虑,我们可能只能开放一个端口。MinIO 是一个高性能的对象存储服务,支持 Docker 部署,但默认情况下它需要两个端口:一个是 API 端口(用于存储和访问数据),另一个是控制台端口(用于管理界面…...
