【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲
在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容:
对自动驾驶行业的看法
自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自动驾驶到现在已经快抑郁了,很多优秀的同学都改行了,去做具身智能机器人。他认为自动驾驶是第一个在物理世界跟人交互的机器人,是在一个半规则和半非规则的场景里面的东西,如果连自动驾驶都搞不定,去做完全是非结构化的机器人是不可能的。
自动驾驶的价值拐点:苏箐认为自动驾驶系统的竞争对手是人类本身,其价值是一个拐点式的价值。当自动驾驶比不过人的时候,它就是高科技的玩具;当有一天比人好的时候,其价值立刻就会跳上去。到目前为止,还没有一个系统真正达到了这个拐点。
对行业现状的批评:苏箐直言不讳地表示,他不太喜欢中国智能驾驶行业这几年的氛围。他认为智驾行业应该做一点正确的产品,解决一些正确的问题,而不是天天活在营销里面。
对特斯拉的评价
苏箐坦率地表示,如果抛开跟人类的比较,今天一定要让他找个对标对象,他还是会选特斯拉FSD。他认为特斯拉在技术方面有很多独到之处,甚至在某些地方有断代式的领先。他从特斯拉身上学到了很多新的思想和思路。
地平线的目标与技术路线
2025年的目标:苏箐透露,地平线今年的目标有两个,一个是用一段式的端到端把类人做上去,第二是把车辆紧急接管安全性至少要提升100倍。他们相信,只有解决了这些问题,才能打造出与众不同的产品。
技术路线的选择:地平线在自动驾驶系统的内核上采用了完全的端到端数据驱动方法。但在数据稀疏、难以快速收敛的情况下,也会制定相应的规则来确保系统的便利性和有效性。此外,地平线还推出了最新的智能驾驶解决方案HSD,这套方案能够应对各种复杂的交通场景,包括在狭窄城区道路掉头等难例场景。
对中国自动驾驶市场的理解
苏箐认为,中国自动驾驶面临特殊挑战,如基建随意性、外卖行为不守规矩等。因此,地平线选择了一条务实的道路,根据中国国情进行自主研发。他强调,一个真正有价值的自动驾驶系统,应该能够在用户感到疲劳或不安全时,提供可靠的驾驶辅助,让用户能够放心地将驾驶任务交给系统。
备注
转微博@高飞的文章,作为参考
#模型时代# 地平线首席架构师苏箐关于自动驾驶的“苦涩的教训”
昨天我参加了一下地平线智驾科技畅想日的活动,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)首次在媒体面前公开露面,并做了一段即兴演讲。讲的时间不长,但非常诚恳深刻。
他说“谈到(完美的自动驾驶),十多年过去了,全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望”;而谈到解决方案,又讲“我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的;所以,结论是:”复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进“。
他讲到结论的时候,我就突然想到了Rich Sutton在2019年3月发表的名篇《The Bitter Lesson》,这篇文章的核心论点可以概括为一个深刻而"苦涩"的历史教训:在AI研究历史上,基于通用方法(利用计算能力的搜索和学习)的方案,最终总是战胜基于人类知识和智慧的特定方法。这个模式在计算机视觉、围棋、语音识别、机器翻译等多个领域反复上演。
所以,Rich Sutton说,“科学家的专业知识和智慧似乎不如简单的暴力计算更有价值”。虽然苏箐的看法是,国内的现实情况让业界无法用存粹的暴力算力数据堆叠,但两者都提到了这个领域没有“灵丹妙药”。既然如此,苏这句“一个强大的工程团队敢于干一些苦活累活优化前进”,某种程度上,也是一种苦涩的教训吧。
文字是现场记录,未经本人确认,仅供参考(其实我认为地平线的算法实际上有非常重要的优势,几年前的芯片架构设计就考虑了Transformer,苏的观点就有一些自谦的成分在):
1、说到今天的感受,我是既乐观又困惑。自动驾驶确实非常难,我有很多优秀的朋友已经改行去做别的事情了。
自动驾驶不是什么新东西了。自动驾驶的整个发展应该是从2004年的DARPA Project开始,从那个时候我们就看到了自动驾驶的可能性。我自己开始做这个是在2012年、2013年左右。
有不少人问我要不要去做机器人,但我想,我们连自动驾驶都还没搞定,怎么去做机器人呢?其实自动驾驶应该是第一个在物理世界中与人交互的机器人,它存在于一个半规则化的环境中。如果连这个都搞不定,去做一个完全非结构化环境下的机器人是不可能的。
2、自动驾驶的真正比较对象不是竞争对手,不是国内的蔚小鹏、华为或其他公司,而是人类本身。
它的价值是一个拐点式的价值:在比不过人的时候,它就是一个高科技的玩具;只有在某一天比人好的时候,它才会形成一个质变式的价值。但可惜的是,到目前为止还没有一个系统真正达到了这个拐点。
3、十多年过去了,看着全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望。但是在绝望中依然能看到希望,因为经过五到六代核心技术的演进,整个系统确实能看到曙光。
说到我们的优势和理念,其实很简单,我并不打算去跟任何人比较。我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的。
4、复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进。我觉得这是做大型工程的一个经验之谈。
"说到自动驾驶的竞争,坦白说如果今天让我选择一个竞争对手的话,我还是会选择特斯拉FSD。因为美国团队的整体素质和创新经验确实值得敬佩。我自己实践后发现,他们在技术上确实存在一些不足,但这只是暂时的。我们也从中学到了很多新的思想和思路,至少他们已经证明了一些技术路线是可持续的,甚至在某些部分有断代式的领先。
5、但是说到中国的自动驾驶要跟美国做一样的事情,这是不现实的。
首先,在目前状况下,中国不可能投入像特斯拉那样的算力,无论是从经济还是政策角度都不可能。其次,中国的基建和道路条件与美国有很大差异。更重要的是,中国还面临着电动车不遵守交通规则等特殊问题,这导致了大量需要处理的博弈问题,而这些是现在的深度学习还不能完全解决的。
6、所以我们选择了一条比较务实的道路。我们的系统采用完全端到端的深度学习方法,但在一些数据比较稀疏、比较难处理,或者因为混杂数据难以收敛的情况下,我们也会让有经验的工程师去做一些规则设计,就是采用两种技术并行的方式。这在目前来看是最有效的方案。
当然,在做市场营销时,我们可以讲得天花乱坠,但对于普通消费者来说很简单,他上车后能够感觉到这个系统是可靠的,这才是最重要的。我到现在最推崇的产品仍然是Steve Jobs时代的iPhone,它在所有细节上都做到了极致,没有明显的弱点。目前这一代产品还没有看到谁能达到那个高度。我希望在我们这个产品中,能专注于解决真正的问题,而不是一味追求营销效果。
7、如果要谈自动驾驶的价值演进,我觉得可以分为三个阶段:第一个阶段是高科技的玩具,仅仅是噱头;第二个阶段是在高速公路上好用,虽然在城市道路上还不太理想,但起码在高速上开车时不用那么累了,只需要让它自己行驶就可以。虽然这个价值还不够高,但已经有一定意义了。不过这里要注意中美的差异:美国人上下班基本都走高速,而中国不是,中国的城市交通问题更复杂,是一个网格化的问题。
8、自动驾驶系统的本质问题是:到底是系统依赖人,还是人依赖系统?如果你想让这个系统真正产生价值,就要考虑这样的场景:当人们加班很累,感觉自己开车不太安全的时候,能否完全信任这个系统来接管驾驶?这才是系统真正的价值所在,它超越了单纯的功能价值。这也是我们正在努力要做到的方向。
9、说到底,我认为有两个关键点:第一是类人性,不好意思我提到这个词。但类人性的目的不是为了模仿人类,因为人开车时本来就不是预防性驾驶。比如今天我们看到一个系统在处理车辆变道时,你会观察到它’在思考要不要变道’,然后才做出动作,这其实已经不太对了。如果你完全感觉不到这个车辆在你的预判之前就已经把动作做完了,这个系统才是真正做对了。这是我们追求的目标。
第二个是要提升整个车辆的紧急避险安全性。这件事情非常难,但随着自动驾驶技术的推进,我们也发现了一些新的方法和线索。只有这两件事情都做到位了,我相信我们的产品才能在市场上真正与众不同。
10、坦白说,这么多人辛苦了这么多年,如果只是去做一个用来营销的东西,这不是我们应该做的事情。我们应该去解决实际的问题,而不是天天活在营销中。我个人不太喜欢中国这几年的氛围,我觉得我们应该做一些真正有价值的产品,尽管这很难。
相关文章:
【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲
在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容: 对自动驾驶行业的看法 自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自…...
QILSTE H11-D212HRTCG/5M高亮红绿双色LED灯珠 发光二极管LED
型号:H11-D212HRTCG/5M,一款由QILSTE(HongKong)Technology Co., Ltd精心打造的高亮度红绿双色LED产品,其尺寸仅为2.01.251.1 mm,却蕴含着强大的光电特性。这款产品采用透明平面胶体封装,不仅外观…...
2️⃣java基础进阶——多线程、并发与线程池的基本使用
一、概念介绍 什么是线程,什么是进程,两者有什么关系? 进程是操作系统资源分配的独立单位;而线程是操作系统能够进行调度和分派的最小单位;线程包含于进程之中,是进程中的实际运作单位。 例如:…...
RAG多路召回
什么是多路召回? 多路召回(Multi-Route Retrieval) 是指在信息检索系统中,为了提升检索的全面性和准确性,通过多条不同的检索路径或不同的检索策略来获取信息的技术。多路召回的核心思想是,单一的检索路径…...
复杂 C++ 项目堆栈保留以及 eBPF 性能分析
在构建和维护复杂的 C 项目时,性能优化和内存管理是至关重要的。当我们面对性能瓶颈或内存泄露时,可以使用eBPF(Extended Berkeley Packet Filter)和 BCC(BPF Compiler Collection)工具来分析。如我们在Red…...
网安——计算机网络基础
一、计算机网络概述 1、Internet网相关概念及发展 网络(Network)有若干结点(Node)和连接这些结点的链路(link)所组成,在网络中的结点可以是计算机、集线器、交换机或路由器等多个网络还可以通…...
ZCC1923替代BOS1921Piezo Haptic Driver with Digital Front End
FEATURES • High-Voltage Low Power Piezo Driver o Drive 100nF at 190VPP and 250Hz with 490mW o Drives Capacitive Loads up to 1000nF o Energy Recovery o Differential Output o Small Solution Footprint, QFN & WLCSP • Low Quiescent Current: SHUTDOWN; …...
Kutools for Excel 简体中文版 - 官方正版授权
Kutools for Excel 是一款超棒的 Excel 插件,就像给你的 Excel 加了个超能助手。它有 300 多种实用功能,现在还有 AI 帮忙,能把复杂的任务变简单,重复的事儿也能自动搞定,不管是新手还是老手都能用得顺手。有了它&…...
PostgreSQL和MySQL有什么区别?
一、数据存储与管理方面 数据类型支持 PostgreSQL: 提供了非常丰富的数据类型。除了基本的整数、浮点数、字符、日期等类型外,对复杂数据类型的支持很出色。例如,它原生支持数组(Array)类型,可以方便地存储…...
比较之舞,优雅演绎排序算法的智美篇章
大家好,这里是小编的博客频道 小编的博客:就爱学编程 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!! 本文目录 引言正文一、冒泡排序:数据海…...
C语言数据结构与算法(排序)详细版
大家好,欢迎来到“干货”小仓库!! 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!无人扶我青云志,我自踏雪至山巅!!&am…...
JAVA:利用 RabbitMQ 死信队列实现支付超时场景的技术指南
1、简述 在支付系统中,订单支付的超时自动撤销是一个非常常见的业务场景。通常用户未在规定时间内完成支付,系统会自动取消订单,释放相应的资源。本文将通过利用 RabbitMQ 的 死信队列(Dead Letter Queue, DLQ)来实现…...
pytest+request+yaml+allure搭建低编码调试门槛的接口自动化框架
接口自动化非常简单,大致分为以下几步: 准备入参调用接口拿到2中response,继续组装入参,调用下一个接口重复步骤3校验结果是否符合预期 一个优秀接口自动化框架的特点: 【编码门槛低】,又【能让新手学到…...
Elasticsearch实战指南:从入门到高效使用
Elasticsearch实战指南:从入门到高效使用 1. 引言:Elasticsearch是什么? Elasticsearch是一个分布式、RESTful风格的搜索和分析引擎,广泛应用于全文搜索、日志分析、实时数据分析等场景。它的核心特点包括: 高性能&…...
Open FPV VTX开源之嵌入式OSD配置
Open FPV VTX开源之嵌入式OSD配置 1. 源由2. 安装3. 配置步骤一:备份/etc/telemetry.conf步骤二:修改/etc/telemetry.conf步骤三:配置时区步骤四:重启摄像头 4. 实测5. 参考资料 1. 源由 穿越机模拟图传延迟通常在10ms左右。 最…...
2Hive表类型
2Hive表类型 1 Hive 数据类型2 Hive 内部表3 Hive 外部表4 Hive 分区表5 Hive 分桶表6 Hive 视图 1 Hive 数据类型 Hive的基本数据类型有:TINYINT,SAMLLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE&a…...
计算机网络之---公钥基础设施(PKI)
公钥基础设施 公钥基础设施(PKI,Public Key Infrastructure) 是一种用于管理公钥加密的系统架构,它通过结合硬件、软件、策略和标准来确保数字通信的安全性。PKI 提供了必要的框架,用于管理密钥对(包括公钥…...
EF Core执行原生SQL语句
目录 EFCore执行非查询原生SQL语句 为什么要写原生SQL语句 执行非查询SQL语句 有SQL注入漏洞 ExecuteSqlInterpolatedAsync 其他方法 执行实体相关查询原生SQL语句 FromSqlInterpolated 局限性 执行任意原生SQL查询语句 什么时候用ADO.NET 执行任意SQL Dapper 总…...
GaussDB分布式数据倾斜处理
常规数据倾斜巡检 在库中表个数少于1W的场景,直接使用倾斜视图查询当前库内所有表的数据倾斜情况 SELECT * FROM pgxc_get_table_skewness ORDER BY totalsize DESC;在库中表个数非常多(至少大于1W)的场景,因PGXC_GET_TABLE_SKEWN…...
代码随想录Day34 | 62.不同路径,63.不同路径II,343.整数拆分,96.不同的二叉搜索树
代码随想录Day34 | 62.不同路径,63.不同路径II,343.整数拆分,96.不同的二叉搜索树 62.不同路径 动态规划第二集: 比较标准简单的一道动态规划,状态转移方程容易想到 难点在于空间复杂度的优化,详见代码 class Solution {public int uniq…...
PHP和Node.js哪个更爽?
先说结论,rust完胜。 php:laravel,swoole,webman,最开始在苏宁的时候写了几年php,当时觉得php真的是世界上最好的语言,因为当初活在舒适圈里,不愿意跳出来,就好比当初活在…...
将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
Otsu 是一种自动阈值化方法,用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理,能够自动确定一个阈值,将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...
Frozen-Flask :将 Flask 应用“冻结”为静态文件
Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是:将一个 Flask Web 应用生成成纯静态 HTML 文件,从而可以部署到静态网站托管服务上,如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...
相机从app启动流程
一、流程框架图 二、具体流程分析 1、得到cameralist和对应的静态信息 目录如下: 重点代码分析: 启动相机前,先要通过getCameraIdList获取camera的个数以及id,然后可以通过getCameraCharacteristics获取对应id camera的capabilities(静态信息)进行一些openCamera前的…...
PL0语法,分析器实现!
简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...
JDK 17 新特性
#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持,不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的ÿ…...
什么是Ansible Jinja2
理解 Ansible Jinja2 模板 Ansible 是一款功能强大的开源自动化工具,可让您无缝地管理和配置系统。Ansible 的一大亮点是它使用 Jinja2 模板,允许您根据变量数据动态生成文件、配置设置和脚本。本文将向您介绍 Ansible 中的 Jinja2 模板,并通…...
【7色560页】职场可视化逻辑图高级数据分析PPT模版
7种色调职场工作汇报PPT,橙蓝、黑红、红蓝、蓝橙灰、浅蓝、浅绿、深蓝七种色调模版 【7色560页】职场可视化逻辑图高级数据分析PPT模版:职场可视化逻辑图分析PPT模版https://pan.quark.cn/s/78aeabbd92d1...
DingDing机器人群消息推送
文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人,点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置,详见说明文档 成功后,记录Webhook 2 API文档说明 点击设置说明 查看自…...
RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
视觉语言模型(Vision-Language Models, VLMs),为真实环境中的机器人操作任务提供了极具潜力的解决方案。 尽管 VLMs 取得了显著进展,机器人仍难以胜任复杂的长时程任务(如家具装配),主要受限于人…...
