自动驾驶---苏箐对智驾产品的思考
1 前言
对于更高级别的自动驾驶,很多人都有不同的思考,方案也好,产品也罢。最近在圈内一位知名的自动驾驶专家苏箐发表了他自己对于自动驾驶未来的思考。
苏箐是地平线的副总裁兼首席架构师,同时也是高阶智能驾驶解决方案SuperDrive(HSD)的负责人。他此前在华为担任智能驾驶产品部部长,负责华为自动驾驶系统方案ADS的研发工作。苏箐在2022年10月加入地平线,并在2025年1月13日的地平线智驾科技畅想日上首次公开亮相。
2 产品的本质

以下是苏箐的发言,摘自于网络:
自动驾驶不是什么新东西,它发源自2004年的 DARPA 挑战赛,那时我们就能看到其可能性。我自己做自动驾驶,是从2012年前后开始的。当时,我看到 Google X 的两个创始人坐在一辆自动驾驶的丰田的普锐斯里,就觉得这玩意儿太酷了,它代表着未来。然后就不小心做了这么多年。
可到了今天,坦白讲,凯哥(余凯)是很乐观的,但我已经快抑郁了,因为自动驾驶真的非常难。我有很多朋友已经改行了,去做了具身智能、机器人。自动驾驶不做了,受不了了。也有不少人问我,要不要去做具身智能?我想,咱们连自动驾驶都搞不定,有什么资格做机器人?自动驾驶应该是第一个工作在物理世界和人交互的机器人,它处于半规则和半非规则的场景里。如果连这种东西都搞不定的话,去做一个非结构化的机器人是不可能的。
如果我们认清自动驾驶本身的比较对象是什么,大家就会发现这个问题比较麻烦。因为自动驾驶的比较对象不是你的竞争对手,绝对不是国内的蔚小理、华为,甚至不是特斯拉,自动驾驶的本质比较对象是人类本身,它的价值是一个拐点式的价值——他比不过人的时候,其实就是高科技的玩具;当有一天比人好的时候,价值立刻就会跳上去,也就是两段式的价值。很不幸的是,到目前为止还没有一个系统真正达到了这一拐点,我们只是看到了这个希望。所以我有时想,干了十多年,每天看到这么多问题,全世界最聪明的人花了这么多钱干这件事情,都还没过这个拐点,我有时就会很绝望。但是绝望归绝望,干了这么多年还是能看到希望,因为整个内核技术演进了5-6代以后,整套数据驱动范式起来以后,你会发现整个系统已经能看到曙光了。
你要说我们的优势和理念是什么,其实也很简单,我们并不打算和任何人比较。坦率地说,我干了这么多年,对每年出现的新概念的时髦的词已经完全没有感觉了,因为我看到像这种复杂的系统,它没有银子弹,也没有什么一招制敌的方法。你必须要有一个很Strong的工程团队,把系统和底座做得非常Solid。你要比别人有更多的经验,要比别人愿意吃更多的苦,你要持之以恒每天面对这么多问题还不崩溃,一年又一年地运作。同时,你还要保证在新的技术出现的时候,快速把它吸收进来,而且要知道它的边界是什么。
大家都知道,一个新的方法起来以后,第一天你会觉得它很美好,能解决所有的问题;第二天又会对它引起怀疑;第三天你会发现边界就在那里。每一个新方法都有这么一个过程,所以「正确的复杂系统」是不断在比较Solid的底座上,将新的方法集成进去,应用起来,不断地往前滚动,我觉得这是做大工程的经验之谈,我们现在也在做这方面的实践。
如果抛开和人类的比较,你一定要让我找一个对标对象,我还是会选择FSD,因为我确确实实觉得他们整个团队的素质和创新精神是值得让人敬佩的。我自己去试过以后,能看到他们在技术上有很多独到之处,甚至在某些地方有断代式的领先。这点不妨承认,没什么关系,我们自己从中也能学到很多新的思想和思路,至少他们已经证明了这些东西是Work,我们就要去做。
反过来说,中国的自动驾驶和美国有些地方不一样:
- 中国在目前的状态下,不可能获得特斯拉的算力。
- 中国的基建随意性比美国大太多:它有很多以通用的Common sense搞不定的东西,这是美国没有的。
- 中国的大量外卖电动车,和不守规矩的开车行为,在美国也是没有的,导致大量的博弈问题需要处理,而这恰恰是现在的数据驱动不太能有效解决的。
所以我们自己选择的是一条比较务实的道路,系统的内核完全是一段式的端到端数据驱动,但是在数据比较稀疏,短期内用更大数据量也很难收敛的时候,我们也会用一些有经验的工程师做的规则的东西,可以认为是双并行的系统,目前实践下来是最有效的。
当然做Marketing宣传的时候,你可以讲得天花乱坠:例如说是端到端、数据驱动,有各种各样的新词。但是对普通消费者来说,他上车以后5分钟能不能感觉这个东西是完全与众不同的,他可以信赖的,这样的产品才能去卖。
我到现在为止最信仰的做产品的人还是Steve jobs,我觉得真正iPhone所有的细节做到位了,没有什么漏洞,这是目前这代产品人里没有看到有谁达到他那个高度,我希望地平线的产品以这种标准去做我们自己的产品,去解决真正的问题。
现阶段,自动驾驶是高科技的玩具。它逐渐地在高速上好用了,Urban里不太好用。目前就这么个状态,它的价值是起码很多时候不用看导航那么累了,只需要让它自己认路、开车,你去监督它就可以了。这个价值还不错,但这还不够。
因为中国和美国的情况不太一样,美国人通勤几乎都是走高速,中国不是,中国一年上不了几次高速,中国的Urban问题是Critical的问题。
系统的本质问题是:到底是系统依赖人,还是人依赖系统?谁给谁兜底?
你要真的想让系统有价值,就需要在天加班很累的时候,真正能安心地将系统激活,让它帮你开,这时系统才是真正有价值的,而且超越了玩具的价值,这是我们今年要做到的目标。
讲起来的话其实就是两个点。
- 将一段式端到端的类人性做上去:其目的不是为了类人,而是要超越人——如果车辆能在你预判之前就完成了动作,这个系统才是对的,这才是我们的努力目标。
- 把车的紧急监管安全性至少提升100倍:这件事情非常难,但是我们正在做一些努力,也有了一些新的方法论线索。
这两件事情达到以后,我相信我们应该是和市场上所有的产品都不相同的产品。如果说让这么多人辛苦了这么多年,再去做一个和大家一样的东西,这不是我们这代人该做的事情。
我们应该去解决一些真正的问题,而不是天天活在营销里,我觉得中国这几年的氛围我是不太喜欢的,我觉得应该做一点正确的产品解决正确的问题。
相关文章:
自动驾驶---苏箐对智驾产品的思考
1 前言 对于更高级别的自动驾驶,很多人都有不同的思考,方案也好,产品也罢。最近在圈内一位知名的自动驾驶专家苏箐发表了他自己对于自动驾驶未来的思考。 苏箐是地平线的副总裁兼首席架构师,同时也是高阶智能驾驶解决方案SuperDri…...
python——Django 框架
Django 框架 1、简介 Django 是用python语言写的开源web开发框架,并遵循MVC设计。 Django的**主要目的是简便、快速的开发数据库驱动的网站。**它强调代码复用,多个组件可以很方便的以"插件"形式服务于整个框架,Django有许多功能…...
计算机视觉-卷积
卷积-图像去噪 一、图像 二进制 灰度 彩色 1.1二进制图像 0 1 一个点可以用一个bit(0/1)来表示 1.2灰度图像 0-255 一个点可以用一个byte来表示 1.3彩色图像 RGB 表达一个彩色图像先说它的分辨率p/w(宽)和q/h(高…...
Spring Boot 自定义属性
Spring Boot 自定义属性 在 Spring Boot 应用程序中,application.yml 是一个常用的配置文件格式。它允许我们以层次化的方式组织配置信息,并且比传统的 .properties 文件更加直观。 本文将介绍如何在 Spring Boot 中读取和使用 application.yml 中的配…...
C++ list 容器用法
C list 容器用法 C 标准库提供了丰富的功能,其中 <list> 是一个非常重要的容器类,用于存储元素集合,支持双向迭代器。<list> 是 C 标准模板库(STL)中的一个序列容器,它允许在容器的任意位置快速…...
《 C++ 点滴漫谈: 二十四 》深入 C++ 变量与类型的世界:高性能编程的根基
摘要 本文深入探讨了 C 中变量与类型的方方面面,包括变量的基本概念、基本与复合数据类型、动态类型与内存管理、类型推导与模板支持,以及类型系统的高级特性。通过全面的理论讲解与实际案例分析,展示了 C 类型系统的强大灵活性与实践价值。…...
C语言初阶牛客网刷题—— HJ34 图片整理【难度:中等】
1. 题目描述 牛客网在线OJ链接 Lily上课时使用字母数字图片教小朋友们学习英语单词,每次都需要把这些图片按照大小(ASCII码值从小到大)排列收好。请大家给Lily帮忙,通过C语言解决。 输入描述:Lily使用的图片包括 “A…...
小盒科技携手体验家,优化智能教育服务体验,打造在线教育新高度
北京小盒科技有限公司(简称“小盒科技”,由“作业盒子”更名而来)是一家专注于教育科技的公司,致力于利用人工智能、大数据等先进技术,为中小学教育提供创新的解决方案和产品。 近日,「小盒科技」携手体…...
一个简单的自适应html5导航模板
一个简单的 HTML 导航模板示例,它包含基本的导航栏结构,同时使用了 CSS 进行样式美化,让导航栏看起来更美观。另外,还添加了一些 JavaScript 代码,用于在移动端实现导航菜单的展开和收起功能。 PHP <!DOCTYPE htm…...
HttpClient学习
目录 一、概述 二、HttpClient依赖介绍 1.导入HttpClient4依赖 2.或者导入HttpClient5依赖 3.二者区别 三、HttpClient发送Get请求和Post请求测试 (一)通过HttpClient发送Get请求 (二)通过HttpClient发送Post请求 一、概述 HttpClient是 Apache 软件基金会提供的一…...
二级 二维数组3
对角线之和 题目描述 输入一个矩阵,输出右上-左下对角线上的数字和 输入 输入1个整数N。(N<10)表示矩阵有n行n列 输出 对角线的和 样例 输入复制 4 1 2 3 4 2 3 4 5 4 5 6 7 1 2 3 4 输出复制 14 #include<iostream> using namespace std; int main() {i…...
【PyTorch][chapter 29][李宏毅深度学习]Fine-tuning LLM
参考: https://www.youtube.com/watch?veC6Hd1hFvos 目录: 什么是 Fine-tune 为什么需要Fine-tuning 如何进行Fine-tune Fine-tuning- Supervised Fine-tuning 流程 Fine-tuning参数训练的常用方案 LORA 简介 示例代码 一 什么是 Fine-tune …...
javascript-es6 (一)
作用域(scope) 规定了变量能够被访问的“范围”,离开了这个“范围”变量便不能被访问 局部作用域 函数作用域: 在函数内部声明的变量只能在函数内部被访问,外部无法直接访问 function getSum(){ //函数内部是函数作用…...
数据结构——二叉树——堆(1)
今天,我们来写一篇关于数据结构的二叉树的知识。 在学习真正的二叉树之前,我们必不可少的先了解一下二叉树的相关概念。 一:树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层…...
window保存好看的桌面壁纸
1、按下【WINR】快捷键调出“运行”窗口,输入以下命令后回车。 %localappdata%\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets 2、依次点击【查看】【显示】,勾选【隐藏的项目】,然后按【CtrlA】全部…...
docker安装Redis:docker离线安装Redis、docker在线安装Redis、Redis镜像下载、Redis配置、Redis命令
一、镜像下载 1、在线下载 在一台能连外网的linux上执行docker镜像拉取命令 docker pull redis:7.4.0 2、离线包下载 两种方式: 方式一: -)在一台能连外网的linux上安装docker执行第一步的命令下载镜像 -)导出 # 导出镜像…...
98.1 AI量化开发:长文本AI金融智能体(Qwen-Long)对金融研报大批量处理与智能分析的实战应用
目录 0. 承前1. 简介1.1 通义千问(Qwen-Long)的长文本处理能力 2. 基础功能实现2.1 文件上传2.2 单文件分析2.3 多文件分析 3. 汇总代码&运行3.1 封装的工具函数3.2 主要功能特点3.3 使用示例3.4 首次运行3.5 运行结果展示 4. 注意事项4.1 文件要求4.2 错误处理机制4.3 最佳…...
【自然语言处理(NLP)】长短期记忆网络(Long - Short Term Memory,LSTM)原理和代码实现(从零实现、Pytorch实现)
文章目录 介绍长短期记忆网络(Long - Short Term Memory,LSTM)结构原理候选记忆元符号含义公式含义 记忆元符号含义公式含义 隐状态符号含义公式含义 特点应用实现 LSTMpytorch实现 个人主页:道友老李 欢迎加入社区:道…...
八股学习 微服务篇
微服务篇 常见面试内容Spring Cloud 常见组件注册中心Ribbon负载均衡策略服务雪崩 常见面试内容 Spring Cloud 常见组件 Spring Cloud有5个常见组件: Eureka/Nacos:注册中心;Ribbon:负载均衡;Feign:远程调用;Hystrix/Sentinel:服…...
TCP协议:互联网数据传输的守护者
在互联网的浩瀚海洋中,数据如同涓涓细流,无时无刻不在流动。而这些数据的稳定、可靠传输,离不开一个重要的协议——TCP(Transmission Control Protocol,传输控制协议)。TCP协议作为互联网协议族中的核心成员…...
C语言数组操作:3种移除元素方法实战对比(附LeetCode真题解析)
C语言数组操作:3种移除元素方法实战对比(附LeetCode真题解析) 在算法面试和日常编程中,数组操作是最基础也最常考察的技能点之一。移除数组中特定元素这类看似简单的任务,却能很好地检验程序员对内存管理、算法效率和…...
LightGBM实战:极速梯度提升框架的多变量时序预测深度解析
LightGBM实战:极速梯度提升框架的多变量时序预测深度解析 【免费下载链接】LightGBM microsoft/LightGBM: LightGBM 是微软开发的一款梯度提升机(Gradient Boosting Machine, GBM)框架,具有高效、分布式和并行化等特点,…...
Shopee风控算法逆向 - Unidbg补环境实战解析
1. Shopee风控算法逆向分析入门 最近在研究Shopee的风控机制时,我发现他们的Native层加密算法特别有意思。作为一个常年和移动安全打交道的开发者,今天想和大家分享下使用Unidbg模拟执行Shopee风控算法的完整过程。 Shopee作为东南亚头部电商平台&…...
为什么选择yfinance:3步实现免费金融数据获取的完整解决方案
为什么选择yfinance:3步实现免费金融数据获取的完整解决方案 【免费下载链接】yfinance Download market data from Yahoo! Finances API 项目地址: https://gitcode.com/GitHub_Trending/yf/yfinance 在金融数据分析的世界里,你是否曾为获取高质…...
FastAPI分块上传存储:对象存储集成完整指南
FastAPI分块上传存储:对象存储集成完整指南 【免费下载链接】fastapi FastAPI framework, high performance, easy to learn, fast to code, ready for production 项目地址: https://gitcode.com/GitHub_Trending/fa/fastapi 想要在FastAPI应用中实现大文件…...
libusb+zadig实战:Windows USB设备驱动快速配置指南
1. 为什么需要libusb和zadig组合? 如果你在Windows系统上开发过USB设备应用,大概率遇到过这样的场景:明明代码逻辑没问题,设备也连接正常,但程序就是无法正常访问USB设备。这种情况往往是因为Windows系统的安全机制在…...
InstructPix2Pix真实体验:保留原图结构的智能修图,到底有多好用?
InstructPix2Pix真实体验:保留原图结构的智能修图,到底有多好用? 1. 颠覆传统的修图体验 作为一名长期与图像处理打交道的技术从业者,我第一次使用InstructPix2Pix时的感受可以用"惊艳"来形容。传统的图像编辑工具需要…...
Python MCP服务部署成本飙升?5个被90%团队忽略的隐性开销及实时监控方案
第一章:Python MCP服务部署成本飙升的真相与警示Python MCP(Model Control Plane)服务在微服务架构中承担模型注册、版本调度、A/B测试路由等关键职责。近期大量团队反馈其云上部署成本在两周内激增300%以上,远超业务增长曲线。深…...
小程序原生组件层级穿透实战:cover-view与canvas的深度优化
1. 为什么需要cover-view与canvas层级穿透 在小程序开发中,原生组件的层级问题一直是让开发者头疼的难题。特别是当我们需要在canvas、video等原生组件上叠加按钮、文字提示时,普通的view组件根本无法实现预期效果。这是因为小程序的原生组件采用了特殊的…...
能耗优化指南:OpenClaw+GLM-4.7-Flash笔记本续航方案
能耗优化指南:OpenClawGLM-4.7-Flash笔记本续航方案 1. 为什么需要关注OpenClaw的能耗问题 去年夏天的一次出差经历让我深刻意识到这个问题的重要性。当时我正在高铁上用笔记本调试一个OpenClaw自动化流程,结果不到两小时就收到了电量不足的警告。这促…...
