自动驾驶---苏箐对智驾产品的思考
1 前言
对于更高级别的自动驾驶,很多人都有不同的思考,方案也好,产品也罢。最近在圈内一位知名的自动驾驶专家苏箐发表了他自己对于自动驾驶未来的思考。
苏箐是地平线的副总裁兼首席架构师,同时也是高阶智能驾驶解决方案SuperDrive(HSD)的负责人。他此前在华为担任智能驾驶产品部部长,负责华为自动驾驶系统方案ADS的研发工作。苏箐在2022年10月加入地平线,并在2025年1月13日的地平线智驾科技畅想日上首次公开亮相。
2 产品的本质
以下是苏箐的发言,摘自于网络:
自动驾驶不是什么新东西,它发源自2004年的 DARPA 挑战赛,那时我们就能看到其可能性。我自己做自动驾驶,是从2012年前后开始的。当时,我看到 Google X 的两个创始人坐在一辆自动驾驶的丰田的普锐斯里,就觉得这玩意儿太酷了,它代表着未来。然后就不小心做了这么多年。
可到了今天,坦白讲,凯哥(余凯)是很乐观的,但我已经快抑郁了,因为自动驾驶真的非常难。我有很多朋友已经改行了,去做了具身智能、机器人。自动驾驶不做了,受不了了。也有不少人问我,要不要去做具身智能?我想,咱们连自动驾驶都搞不定,有什么资格做机器人?自动驾驶应该是第一个工作在物理世界和人交互的机器人,它处于半规则和半非规则的场景里。如果连这种东西都搞不定的话,去做一个非结构化的机器人是不可能的。
如果我们认清自动驾驶本身的比较对象是什么,大家就会发现这个问题比较麻烦。因为自动驾驶的比较对象不是你的竞争对手,绝对不是国内的蔚小理、华为,甚至不是特斯拉,自动驾驶的本质比较对象是人类本身,它的价值是一个拐点式的价值——他比不过人的时候,其实就是高科技的玩具;当有一天比人好的时候,价值立刻就会跳上去,也就是两段式的价值。很不幸的是,到目前为止还没有一个系统真正达到了这一拐点,我们只是看到了这个希望。所以我有时想,干了十多年,每天看到这么多问题,全世界最聪明的人花了这么多钱干这件事情,都还没过这个拐点,我有时就会很绝望。但是绝望归绝望,干了这么多年还是能看到希望,因为整个内核技术演进了5-6代以后,整套数据驱动范式起来以后,你会发现整个系统已经能看到曙光了。
你要说我们的优势和理念是什么,其实也很简单,我们并不打算和任何人比较。坦率地说,我干了这么多年,对每年出现的新概念的时髦的词已经完全没有感觉了,因为我看到像这种复杂的系统,它没有银子弹,也没有什么一招制敌的方法。你必须要有一个很Strong的工程团队,把系统和底座做得非常Solid。你要比别人有更多的经验,要比别人愿意吃更多的苦,你要持之以恒每天面对这么多问题还不崩溃,一年又一年地运作。同时,你还要保证在新的技术出现的时候,快速把它吸收进来,而且要知道它的边界是什么。
大家都知道,一个新的方法起来以后,第一天你会觉得它很美好,能解决所有的问题;第二天又会对它引起怀疑;第三天你会发现边界就在那里。每一个新方法都有这么一个过程,所以「正确的复杂系统」是不断在比较Solid的底座上,将新的方法集成进去,应用起来,不断地往前滚动,我觉得这是做大工程的经验之谈,我们现在也在做这方面的实践。
如果抛开和人类的比较,你一定要让我找一个对标对象,我还是会选择FSD,因为我确确实实觉得他们整个团队的素质和创新精神是值得让人敬佩的。我自己去试过以后,能看到他们在技术上有很多独到之处,甚至在某些地方有断代式的领先。这点不妨承认,没什么关系,我们自己从中也能学到很多新的思想和思路,至少他们已经证明了这些东西是Work,我们就要去做。
反过来说,中国的自动驾驶和美国有些地方不一样:
- 中国在目前的状态下,不可能获得特斯拉的算力。
- 中国的基建随意性比美国大太多:它有很多以通用的Common sense搞不定的东西,这是美国没有的。
- 中国的大量外卖电动车,和不守规矩的开车行为,在美国也是没有的,导致大量的博弈问题需要处理,而这恰恰是现在的数据驱动不太能有效解决的。
所以我们自己选择的是一条比较务实的道路,系统的内核完全是一段式的端到端数据驱动,但是在数据比较稀疏,短期内用更大数据量也很难收敛的时候,我们也会用一些有经验的工程师做的规则的东西,可以认为是双并行的系统,目前实践下来是最有效的。
当然做Marketing宣传的时候,你可以讲得天花乱坠:例如说是端到端、数据驱动,有各种各样的新词。但是对普通消费者来说,他上车以后5分钟能不能感觉这个东西是完全与众不同的,他可以信赖的,这样的产品才能去卖。
我到现在为止最信仰的做产品的人还是Steve jobs,我觉得真正iPhone所有的细节做到位了,没有什么漏洞,这是目前这代产品人里没有看到有谁达到他那个高度,我希望地平线的产品以这种标准去做我们自己的产品,去解决真正的问题。
现阶段,自动驾驶是高科技的玩具。它逐渐地在高速上好用了,Urban里不太好用。目前就这么个状态,它的价值是起码很多时候不用看导航那么累了,只需要让它自己认路、开车,你去监督它就可以了。这个价值还不错,但这还不够。
因为中国和美国的情况不太一样,美国人通勤几乎都是走高速,中国不是,中国一年上不了几次高速,中国的Urban问题是Critical的问题。
系统的本质问题是:到底是系统依赖人,还是人依赖系统?谁给谁兜底?
你要真的想让系统有价值,就需要在天加班很累的时候,真正能安心地将系统激活,让它帮你开,这时系统才是真正有价值的,而且超越了玩具的价值,这是我们今年要做到的目标。
讲起来的话其实就是两个点。
- 将一段式端到端的类人性做上去:其目的不是为了类人,而是要超越人——如果车辆能在你预判之前就完成了动作,这个系统才是对的,这才是我们的努力目标。
- 把车的紧急监管安全性至少提升100倍:这件事情非常难,但是我们正在做一些努力,也有了一些新的方法论线索。
这两件事情达到以后,我相信我们应该是和市场上所有的产品都不相同的产品。如果说让这么多人辛苦了这么多年,再去做一个和大家一样的东西,这不是我们这代人该做的事情。
我们应该去解决一些真正的问题,而不是天天活在营销里,我觉得中国这几年的氛围我是不太喜欢的,我觉得应该做一点正确的产品解决正确的问题。
相关文章:

自动驾驶---苏箐对智驾产品的思考
1 前言 对于更高级别的自动驾驶,很多人都有不同的思考,方案也好,产品也罢。最近在圈内一位知名的自动驾驶专家苏箐发表了他自己对于自动驾驶未来的思考。 苏箐是地平线的副总裁兼首席架构师,同时也是高阶智能驾驶解决方案SuperDri…...

python——Django 框架
Django 框架 1、简介 Django 是用python语言写的开源web开发框架,并遵循MVC设计。 Django的**主要目的是简便、快速的开发数据库驱动的网站。**它强调代码复用,多个组件可以很方便的以"插件"形式服务于整个框架,Django有许多功能…...

计算机视觉-卷积
卷积-图像去噪 一、图像 二进制 灰度 彩色 1.1二进制图像 0 1 一个点可以用一个bit(0/1)来表示 1.2灰度图像 0-255 一个点可以用一个byte来表示 1.3彩色图像 RGB 表达一个彩色图像先说它的分辨率p/w(宽)和q/h(高…...

Spring Boot 自定义属性
Spring Boot 自定义属性 在 Spring Boot 应用程序中,application.yml 是一个常用的配置文件格式。它允许我们以层次化的方式组织配置信息,并且比传统的 .properties 文件更加直观。 本文将介绍如何在 Spring Boot 中读取和使用 application.yml 中的配…...

C++ list 容器用法
C list 容器用法 C 标准库提供了丰富的功能,其中 <list> 是一个非常重要的容器类,用于存储元素集合,支持双向迭代器。<list> 是 C 标准模板库(STL)中的一个序列容器,它允许在容器的任意位置快速…...
《 C++ 点滴漫谈: 二十四 》深入 C++ 变量与类型的世界:高性能编程的根基
摘要 本文深入探讨了 C 中变量与类型的方方面面,包括变量的基本概念、基本与复合数据类型、动态类型与内存管理、类型推导与模板支持,以及类型系统的高级特性。通过全面的理论讲解与实际案例分析,展示了 C 类型系统的强大灵活性与实践价值。…...

C语言初阶牛客网刷题—— HJ34 图片整理【难度:中等】
1. 题目描述 牛客网在线OJ链接 Lily上课时使用字母数字图片教小朋友们学习英语单词,每次都需要把这些图片按照大小(ASCII码值从小到大)排列收好。请大家给Lily帮忙,通过C语言解决。 输入描述:Lily使用的图片包括 “A…...

小盒科技携手体验家,优化智能教育服务体验,打造在线教育新高度
北京小盒科技有限公司(简称“小盒科技”,由“作业盒子”更名而来)是一家专注于教育科技的公司,致力于利用人工智能、大数据等先进技术,为中小学教育提供创新的解决方案和产品。 近日,「小盒科技」携手体…...

一个简单的自适应html5导航模板
一个简单的 HTML 导航模板示例,它包含基本的导航栏结构,同时使用了 CSS 进行样式美化,让导航栏看起来更美观。另外,还添加了一些 JavaScript 代码,用于在移动端实现导航菜单的展开和收起功能。 PHP <!DOCTYPE htm…...

HttpClient学习
目录 一、概述 二、HttpClient依赖介绍 1.导入HttpClient4依赖 2.或者导入HttpClient5依赖 3.二者区别 三、HttpClient发送Get请求和Post请求测试 (一)通过HttpClient发送Get请求 (二)通过HttpClient发送Post请求 一、概述 HttpClient是 Apache 软件基金会提供的一…...

二级 二维数组3
对角线之和 题目描述 输入一个矩阵,输出右上-左下对角线上的数字和 输入 输入1个整数N。(N<10)表示矩阵有n行n列 输出 对角线的和 样例 输入复制 4 1 2 3 4 2 3 4 5 4 5 6 7 1 2 3 4 输出复制 14 #include<iostream> using namespace std; int main() {i…...

【PyTorch][chapter 29][李宏毅深度学习]Fine-tuning LLM
参考: https://www.youtube.com/watch?veC6Hd1hFvos 目录: 什么是 Fine-tune 为什么需要Fine-tuning 如何进行Fine-tune Fine-tuning- Supervised Fine-tuning 流程 Fine-tuning参数训练的常用方案 LORA 简介 示例代码 一 什么是 Fine-tune …...

javascript-es6 (一)
作用域(scope) 规定了变量能够被访问的“范围”,离开了这个“范围”变量便不能被访问 局部作用域 函数作用域: 在函数内部声明的变量只能在函数内部被访问,外部无法直接访问 function getSum(){ //函数内部是函数作用…...

数据结构——二叉树——堆(1)
今天,我们来写一篇关于数据结构的二叉树的知识。 在学习真正的二叉树之前,我们必不可少的先了解一下二叉树的相关概念。 一:树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层…...

window保存好看的桌面壁纸
1、按下【WINR】快捷键调出“运行”窗口,输入以下命令后回车。 %localappdata%\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets 2、依次点击【查看】【显示】,勾选【隐藏的项目】,然后按【CtrlA】全部…...

docker安装Redis:docker离线安装Redis、docker在线安装Redis、Redis镜像下载、Redis配置、Redis命令
一、镜像下载 1、在线下载 在一台能连外网的linux上执行docker镜像拉取命令 docker pull redis:7.4.0 2、离线包下载 两种方式: 方式一: -)在一台能连外网的linux上安装docker执行第一步的命令下载镜像 -)导出 # 导出镜像…...

98.1 AI量化开发:长文本AI金融智能体(Qwen-Long)对金融研报大批量处理与智能分析的实战应用
目录 0. 承前1. 简介1.1 通义千问(Qwen-Long)的长文本处理能力 2. 基础功能实现2.1 文件上传2.2 单文件分析2.3 多文件分析 3. 汇总代码&运行3.1 封装的工具函数3.2 主要功能特点3.3 使用示例3.4 首次运行3.5 运行结果展示 4. 注意事项4.1 文件要求4.2 错误处理机制4.3 最佳…...

【自然语言处理(NLP)】长短期记忆网络(Long - Short Term Memory,LSTM)原理和代码实现(从零实现、Pytorch实现)
文章目录 介绍长短期记忆网络(Long - Short Term Memory,LSTM)结构原理候选记忆元符号含义公式含义 记忆元符号含义公式含义 隐状态符号含义公式含义 特点应用实现 LSTMpytorch实现 个人主页:道友老李 欢迎加入社区:道…...

八股学习 微服务篇
微服务篇 常见面试内容Spring Cloud 常见组件注册中心Ribbon负载均衡策略服务雪崩 常见面试内容 Spring Cloud 常见组件 Spring Cloud有5个常见组件: Eureka/Nacos:注册中心;Ribbon:负载均衡;Feign:远程调用;Hystrix/Sentinel:服…...
TCP协议:互联网数据传输的守护者
在互联网的浩瀚海洋中,数据如同涓涓细流,无时无刻不在流动。而这些数据的稳定、可靠传输,离不开一个重要的协议——TCP(Transmission Control Protocol,传输控制协议)。TCP协议作为互联网协议族中的核心成员…...
零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?
一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...
PHP和Node.js哪个更爽?
先说结论,rust完胜。 php:laravel,swoole,webman,最开始在苏宁的时候写了几年php,当时觉得php真的是世界上最好的语言,因为当初活在舒适圈里,不愿意跳出来,就好比当初活在…...

【配置 YOLOX 用于按目录分类的图片数据集】
现在的图标点选越来越多,如何一步解决,采用 YOLOX 目标检测模式则可以轻松解决 要在 YOLOX 中使用按目录分类的图片数据集(每个目录代表一个类别,目录下是该类别的所有图片),你需要进行以下配置步骤&#x…...
unix/linux,sudo,其发展历程详细时间线、由来、历史背景
sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...
HTML前端开发:JavaScript 常用事件详解
作为前端开发的核心,JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例: 1. onclick - 点击事件 当元素被单击时触发(左键点击) button.onclick function() {alert("按钮被点击了!&…...

深度学习习题2
1.如果增加神经网络的宽度,精确度会增加到一个特定阈值后,便开始降低。造成这一现象的可能原因是什么? A、即使增加卷积核的数量,只有少部分的核会被用作预测 B、当卷积核数量增加时,神经网络的预测能力会降低 C、当卷…...
【Elasticsearch】Elasticsearch 在大数据生态圈的地位 实践经验
Elasticsearch 在大数据生态圈的地位 & 实践经验 1.Elasticsearch 的优势1.1 Elasticsearch 解决的核心问题1.1.1 传统方案的短板1.1.2 Elasticsearch 的解决方案 1.2 与大数据组件的对比优势1.3 关键优势技术支撑1.4 Elasticsearch 的竞品1.4.1 全文搜索领域1.4.2 日志分析…...

Neko虚拟浏览器远程协作方案:Docker+内网穿透技术部署实践
前言:本文将向开发者介绍一款创新性协作工具——Neko虚拟浏览器。在数字化协作场景中,跨地域的团队常需面对实时共享屏幕、协同编辑文档等需求。通过本指南,你将掌握在Ubuntu系统中使用容器化技术部署该工具的具体方案,并结合内网…...

【Linux】Linux安装并配置RabbitMQ
目录 1. 安装 Erlang 2. 安装 RabbitMQ 2.1.添加 RabbitMQ 仓库 2.2.安装 RabbitMQ 3.配置 3.1.启动和管理服务 4. 访问管理界面 5.安装问题 6.修改密码 7.修改端口 7.1.找到文件 7.2.修改文件 1. 安装 Erlang 由于 RabbitMQ 是用 Erlang 编写的,需要先安…...

若依登录用户名和密码加密
/*** 获取公钥:前端用来密码加密* return*/GetMapping("/getPublicKey")public RSAUtil.RSAKeyPair getPublicKey() {return RSAUtil.rsaKeyPair();}新建RSAUti.Java package com.ruoyi.common.utils;import org.apache.commons.codec.binary.Base64; im…...