自动驾驶的一些大白话讲解
无人驾驶牛逼吗?我来帮你祛魅【原理+缺陷解析】_哔哩哔哩_bilibili
5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术… - 雪球 (xueqiu.com)
到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术最重要的路线变化。这将会真正为自动驾驶体验带来质的飞跃和改变,并以此为标尺,我们能够很容易判断各家车企的自动驾驶技术领先程度。
当前的所谓自动驾驶系统,本质上就是一个规则执行器,它的基本工作原理是拿路上遇到的实际情况与人工提前写好的规则去比对,匹配上就按规则执行,匹配不上的话系统就提示接管自动退出。打个比方,比如说系统想要自动变道,会感知目标车道后侧车辆距离和速度,如果满足条件就发起变道,不满足就继续等待机会。这是一个很简单的办法,也非常容易理解它的工作机制。我们今天看到的所有车辆辅助驾驶功能,采用的都是这种规则检查-匹配-执行/放弃的方法。这里产生了第一个问题,这么看似乎自动驾驶没什么难度呀?目前的核心难点,其实在于感知层面。就是前面举例中提到的对于车辆的检测、速度和距离的判断。更难的还有比如说对于道路、车道线、绿化带的感知和判断,难度再提升一点,就是对人、对非机动车、对异性障碍物的判断和检测。感知部分才是最难的,不仅要识别,还要精准识别和快速识别,才能提供系统足够的信息去和规则设定的情况比对。我们现在常常听到的占用网络、BEV等等概念,目的都是为了更好的感知环境和路上的事物。
再进一步,我可以解释一下为何以前的视频里我会说华为在智驾的领先并非技术路线的领先,而仅仅是工程进度上的领先。因为在当下的自动驾驶技术路线里,国内所有车企都基本一致。唯一能比对的两个环节,一个是感知层面是不是能做到更精准、更多样、更快速的识别,另一个是决策层面规则是不是足够丰富来覆盖更多情况而不至于让系统总是提示接管。决策规则我们很容易想到的,就是看我们设想和写下来的规则够不够多,没什么技术含量。真正多少有点差别的其实是感知层面,但目前来看头部几家车企差别也很小。有一个指标可以判断技术是不是领先,就是纯视觉占用网络的OTA。目前全世界仅有两家车企上车了纯视觉占用网络技术,一家叫特斯拉,一家叫极越。现在听到的消息是小鹏会在今年中升级,其它家还没有太多信息。但是总的来说,头部剩下的几家包括华为、理想、蔚来应该也会在今年推送升级。所以总结来看,中国目前头部自动驾驶企业,当下看就是前面提到的这四五家。其中华为是不是遥遥领先,至少我理解里并不是。几家的技术差异很大吗?我看也并不是。
今天要说的自动驾驶端到端系统,其实是下一代自动驾驶技术。所谓的端到端系统,就是抛弃了前面提到的规则匹配的方法来确定如何决策。什么叫抛弃规则呢?就是我们不再需要人工写好一条条的情况去比对,而是让系统真正自己去学习判断如何处理。那它到底是怎么实现的呢?其实就是运用了大模型技术。什么是大模型技术呢?讲人话就是让系统自己去找规律,从海量的驾驶案例中去找规律。比如说前段时间最火的Chat-GPT,本质上就是一个找规律的系统,只是它的领域是在文字方面。从海量的互联网文字内容里去学习文字之间的关系和规律,从而能生成非常流畅的对话和内容。技术人员们写好一个学习系统,这里面设置了一些需要系统去重点关注的地方,也就是所谓的大模型参数。等于说告诉系统,要从这些地方去找规律。
自动驾驶的端到端系统也是一样的,从摄像头收集到的海量数据中,去学习人在面对各种路况时候的行为和决策,找到其中的规律并以此来决策。这样的端到端系统有什么好处呢,第一个明显的好处就是系统由于天量的参数,能够关注到的细节是更多的。比如Chat-GPT4的系统参数是数千亿个,也就是说拆分到最细的地方,整个学习系统能关注上千亿个细节。当然这个说法并不是很准确,因为大部分其中的细节是经过系统抽象以后的细节。所以总的来说,端到端的自动驾驶系统比起人类手写的规则能关注到更多的细节以后,从而找到更符合实际情况的应对策略。并不会死板的去比对规则,僵硬的执行。对于很多极端场景来说,只要我们的训练数据足够,是可以更好的应对的。
当然,端到端系统也不是一蹴而就的,目前从行业技术发展来看,会分为两个阶段了来实现。一个部分是感知层面的端到端,另一个是决策层面的端到端。所谓感知的端到端,就是输入数据后系统自动学习物体规律,识别并标记,后续的决策依然采用人工规则。所谓的决策端到端,就是感知部分还是按照之前的学习办法去处理,只是应对各种条件决策的时候,才去找规律。逻辑上来说这两部分应该是可以独立开的,所以今年国内车企上线的端到端系统,有可能只包含了其中的一部分。
所以我们今年判断哪家车企技术更领先一点,就看哪家的系统先升级端到端的功能,这个标准就很清晰了。目前特斯拉FSD V12版本已经在感知层面和决策层面都统一了端到端系统,也就是没有了任何人工规则来判断是什么,也没有任何人工规则来判断应该怎么做。全部都是系统通过自动学习数据找到规律后自行处理。这也是为什么马斯克会说新系统的代码数量大幅减少,因为不再需要人去一条一条的假设场景,写出规则引导系统决策。
最后我想说的是,初期上线的端到端系统,甚至于有可能体验还不如之前的人工规则系统。但是我们内心一定要清楚,端到端绝对是自动驾驶的下一步技术路线。只要有足够的数据、足够的算力以及足够的大模型质量,最终的驾驶体验,一定会全面超越之前的规则系统。
为什么说自动驾驶的端到端技术是弯道超车的机会呢?打个比方,有的车企起步早,在感知和决策规则的代码数量都要远远多于后面加入的车企,后面的要赶上必须加大人力、财力、时间的投入才有机会。但技术路线切换到端到端系统后,前面的积累基本作废了,大家都从一个新的方法上重新起跑,所以对于后来者有了弯道超车的机会。当然除了技术路线切换外,企业本身的工程能力、管理能力、技术底子还是一切问题的基础,只有这些基础都和对手在一个水平上,才谈得上有弯道赶超的机会。
相关文章:

自动驾驶的一些大白话讲解
无人驾驶牛逼吗?我来帮你祛魅【原理缺陷解析】_哔哩哔哩_bilibili 5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间&…...

Python学习笔记--参数
目录 实参与形参 不定长参数 拆分参数列表 返回值 实参与形参 1. 定义函数时,带默认值的形参必须放在不带默认值的形参后面 下面程序的输出结果是( )。 def StudentInfo(country中国,name): print(%s,%s%(name,country)…...

刷题——大数加法
大数加法_牛客题霸_牛客网 string solve(string s, string t) {if(s.size() < t.size()) return solve(t, s);reverse(s.begin(), s.end());reverse(t.begin(), t.end());string ans;int d 0;//进位制for(int i0; i < s.size(); i){d s[i] - 0;//取得数字值if(i < …...

Pytorch人体姿态骨架生成图像
ControlNet是一个稳定扩散模型,可以复制构图和人体姿势。ControlNet解决了生成想要的确切姿势困难的问题。 Human Pose使用OpenPose检测关键点,如头部、肩膀、手的位置等。它适用于复制人类姿势,但不适用于其他细节,如服装、发型和…...

前端面试常考的HTML标签知识!!!
语义标签 标签名语义描述header网页头部网页的主要头部区域nav网页导航网页的导航链接区域footer网页底部网页的底部区域aside网页侧边栏网页的侧边栏区域section网页区块网页的独立区块 | article | 网页文章 | 网页的独立文章区域 | 字符实体 作用:在网页中显…...

Oracle触发器
Oracle触发器就是特定事件发生时自动执行的存储过程。 触发器基本使用 基本语法: create [or replace] trigger 触发器名称 alter | before | instead of [insert] [[or] update [of 列1,列2,...]] [[or] delete] on 表名 [referencing {OLD [as] old / NEW [as]…...

GPT-5:未来已来,我们如何共舞于智能新纪元?
GPT-5:未来已来,我们如何共舞于智能新纪元? 在科技日新月异的今天,人工智能(AI)的每一次飞跃都深刻地改变着人类社会的面貌。从AlphaGo击败围棋世界冠军,到GPT系列模型引领自然语言处理&#x…...

2024年6月 青少年机器人技术等级考试理论综合试卷(五级)
202406 青少年等级考试机器人理论真题五级 第 1 题 ESP32 for Arduino,通过引脚2读取按键开关的返回值,电路如下图所示,程序pinMode(2, mode);中,参数mode的值是?( ) A:INPUT B&…...

【Go】 HTTP编程3-路由httprouter
HttpRouter httprouter httprouter是第三方的库,不是go的标准库,使用命令 go get -u github.com/julienschmidt/httprouter ,下载该模块,-u表示如果已经下载但更新到最新版本Router 实现了http.Handler接口,为各种 re…...

Spring Boot 整合 SA-Token 使用详解
Spring Boot 整合 SA-Token 使用详解 在现代Web开发中,用户认证与授权是构建安全应用的基础。SA-Token是一个轻量级的Java权限认证框架,它以其简洁的API设计、高效的执行效率以及丰富的功能特性,成为了众多开发者在Spring Boot项目中实现用户…...

1.3 C 语言入门实战:从 Hello World 到基础语法解析
目录 1 程序的作用 2 初识 Hello World 2.1 新建项目 2.2 程序解释 3 printf 的作用 4 注释及其注意事项 4.1 单行注释 4.2 多行注释 4.3 嵌套错误 5 项目在磁盘上的位置 1 程序的作用 如下图所示,我们编写了一个可以做加法的程序,我们给程序…...

一文读懂什么是Go语言goroutine
1. 进程、线程和协程的区别 进程: 进程是具有一定独立功能的程序,进程是系统资源分配和调度的最小单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换…...

计算机毕业设计 农家乐管理平台 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试
🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…...

Spring Boot优缺点
Spring Boot 是一款用于简化Spring应用开发的框架,它集成了大量常用的框架和工具,大大简化了Spring项目的配置和部署。下面是Spring Boot的优缺点: 优点: 简化配置:Spring Boot自动配置功能可以根据应用的依赖自动配…...

Android Studio中创建apk签名文件
本文以macOS中Android Studio 2021.1.1版本为例介绍创建apk签名文件的操作步骤: 1.启动Android Studio,并打开一个Android项目。 2.依次点击菜单:Build -> Generate Signed Bundle / APK...。 3.在弹出的"Generate Signed Bundle or …...

CRC32 JAVA C#实现
项目中用到CRC32进行校验得地方,需要用到C#和java进行对比: 一、C#实现: class CRC32Cls { protected ulong[] Crc32Table; //生成CRC32码表 public void GetCRC32Table() { ulong Crc; …...

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用 有了前面几篇文章的铺垫,现在已经可以实现我到手测试那一步的 1.解读usb_websocket_display.launch.py 首先进入这个目录/root/dev_ws/src/origincar/originca…...

深入学习小程序第二天:事件处理与用户交互
一、概念 1. 事件绑定与类型 在小程序中,通过在组件上添加特定的属性(如 bind 开头的属性)来绑定事件处理函数,以响应用户的交互操作。常见的事件类型包括触摸事件、表单事件和系统事件: 触摸事件:用于响…...

操作系统快速入门(一)
😀前言 本篇博文是关于操作系统的,希望你能够喜欢 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大家,您的满意是我的动力😉&…...

Spring Cloud微服务性能优化:策略、实践与未来趋势
标题:Spring Cloud微服务性能优化:策略、实践与未来趋势 摘要 在微服务架构中,服务调用链路的性能优化是确保系统高效运行的关键。Spring Cloud作为微服务架构的主流实现之一,提供了多种工具和方法来优化服务间的调用。本文将深…...

秒懂C++之多态
目录 一. 多态的概念 二. 多态的定义及实现 多态的构成条件 虚函数重写的例外 协变(基类与派生类虚函数返回值类型不同) 析构函数的重写(基类与派生类析构函数的名字不同) 练习例题 final override 重载、覆盖(重写)、隐藏(重定义)的对比 三. 抽象类 四. 多态的原理…...

C语言:求最大数不用数组
(1)题目: 输入一批正数用空格隔开,个数不限,输入0时结束循环,并且输出这批整数的最大值。 (2)代码: #include "stdio.h" int main() {int max 0; // 假设输入…...

零门槛成为HelpLook推荐官,邀好友加入,奖励享不停!
什么!? 还有谁不知道HelpLook推荐官计划! 只需要简单地注册加入 在好友成功订阅套餐之后 可一次性获得20%的丰厚现金返佣 HelpLook是一款快速搭建AI知识库的系统,并帮助企业0代码搭建帮助中心、FAQs、SOPs、产品文档、说明书和…...

基于python的图书馆大数据可视化分析系统设计与实现
博主介绍: 大家好,本人精通Java、Python、C#、C、C编程语言,同时也熟练掌握微信小程序、Php和Android等技术,能够为大家提供全方位的技术支持和交流。 我有丰富的成品Java、Python、C#毕设项目经验,能够为学生提供各类…...

利用formdata自动序列化和xhr上传表单到后端
//FormData对象是XMLHTTPRequest level2新增的类型,它可以自动序列化表单内容,不再需要我们去写序列化表单方法; FormData()即可以直接把整个表单给它,也可以分别使用append(‘字段’,‘值’)方法给FormData(); 现在就…...

视频号小店大地震?还好我看了原文
关注卢松松,会经常给你分享一些我的经验和观点。 我X,如果不是看了原文,我差点也上当了。虽然视频号小店关闭了450个类目,但又重新开放了412个类目啊。 昨天(8月9日),视频号一口气发了10个公…...

Genymotion adb shell
Genymotion 账户是 qq邮箱 参考 Ubuntu 20.04 安装 Android 模拟器 Genymotion https://www.zzzmh.cn/post/553cd96d4e47490a90b3302a76a93c0d Genymotion adb shell adb shell C:\Program Files\Genymobile\Genymotion\tools>adb shell lsusb Bus 001 Device 001: ID …...

探索AI与社交的交汇点:看Facebook如何引领智能化革命
在当今数字化时代,人工智能(AI)正成为各大科技公司变革的重要驱动力。作为全球领先的社交媒体平台,Facebook(现Meta Platforms)正处于这一智能化革命的前沿。通过不断创新和应用AI技术,Facebook…...

JVM 加载阶段 Class对象加载位置是在 堆中还是方法区?
在JVM(Java虚拟机)的类加载过程中,Class对象的加载位置涉及到堆(Heap)和方法区(Method Area)两个关键区域。具体来说,类的加载阶段涉及到将类的.class文件中的二进制数据读入到内存中…...

Android 获取短信验证
Android 获取短信验证 Android 获取短信验证 输入发短信的手机号,点击获取验证码,等接收到验证码后就会自动获取 SmsReceiver.Java import android.content.BroadcastReceiver; import android.content.Context; import android.content.Intent; impor…...