自动驾驶的一些大白话讲解
无人驾驶牛逼吗?我来帮你祛魅【原理+缺陷解析】_哔哩哔哩_bilibili
5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术… - 雪球 (xueqiu.com)
到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术最重要的路线变化。这将会真正为自动驾驶体验带来质的飞跃和改变,并以此为标尺,我们能够很容易判断各家车企的自动驾驶技术领先程度。
当前的所谓自动驾驶系统,本质上就是一个规则执行器,它的基本工作原理是拿路上遇到的实际情况与人工提前写好的规则去比对,匹配上就按规则执行,匹配不上的话系统就提示接管自动退出。打个比方,比如说系统想要自动变道,会感知目标车道后侧车辆距离和速度,如果满足条件就发起变道,不满足就继续等待机会。这是一个很简单的办法,也非常容易理解它的工作机制。我们今天看到的所有车辆辅助驾驶功能,采用的都是这种规则检查-匹配-执行/放弃的方法。这里产生了第一个问题,这么看似乎自动驾驶没什么难度呀?目前的核心难点,其实在于感知层面。就是前面举例中提到的对于车辆的检测、速度和距离的判断。更难的还有比如说对于道路、车道线、绿化带的感知和判断,难度再提升一点,就是对人、对非机动车、对异性障碍物的判断和检测。感知部分才是最难的,不仅要识别,还要精准识别和快速识别,才能提供系统足够的信息去和规则设定的情况比对。我们现在常常听到的占用网络、BEV等等概念,目的都是为了更好的感知环境和路上的事物。
再进一步,我可以解释一下为何以前的视频里我会说华为在智驾的领先并非技术路线的领先,而仅仅是工程进度上的领先。因为在当下的自动驾驶技术路线里,国内所有车企都基本一致。唯一能比对的两个环节,一个是感知层面是不是能做到更精准、更多样、更快速的识别,另一个是决策层面规则是不是足够丰富来覆盖更多情况而不至于让系统总是提示接管。决策规则我们很容易想到的,就是看我们设想和写下来的规则够不够多,没什么技术含量。真正多少有点差别的其实是感知层面,但目前来看头部几家车企差别也很小。有一个指标可以判断技术是不是领先,就是纯视觉占用网络的OTA。目前全世界仅有两家车企上车了纯视觉占用网络技术,一家叫特斯拉,一家叫极越。现在听到的消息是小鹏会在今年中升级,其它家还没有太多信息。但是总的来说,头部剩下的几家包括华为、理想、蔚来应该也会在今年推送升级。所以总结来看,中国目前头部自动驾驶企业,当下看就是前面提到的这四五家。其中华为是不是遥遥领先,至少我理解里并不是。几家的技术差异很大吗?我看也并不是。
今天要说的自动驾驶端到端系统,其实是下一代自动驾驶技术。所谓的端到端系统,就是抛弃了前面提到的规则匹配的方法来确定如何决策。什么叫抛弃规则呢?就是我们不再需要人工写好一条条的情况去比对,而是让系统真正自己去学习判断如何处理。那它到底是怎么实现的呢?其实就是运用了大模型技术。什么是大模型技术呢?讲人话就是让系统自己去找规律,从海量的驾驶案例中去找规律。比如说前段时间最火的Chat-GPT,本质上就是一个找规律的系统,只是它的领域是在文字方面。从海量的互联网文字内容里去学习文字之间的关系和规律,从而能生成非常流畅的对话和内容。技术人员们写好一个学习系统,这里面设置了一些需要系统去重点关注的地方,也就是所谓的大模型参数。等于说告诉系统,要从这些地方去找规律。
自动驾驶的端到端系统也是一样的,从摄像头收集到的海量数据中,去学习人在面对各种路况时候的行为和决策,找到其中的规律并以此来决策。这样的端到端系统有什么好处呢,第一个明显的好处就是系统由于天量的参数,能够关注到的细节是更多的。比如Chat-GPT4的系统参数是数千亿个,也就是说拆分到最细的地方,整个学习系统能关注上千亿个细节。当然这个说法并不是很准确,因为大部分其中的细节是经过系统抽象以后的细节。所以总的来说,端到端的自动驾驶系统比起人类手写的规则能关注到更多的细节以后,从而找到更符合实际情况的应对策略。并不会死板的去比对规则,僵硬的执行。对于很多极端场景来说,只要我们的训练数据足够,是可以更好的应对的。
当然,端到端系统也不是一蹴而就的,目前从行业技术发展来看,会分为两个阶段了来实现。一个部分是感知层面的端到端,另一个是决策层面的端到端。所谓感知的端到端,就是输入数据后系统自动学习物体规律,识别并标记,后续的决策依然采用人工规则。所谓的决策端到端,就是感知部分还是按照之前的学习办法去处理,只是应对各种条件决策的时候,才去找规律。逻辑上来说这两部分应该是可以独立开的,所以今年国内车企上线的端到端系统,有可能只包含了其中的一部分。
所以我们今年判断哪家车企技术更领先一点,就看哪家的系统先升级端到端的功能,这个标准就很清晰了。目前特斯拉FSD V12版本已经在感知层面和决策层面都统一了端到端系统,也就是没有了任何人工规则来判断是什么,也没有任何人工规则来判断应该怎么做。全部都是系统通过自动学习数据找到规律后自行处理。这也是为什么马斯克会说新系统的代码数量大幅减少,因为不再需要人去一条一条的假设场景,写出规则引导系统决策。
最后我想说的是,初期上线的端到端系统,甚至于有可能体验还不如之前的人工规则系统。但是我们内心一定要清楚,端到端绝对是自动驾驶的下一步技术路线。只要有足够的数据、足够的算力以及足够的大模型质量,最终的驾驶体验,一定会全面超越之前的规则系统。
为什么说自动驾驶的端到端技术是弯道超车的机会呢?打个比方,有的车企起步早,在感知和决策规则的代码数量都要远远多于后面加入的车企,后面的要赶上必须加大人力、财力、时间的投入才有机会。但技术路线切换到端到端系统后,前面的积累基本作废了,大家都从一个新的方法上重新起跑,所以对于后来者有了弯道超车的机会。当然除了技术路线切换外,企业本身的工程能力、管理能力、技术底子还是一切问题的基础,只有这些基础都和对手在一个水平上,才谈得上有弯道赶超的机会。
相关文章:
自动驾驶的一些大白话讲解
无人驾驶牛逼吗?我来帮你祛魅【原理缺陷解析】_哔哩哔哩_bilibili 5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间&…...
Python学习笔记--参数
目录 实参与形参 不定长参数 拆分参数列表 返回值 实参与形参 1. 定义函数时,带默认值的形参必须放在不带默认值的形参后面 下面程序的输出结果是( )。 def StudentInfo(country中国,name): print(%s,%s%(name,country)…...
刷题——大数加法
大数加法_牛客题霸_牛客网 string solve(string s, string t) {if(s.size() < t.size()) return solve(t, s);reverse(s.begin(), s.end());reverse(t.begin(), t.end());string ans;int d 0;//进位制for(int i0; i < s.size(); i){d s[i] - 0;//取得数字值if(i < …...
Pytorch人体姿态骨架生成图像
ControlNet是一个稳定扩散模型,可以复制构图和人体姿势。ControlNet解决了生成想要的确切姿势困难的问题。 Human Pose使用OpenPose检测关键点,如头部、肩膀、手的位置等。它适用于复制人类姿势,但不适用于其他细节,如服装、发型和…...
前端面试常考的HTML标签知识!!!
语义标签 标签名语义描述header网页头部网页的主要头部区域nav网页导航网页的导航链接区域footer网页底部网页的底部区域aside网页侧边栏网页的侧边栏区域section网页区块网页的独立区块 | article | 网页文章 | 网页的独立文章区域 | 字符实体 作用:在网页中显…...
Oracle触发器
Oracle触发器就是特定事件发生时自动执行的存储过程。 触发器基本使用 基本语法: create [or replace] trigger 触发器名称 alter | before | instead of [insert] [[or] update [of 列1,列2,...]] [[or] delete] on 表名 [referencing {OLD [as] old / NEW [as]…...
GPT-5:未来已来,我们如何共舞于智能新纪元?
GPT-5:未来已来,我们如何共舞于智能新纪元? 在科技日新月异的今天,人工智能(AI)的每一次飞跃都深刻地改变着人类社会的面貌。从AlphaGo击败围棋世界冠军,到GPT系列模型引领自然语言处理&#x…...
2024年6月 青少年机器人技术等级考试理论综合试卷(五级)
202406 青少年等级考试机器人理论真题五级 第 1 题 ESP32 for Arduino,通过引脚2读取按键开关的返回值,电路如下图所示,程序pinMode(2, mode);中,参数mode的值是?( ) A:INPUT B&…...
【Go】 HTTP编程3-路由httprouter
HttpRouter httprouter httprouter是第三方的库,不是go的标准库,使用命令 go get -u github.com/julienschmidt/httprouter ,下载该模块,-u表示如果已经下载但更新到最新版本Router 实现了http.Handler接口,为各种 re…...
Spring Boot 整合 SA-Token 使用详解
Spring Boot 整合 SA-Token 使用详解 在现代Web开发中,用户认证与授权是构建安全应用的基础。SA-Token是一个轻量级的Java权限认证框架,它以其简洁的API设计、高效的执行效率以及丰富的功能特性,成为了众多开发者在Spring Boot项目中实现用户…...
1.3 C 语言入门实战:从 Hello World 到基础语法解析
目录 1 程序的作用 2 初识 Hello World 2.1 新建项目 2.2 程序解释 3 printf 的作用 4 注释及其注意事项 4.1 单行注释 4.2 多行注释 4.3 嵌套错误 5 项目在磁盘上的位置 1 程序的作用 如下图所示,我们编写了一个可以做加法的程序,我们给程序…...
一文读懂什么是Go语言goroutine
1. 进程、线程和协程的区别 进程: 进程是具有一定独立功能的程序,进程是系统资源分配和调度的最小单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换…...
计算机毕业设计 农家乐管理平台 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试
🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…...
Spring Boot优缺点
Spring Boot 是一款用于简化Spring应用开发的框架,它集成了大量常用的框架和工具,大大简化了Spring项目的配置和部署。下面是Spring Boot的优缺点: 优点: 简化配置:Spring Boot自动配置功能可以根据应用的依赖自动配…...
Android Studio中创建apk签名文件
本文以macOS中Android Studio 2021.1.1版本为例介绍创建apk签名文件的操作步骤: 1.启动Android Studio,并打开一个Android项目。 2.依次点击菜单:Build -> Generate Signed Bundle / APK...。 3.在弹出的"Generate Signed Bundle or …...
CRC32 JAVA C#实现
项目中用到CRC32进行校验得地方,需要用到C#和java进行对比: 一、C#实现: class CRC32Cls { protected ulong[] Crc32Table; //生成CRC32码表 public void GetCRC32Table() { ulong Crc; …...
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用 有了前面几篇文章的铺垫,现在已经可以实现我到手测试那一步的 1.解读usb_websocket_display.launch.py 首先进入这个目录/root/dev_ws/src/origincar/originca…...
深入学习小程序第二天:事件处理与用户交互
一、概念 1. 事件绑定与类型 在小程序中,通过在组件上添加特定的属性(如 bind 开头的属性)来绑定事件处理函数,以响应用户的交互操作。常见的事件类型包括触摸事件、表单事件和系统事件: 触摸事件:用于响…...
操作系统快速入门(一)
😀前言 本篇博文是关于操作系统的,希望你能够喜欢 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大家,您的满意是我的动力😉&…...
Spring Cloud微服务性能优化:策略、实践与未来趋势
标题:Spring Cloud微服务性能优化:策略、实践与未来趋势 摘要 在微服务架构中,服务调用链路的性能优化是确保系统高效运行的关键。Spring Cloud作为微服务架构的主流实现之一,提供了多种工具和方法来优化服务间的调用。本文将深…...
网络六边形受到攻击
大家读完觉得有帮助记得关注和点赞!!! 抽象 现代智能交通系统 (ITS) 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 (…...
7.4.分块查找
一.分块查找的算法思想: 1.实例: 以上述图片的顺序表为例, 该顺序表的数据元素从整体来看是乱序的,但如果把这些数据元素分成一块一块的小区间, 第一个区间[0,1]索引上的数据元素都是小于等于10的, 第二…...
多模态2025:技术路线“神仙打架”,视频生成冲上云霄
文|魏琳华 编|王一粟 一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,…...
深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...
STM32+rt-thread判断是否联网
一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
【python异步多线程】异步多线程爬虫代码示例
claude生成的python多线程、异步代码示例,模拟20个网页的爬取,每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程:允许程序同时执行多个任务,提高IO密集型任务(如网络请求)的效率…...
关键领域软件测试的突围之路:如何破解安全与效率的平衡难题
在数字化浪潮席卷全球的今天,软件系统已成为国家关键领域的核心战斗力。不同于普通商业软件,这些承载着国家安全使命的软件系统面临着前所未有的质量挑战——如何在确保绝对安全的前提下,实现高效测试与快速迭代?这一命题正考验着…...
推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材)
推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材) 这个项目能干嘛? 使用 gemini 2.0 的 api 和 google 其他的 api 来做衍生处理 简化和优化了文生图和图生图的行为(我的最主要) 并且有一些目标检测和切割(我用不到) 视频和 imagefx 因为没 a…...
Java编程之桥接模式
定义 桥接模式(Bridge Pattern)属于结构型设计模式,它的核心意图是将抽象部分与实现部分分离,使它们可以独立地变化。这种模式通过组合关系来替代继承关系,从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...
