当前位置: 首页 > news >正文

自动驾驶的一些大白话讲解

无人驾驶牛逼吗?我来帮你祛魅【原理+缺陷解析】_哔哩哔哩_bilibili

5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术… - 雪球 (xueqiu.com)

到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间,给你讲明白今年自动驾驶技术最重要的路线变化。这将会真正为自动驾驶体验带来质的飞跃和改变,并以此为标尺,我们能够很容易判断各家车企的自动驾驶技术领先程度。

当前的所谓自动驾驶系统,本质上就是一个规则执行器,它的基本工作原理是拿路上遇到的实际情况与人工提前写好的规则去比对,匹配上就按规则执行,匹配不上的话系统就提示接管自动退出。打个比方,比如说系统想要自动变道,会感知目标车道后侧车辆距离和速度,如果满足条件就发起变道,不满足就继续等待机会。这是一个很简单的办法,也非常容易理解它的工作机制。我们今天看到的所有车辆辅助驾驶功能,采用的都是这种规则检查-匹配-执行/放弃的方法。这里产生了第一个问题,这么看似乎自动驾驶没什么难度呀?目前的核心难点,其实在于感知层面。就是前面举例中提到的对于车辆的检测、速度和距离的判断。更难的还有比如说对于道路、车道线、绿化带的感知和判断,难度再提升一点,就是对人、对非机动车、对异性障碍物的判断和检测。感知部分才是最难的,不仅要识别,还要精准识别和快速识别,才能提供系统足够的信息去和规则设定的情况比对。我们现在常常听到的占用网络、BEV等等概念,目的都是为了更好的感知环境和路上的事物。

再进一步,我可以解释一下为何以前的视频里我会说华为在智驾的领先并非技术路线的领先,而仅仅是工程进度上的领先。因为在当下的自动驾驶技术路线里,国内所有车企都基本一致。唯一能比对的两个环节,一个是感知层面是不是能做到更精准、更多样、更快速的识别,另一个是决策层面规则是不是足够丰富来覆盖更多情况而不至于让系统总是提示接管。决策规则我们很容易想到的,就是看我们设想和写下来的规则够不够多,没什么技术含量。真正多少有点差别的其实是感知层面,但目前来看头部几家车企差别也很小。有一个指标可以判断技术是不是领先,就是纯视觉占用网络的OTA。目前全世界仅有两家车企上车了纯视觉占用网络技术,一家叫特斯拉,一家叫极越。现在听到的消息是小鹏会在今年中升级,其它家还没有太多信息。但是总的来说,头部剩下的几家包括华为、理想、蔚来应该也会在今年推送升级。所以总结来看,中国目前头部自动驾驶企业,当下看就是前面提到的这四五家。其中华为是不是遥遥领先,至少我理解里并不是。几家的技术差异很大吗?我看也并不是。

今天要说的自动驾驶端到端系统,其实是下一代自动驾驶技术。所谓的端到端系统,就是抛弃了前面提到的规则匹配的方法来确定如何决策。什么叫抛弃规则呢?就是我们不再需要人工写好一条条的情况去比对,而是让系统真正自己去学习判断如何处理。那它到底是怎么实现的呢?其实就是运用了大模型技术。什么是大模型技术呢?讲人话就是让系统自己去找规律,从海量的驾驶案例中去找规律。比如说前段时间最火的Chat-GPT,本质上就是一个找规律的系统,只是它的领域是在文字方面。从海量的互联网文字内容里去学习文字之间的关系和规律,从而能生成非常流畅的对话和内容。技术人员们写好一个学习系统,这里面设置了一些需要系统去重点关注的地方,也就是所谓的大模型参数。等于说告诉系统,要从这些地方去找规律。

自动驾驶的端到端系统也是一样的,从摄像头收集到的海量数据中,去学习人在面对各种路况时候的行为和决策,找到其中的规律并以此来决策。这样的端到端系统有什么好处呢,第一个明显的好处就是系统由于天量的参数,能够关注到的细节是更多的。比如Chat-GPT4的系统参数是数千亿个,也就是说拆分到最细的地方,整个学习系统能关注上千亿个细节。当然这个说法并不是很准确,因为大部分其中的细节是经过系统抽象以后的细节。所以总的来说,端到端的自动驾驶系统比起人类手写的规则能关注到更多的细节以后,从而找到更符合实际情况的应对策略。并不会死板的去比对规则,僵硬的执行。对于很多极端场景来说,只要我们的训练数据足够,是可以更好的应对的。

当然,端到端系统也不是一蹴而就的,目前从行业技术发展来看,会分为两个阶段了来实现。一个部分是感知层面的端到端,另一个是决策层面的端到端。所谓感知的端到端,就是输入数据后系统自动学习物体规律,识别并标记,后续的决策依然采用人工规则。所谓的决策端到端,就是感知部分还是按照之前的学习办法去处理,只是应对各种条件决策的时候,才去找规律。逻辑上来说这两部分应该是可以独立开的,所以今年国内车企上线的端到端系统,有可能只包含了其中的一部分。

所以我们今年判断哪家车企技术更领先一点,就看哪家的系统先升级端到端的功能,这个标准就很清晰了。目前特斯拉FSD V12版本已经在感知层面和决策层面都统一了端到端系统,也就是没有了任何人工规则来判断是什么,也没有任何人工规则来判断应该怎么做。全部都是系统通过自动学习数据找到规律后自行处理。这也是为什么马斯克会说新系统的代码数量大幅减少,因为不再需要人去一条一条的假设场景,写出规则引导系统决策。

最后我想说的是,初期上线的端到端系统,甚至于有可能体验还不如之前的人工规则系统。但是我们内心一定要清楚,端到端绝对是自动驾驶的下一步技术路线。只要有足够的数据、足够的算力以及足够的大模型质量,最终的驾驶体验,一定会全面超越之前的规则系统。

为什么说自动驾驶的端到端技术是弯道超车的机会呢?打个比方,有的车企起步早,在感知和决策规则的代码数量都要远远多于后面加入的车企,后面的要赶上必须加大人力、财力、时间的投入才有机会。但技术路线切换到端到端系统后,前面的积累基本作废了,大家都从一个新的方法上重新起跑,所以对于后来者有了弯道超车的机会。当然除了技术路线切换外,企业本身的工程能力、管理能力、技术底子还是一切问题的基础,只有这些基础都和对手在一个水平上,才谈得上有弯道赶超的机会。

相关文章:

自动驾驶的一些大白话讲解

无人驾驶牛逼吗?我来帮你祛魅【原理缺陷解析】_哔哩哔哩_bilibili 5分钟讲明白自动驾驶端到端,解释为什么华为智驾并不是遥遥领先 到底什么是端到端自动驾驶系统?为何我会说这是智能驾驶的弯道超车机会?我希望今天用5分钟的时间&…...

Python学习笔记--参数

目录 实参与形参 不定长参数 拆分参数列表 返回值 实参与形参 1. 定义函数时,带默认值的形参必须放在不带默认值的形参后面 下面程序的输出结果是( )。 def StudentInfo(country中国,name): print(%s,%s%(name,country)…...

刷题——大数加法

大数加法_牛客题霸_牛客网 string solve(string s, string t) {if(s.size() < t.size()) return solve(t, s);reverse(s.begin(), s.end());reverse(t.begin(), t.end());string ans;int d 0;//进位制for(int i0; i < s.size(); i){d s[i] - 0;//取得数字值if(i < …...

Pytorch人体姿态骨架生成图像

ControlNet是一个稳定扩散模型&#xff0c;可以复制构图和人体姿势。ControlNet解决了生成想要的确切姿势困难的问题。 Human Pose使用OpenPose检测关键点&#xff0c;如头部、肩膀、手的位置等。它适用于复制人类姿势&#xff0c;但不适用于其他细节&#xff0c;如服装、发型和…...

前端面试常考的HTML标签知识!!!

语义标签 标签名语义描述header网页头部网页的主要头部区域nav网页导航网页的导航链接区域footer网页底部网页的底部区域aside网页侧边栏网页的侧边栏区域section网页区块网页的独立区块 | article | 网页文章 | 网页的独立文章区域 | 字符实体 作用&#xff1a;在网页中显…...

Oracle触发器

Oracle触发器就是特定事件发生时自动执行的存储过程。 触发器基本使用 基本语法&#xff1a; create [or replace] trigger 触发器名称 alter | before | instead of [insert] [[or] update [of 列1,列2,...]] [[or] delete] on 表名 [referencing {OLD [as] old / NEW [as]…...

GPT-5:未来已来,我们如何共舞于智能新纪元?

GPT-5&#xff1a;未来已来&#xff0c;我们如何共舞于智能新纪元&#xff1f; 在科技日新月异的今天&#xff0c;人工智能&#xff08;AI&#xff09;的每一次飞跃都深刻地改变着人类社会的面貌。从AlphaGo击败围棋世界冠军&#xff0c;到GPT系列模型引领自然语言处理&#x…...

2024年6月 青少年机器人技术等级考试理论综合试卷(五级)

202406 青少年等级考试机器人理论真题五级 第 1 题 ESP32 for Arduino&#xff0c;通过引脚2读取按键开关的返回值&#xff0c;电路如下图所示&#xff0c;程序pinMode(2, mode);中&#xff0c;参数mode的值是&#xff1f;&#xff08; &#xff09; A&#xff1a;INPUT B&…...

【Go】 HTTP编程3-路由httprouter

HttpRouter httprouter httprouter是第三方的库&#xff0c;不是go的标准库&#xff0c;使用命令 go get -u github.com/julienschmidt/httprouter &#xff0c;下载该模块&#xff0c;-u表示如果已经下载但更新到最新版本Router 实现了http.Handler接口&#xff0c;为各种 re…...

Spring Boot 整合 SA-Token 使用详解

Spring Boot 整合 SA-Token 使用详解 在现代Web开发中&#xff0c;用户认证与授权是构建安全应用的基础。SA-Token是一个轻量级的Java权限认证框架&#xff0c;它以其简洁的API设计、高效的执行效率以及丰富的功能特性&#xff0c;成为了众多开发者在Spring Boot项目中实现用户…...

1.3 C 语言入门实战:从 Hello World 到基础语法解析

目录 1 程序的作用 2 初识 Hello World 2.1 新建项目 2.2 程序解释 3 printf 的作用 4 注释及其注意事项 4.1 单行注释 4.2 多行注释 4.3 嵌套错误 5 项目在磁盘上的位置 1 程序的作用 如下图所示&#xff0c;我们编写了一个可以做加法的程序&#xff0c;我们给程序…...

一文读懂什么是Go语言goroutine

1. 进程、线程和协程的区别 进程: 进程是具有一定独立功能的程序&#xff0c;进程是系统资源分配和调度的最小单位。每个进程都有自己的独立内存空间&#xff0c;不同进程通过进程间通信来通信。由于进程比较重量&#xff0c;占据独立的内存&#xff0c;所以上下文进程间的切换…...

计算机毕业设计 农家乐管理平台 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

&#x1f34a;作者&#xff1a;计算机编程-吉哥 &#x1f34a;简介&#xff1a;专业从事JavaWeb程序开发&#xff0c;微信小程序开发&#xff0c;定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事&#xff0c;生活就是快乐的。 &#x1f34a;心愿&#xff1a;点…...

Spring Boot优缺点

Spring Boot 是一款用于简化Spring应用开发的框架&#xff0c;它集成了大量常用的框架和工具&#xff0c;大大简化了Spring项目的配置和部署。下面是Spring Boot的优缺点&#xff1a; 优点&#xff1a; 简化配置&#xff1a;Spring Boot自动配置功能可以根据应用的依赖自动配…...

Android Studio中创建apk签名文件

本文以macOS中Android Studio 2021.1.1版本为例介绍创建apk签名文件的操作步骤&#xff1a; 1.启动Android Studio&#xff0c;并打开一个Android项目。 2.依次点击菜单&#xff1a;Build -> Generate Signed Bundle / APK...。 3.在弹出的"Generate Signed Bundle or …...

CRC32 JAVA C#实现

项目中用到CRC32进行校验得地方&#xff0c;需要用到C#和java进行对比&#xff1a; 一、C#实现&#xff1a; class CRC32Cls { protected ulong[] Crc32Table; //生成CRC32码表 public void GetCRC32Table() { ulong Crc; …...

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——5Webscoket节点的使用 ​ 有了前面几篇文章的铺垫&#xff0c;现在已经可以实现我到手测试那一步的 1.解读usb_websocket_display.launch.py ​ 首先进入这个目录/root/dev_ws/src/origincar/originca…...

深入学习小程序第二天:事件处理与用户交互

一、概念 1. 事件绑定与类型 在小程序中&#xff0c;通过在组件上添加特定的属性&#xff08;如 bind 开头的属性&#xff09;来绑定事件处理函数&#xff0c;以响应用户的交互操作。常见的事件类型包括触摸事件、表单事件和系统事件&#xff1a; 触摸事件&#xff1a;用于响…...

操作系统快速入门(一)

&#x1f600;前言 本篇博文是关于操作系统的&#xff0c;希望你能够喜欢 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我的动力&#x1f609;&…...

Spring Cloud微服务性能优化:策略、实践与未来趋势

标题&#xff1a;Spring Cloud微服务性能优化&#xff1a;策略、实践与未来趋势 摘要 在微服务架构中&#xff0c;服务调用链路的性能优化是确保系统高效运行的关键。Spring Cloud作为微服务架构的主流实现之一&#xff0c;提供了多种工具和方法来优化服务间的调用。本文将深…...

【Oracle APEX开发小技巧12】

有如下需求&#xff1a; 有一个问题反馈页面&#xff0c;要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据&#xff0c;方便管理员及时处理反馈。 我的方法&#xff1a;直接将逻辑写在SQL中&#xff0c;这样可以直接在页面展示 完整代码&#xff1a; SELECTSF.FE…...

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

五年级数学知识边界总结思考-下册

目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解&#xff1a;由来、作用与意义**一、知识点核心内容****二、知识点的由来&#xff1a;从生活实践到数学抽象****三、知识的作用&#xff1a;解决实际问题的工具****四、学习的意义&#xff1a;培养核心素养…...

【Go】3、Go语言进阶与依赖管理

前言 本系列文章参考自稀土掘金上的 【字节内部课】公开课&#xff0c;做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程&#xff0c;它的核心机制是 Goroutine 协程、Channel 通道&#xff0c;并基于CSP&#xff08;Communicating Sequential Processes&#xff0…...

MySQL 8.0 OCP 英文题库解析(十三)

Oracle 为庆祝 MySQL 30 周年&#xff0c;截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。 从今天开始&#xff0c;将英文题库免费公布出来&#xff0c;并进行解析&#xff0c;帮助大家在一个月之内轻松通过OCP认证。 本期公布试题111~120 试题1…...

(转)什么是DockerCompose?它有什么作用?

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用&#xff0c;而无需手动一个个创建和运行容器。 Compose文件是一个文本文件&#xff0c;通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 在 GPU 上对图像执行 均值漂移滤波&#xff08;Mean Shift Filtering&#xff09;&#xff0c;用于图像分割或平滑处理。 该函数将输入图像中的…...

零基础在实践中学习网络安全-皮卡丘靶场(第九期-Unsafe Fileupload模块)(yakit方式)

本期内容并不是很难&#xff0c;相信大家会学的很愉快&#xff0c;当然对于有后端基础的朋友来说&#xff0c;本期内容更加容易了解&#xff0c;当然没有基础的也别担心&#xff0c;本期内容会详细解释有关内容 本期用到的软件&#xff1a;yakit&#xff08;因为经过之前好多期…...

嵌入式学习笔记DAY33(网络编程——TCP)

一、网络架构 C/S &#xff08;client/server 客户端/服务器&#xff09;&#xff1a;由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序&#xff0c;负责提供用户界面和交互逻辑 &#xff0c;接收用户输入&#xff0c;向服务器发送请求&#xff0c;并展示服务…...

【无标题】路径问题的革命性重构:基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构&#xff1a;基于二维拓扑收缩色动力学模型的零点隧穿理论 一、传统路径模型的根本缺陷 在经典正方形路径问题中&#xff08;图1&#xff09;&#xff1a; mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...