当前位置: 首页 > article >正文

智驾公司生死线 | 端到端是面子,含模量是里子

点击下方卡片关注“自动驾驶之心”公众号戳我-领取自动驾驶近30个方向学习路线作者 | 圆周智行编辑 | 自动驾驶之心原文 | 端到端是面子含模量是里子——智驾公司的生死线自动驾驶前沿信息获取→自动驾驶之心知识星球★谁在真正进化谁在假装聪明。智驾行业卷到今天能卷的指标几乎都被卷遍了。卷激光雷达线数卷芯片算力卷端到端、VLA、世界模型。每个季度都有新词冒出来每场发布会都有新故事可讲。但就在这堆眼花缭乱的参数和概念背后千里科技提出了一个完全不同的指标——含模量。他们认为这才是判断智驾公司真实水平的底牌是所有显性指标背后被忽略的底层指标。所谓含模量是指智驾全栈流程中由AI模型驱动的模块占比。听起来有点抽象我们把它拆开来看。智驾的全流程——从数据采集、感知、预测、规划、控制到数据挖掘、仿真评测其实是一个极长的链条。其中的每一个模块既可以由人工规则完成又可以由AI模型完成。在传统架构里这些环节仍然大量依赖人工手写的规则和算法。而含模量衡量的就是这个链条上到底有多少环节已经被AI模型接管。说得更直白一点一个智驾系统里到底有多少部分是真的在靠AI自己思考、自己迭代而不是靠工程师一行一行代码堆出来的这不是一个能写在参数表里的指标但它决定了所有你能感受到的东西车开起来丝不丝滑遇到陌生场景会不会“罢工”是“新手”还是“老司机”。要理解含模量为什么如此关键首先得搞懂一个概念梯度回传。这是大模型训练中最底层的机制输入数据 → 模型预测 → 对比真实结果 → 计算损失函数。差异越大损失函数越大。训练的目标就是通过反向传播调整参数让损失函数降到最低。不断重复这个过程让模型越来越准这也是模型自我进化的核心机制。把这套机制放到智驾上摄像头、雷达监测到行人和障碍物输出一个驾驶决策。如果这个决策和人类老司机的正确驾驶行为有偏差系统就给自己“扣分”然后触发梯度回传重新调整参数直到做出正确决策。整个过程就像客服反馈做得不好就改进不断把损失函数降到最低不需要人工干预模型自己就能越跑越聪明。但要让这套机制真正跑通有一个巨大的障碍需要先清除掉——多传感器的数据冲突。各类传感器的数据格式五花八门。激光雷达是点云信息毫米波雷达是波状信息摄像头是像素信息。它们各自有独立的成像算法独立做感知。当两者对同一个场景的判断冲突时比如激光雷达说前方有障碍物相机说没有。系统该怎么办传统做法是人工手写规则“这种情况听激光雷达的那种情况听相机的。”这听起来很合理但问题在于现实世界的场景是无限的而规则是有限的。每遇到一个新场景就要写一条新规则。规则越写越多系统越来越复杂但永远有写不到的Corner Case——因为现实世界的场景是无限的。更重要的是这种架构天然割裂了梯度回传。因为规则是人工定的数据无法直接参与决策模型也就无法自我进化。写到后面系统就变成了一座永远在加高的违章建筑。而高含模量的系统用的是另一套打法把不同传感器的信息统一成同一种格式。比如 OCC 算法用网格判断空间是否被占据遇到障碍物时不纠结于识别物体到底是“塑料袋”还是“石头”只判定有没有障碍物。统一格式之后全部灌进同一个大模型让模型自己判断该怎么开。系统不再需要纠结“到底该听谁的”因为所有信息在进模型之前就已经对齐了。数据进来了模型输出了偏差被捕捉了参数更新了一个完整的闭环就形成了。在这条路上特斯拉是一个绕不开的参照系。特斯拉的 FSD 系统是高含模量的活样板。有黑客拆解过特斯拉 FSD 端侧芯片发现其是由多个小网络模块组成看似是割裂模块拼接但实际上这些小模块都能向主决策模型回传特征与信息在统一框架下协同推理、整体对齐。它不是传统意义上分段拼接的“端到端”而是真正统一的智能系统。它的运作逻辑也非常简单8个摄像头纯视觉数据格式统一。视频流被切分成统一的Token输入一个大模型。模型最终只输出两个参数速度和转向。摄像头每秒能产生海量 Token数据量极大。上下文越多计算量和显存占用就越高。但特斯拉能在这种极限条件下实现高效处理与极简输出堪称“真・大脑”。特斯拉能做到这一点难度极高。车端需要在极短时间内完成统一表征、模型推理、决策输出对芯片、显存带宽、算法效率的要求都是天花板级别。再加上在仿真环境里跑海量Corner Case让模型自己“见过”所有场景。这套体系不是靠堆人堆规则能堆出来的。如果把特斯拉看作高含模量的标杆那么行业里的大多数企业走的是另一条完全不同的路。现阶段行业还在大量使用手工规则所谓一段式、两段式大多是噱头。自动标注、仿真训练大部分还在靠手写规则。有些模块很难模型化或者模型化效果不如人工精准。很多车企吹嘘数据量庞大但大量都是平稳驾驶的无效数据靠人工筛选、标注效率极低、成本极高即便对外宣传“全自动标注”行业远未成熟。这也呈现出产品体验的差异特斯拉决策一气呵成边减速边转向连贯流畅而规则主导的系统常常出现卡顿、犹豫——因为每遇到一个场景系统都要在无数条规则里“查找答案”决策延迟不可避免。这不是某一家公司的问题而是整个行业在拥抱“含模量”这个概念之前的普遍现状。正如Momenta曹旭东所言智驾真正的核心竞争力不在于单点算法而在于架构整合能力即把多个算法整合成合力。相比于混合技术路线(Rule-based 深度学习)纯端到端架构能带来更强的飞轮效应迭代速度更快。这一切指向的正是含模量背后的本质——系统是否具备自成长能力。规则系统是加法每多一个Corner Case工程师多写一条规则。人力成本线性增长但场景是无限的永远追不上。模型系统是指数每多一批高质量数据模型泛化能力可能跃升一个台阶。只要数据量够大、算力够强、含模量够高效果会持续增长。这就是大语言模型的Scaling Law也被普遍认为是自动驾驶领域的Scaling Law。长期来看坚持数据驱动、放弃规则堆砌的厂商会形成技术代差。“含模量”撕开了智驾行业最隐秘的伤口——最终能活下来的一定是那些能“长”出大脑的公司。自动驾驶之心求点赞求分享求喜欢

相关文章:

智驾公司生死线 | 端到端是面子,含模量是里子

点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线作者 | 圆周智行编辑 | 自动驾驶之心原文 | 端到端是面子,含模量是里子——智驾公司的生死线>>自动驾驶前沿信息获取→自动驾驶之心知识星球★谁在真正进化&…...

FAST-LIO状态更新核心:Boxplus与Boxminus操作详解与避坑指南

FAST-LIO状态更新核心:Boxplus与Boxminus操作详解与避坑指南 在SLAM和VIO领域,FAST-LIO因其高效的流形上滤波算法而备受关注。对于正在实现或优化这类算法的工程师来说,理解状态更新中的"广义加法"(boxplus)…...

从安装到实战:在Windows 11上为MATLAB 2022b配置CPLEX学术版的全流程避坑记录

从安装到实战:在Windows 11上为MATLAB 2022b配置CPLEX学术版的全流程避坑记录 最近在实验室帮学弟配置MATLAB优化求解环境时,发现网上教程大多停留在旧版本组合,对于Windows 11MATLAB 2022bCPLEX 12.10这套新组合的坑点几乎只字未提。经历两天…...

利用LATX技术在龙芯安同AOCS OS上部署坚果云:跨架构文件同步解决方案

1. 为什么要在龙芯安同AOCS OS上部署坚果云 在日常办公中,文件同步是个刚需。想象一下这样的场景:你在办公室电脑上修改了一份重要文档,回到家想继续工作,却发现文件版本对不上;或者出差在外急需某个文件,却…...

OpCore-Simplify:15分钟搞定黑苹果配置的终极解决方案

OpCore-Simplify:15分钟搞定黑苹果配置的终极解决方案 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为复杂的OpenCore EFI配置而头疼…...

WSL2 网络配置实战:从IPv6不通到全面畅通的完整指南

1. WSL2网络配置基础与IPv6问题诊断 刚接触WSL2时,我发现一个奇怪现象:Windows宿主机的IPv6测试一切正常,但进入WSL2环境后执行ping -6 ipv6.google.com却总是失败。通过ifconfig命令查看,发现只有以fe80开头的本地链路地址&#…...

Pycharm远程开发终极指南:AutoDL服务器+YOLOv5环境配置(含守护进程技巧)

PyCharm远程开发实战:AutoDL服务器YOLOv5环境配置与稳定训练方案 远程开发已成为深度学习工程师的必备技能,特别是当本地硬件资源不足时,云服务器提供了强大的计算支持。本文将手把手带你完成从零开始的完整工作流,涵盖环境配置、…...

英雄联盟LCU工具包:三分钟掌握智能自动化与数据分析利器

英雄联盟LCU工具包:三分钟掌握智能自动化与数据分析利器 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit League-Toolkit&#xff0…...

【MQTT】MQTTX 脚本功能进阶:用JavaScript构建自动化测试场景

1. MQTTX脚本功能深度解析 MQTTX作为EMQ开源的MQTT 5.0测试客户端,其脚本功能自v1.4.2版本引入后,已经成为物联网开发者的"瑞士军刀"。不同于基础教程中演示的简单数据转换,脚本功能真正的威力在于构建完整的自动化测试流水线。想象…...

双向跳点搜索路径规划:A*算法的改进与源码详解,附单向JPS算法及matlab源码

双向跳点搜索路径规划,起点终点同时开始搜索。 双向JPS搜索,A*的改进算法,代码注释详细,附赠参考文献。 附赠单向JPS算法。 matlab源码。算法概述 跳点搜索(Jump Point Search,JPS)是一种基于网…...

实数序列DFT频谱的共轭对称性验证与IDFT重构实战

1. 理解实数序列DFT的共轭对称性 第一次接触信号处理时,我对DFT(离散傅里叶变换)频谱的共轭对称性感到非常困惑。记得当时用Python生成一个简单的正弦波序列,做FFT后发现频谱图左右对称,但具体数值关系却看不懂。后来才…...

第9章 函数-9.5 函数参数的类型

1.位置参数位置参数指的是在函数传递时必须按照正确的顺序将实参传到函数之中,换句话说,调用函数时传入实参的数量和位置都必须和创建函数时的形参保持一致。示例代码如下:# 资源包\Code\chapter9\9.4\0907.pydef myFunc(name, teach):return…...

FastAPI项目架构:从模块化设计到生产就绪的目录规划

1. 为什么需要模块化的FastAPI项目架构 第一次用FastAPI写项目时,我把所有代码都堆在main.py里。路由、数据库操作、业务逻辑全挤在一起,结果两周后连自己都看不懂代码了。这种经历让我深刻理解到:好的目录结构不是摆设,而是项目可…...

MiniCPM-o-4.5-nvidia-FlagOS参数详解:bfloat16精度选择依据与推理延迟权衡分析

MiniCPM-o-4.5-nvidia-FlagOS参数详解:bfloat16精度选择依据与推理延迟权衡分析 1. 引言 当你第一次部署一个像MiniCPM-o-4.5这样的大模型时,面对配置选项里那个“bfloat16”精度选项,是不是有点拿不准主意?选它吧,担…...

Python入门第一课:零基础认识Python + 环境搭建 + 基础语法精讲

Python入门第一课:零基础认识Python 环境搭建 基础语法精讲 文章目录Python入门第一课:零基础认识Python 环境搭建 基础语法精讲一、Python 是什么?为什么要学它?1.1 Python 简介1.2 Python 能做什么?1.3 Python 的…...

中小企业必看:Gemma 4 企业级私有化部署全流程(避坑指南)

中小企业必看:Gemma 4 企业级私有化部署全流程(避坑指南) 前言 对中小企业来说,AI大模型不用追求“参数越高越好”,核心是“低成本、易部署、能商用、保隐私”——而谷歌最新开源的Gemma 4,刚好踩中所有痛…...

如何免费打造你的个人游戏串流服务器:Sunshine终极指南 [特殊字符]

如何免费打造你的个人游戏串流服务器:Sunshine终极指南 🎮 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想要在任何设备上畅玩PC大作,却不想被…...

MATLAB代码:储能参与调峰调频联合优化模型 关键词:储能 调频 调峰 充放电优化 联合运行...

MATLAB代码:储能参与调峰调频联合优化模型 关键词:储能 调频 调峰 充放电优化 联合运行 仿真平台:MATLABCVX 平台 主要内容:代码主要做的是考虑储能同时参与调峰以及调频的联合调度模型,现有代码往往仅关注储能在调峰…...

千问3.5-9B人工智能导论:用模型讲解机器学习与深度学习核心概念

千问3.5-9B人工智能导论:用模型讲解机器学习与深度学习核心概念 1. 当AI成为你的知识导师 想象一下,你面前坐着一位既懂技术又擅长教学的AI导师。它不仅掌握最前沿的人工智能知识,还能用生活中的例子帮你理解复杂概念。这就是千问3.5-9B作为…...

5分钟搞定Docker+MySQL数据持久化:挂载本地目录与字符集配置全流程

DockerMySQL数据持久化实战:目录挂载与字符集配置终极指南 刚接触Docker的开发者经常会遇到这样的困扰:MySQL容器重启后数据全部丢失,或者存储的emoji表情变成了一堆问号。这些问题看似简单,却直接影响着开发效率和数据安全。本文…...

Qwen3-ASR-1.7B部署教程:OpenShift平台容器化部署与水平扩缩容配置

Qwen3-ASR-1.7B部署教程:OpenShift平台容器化部署与水平扩缩容配置 1. 项目概述 Qwen3-ASR-1.7B是基于阿里云通义千问语音识别模型开发的高精度本地语音转文字工具。相比之前的0.6B版本,这个1.7B模型在复杂长难句和中英文混合语音识别方面有显著提升&a…...

5个实战技巧彻底掌握OpenUserJS.org:解锁浏览器无限定制能力

5个实战技巧彻底掌握OpenUserJS.org:解锁浏览器无限定制能力 【免费下载链接】OpenUserJS.org The home of FOSS user scripts. 项目地址: https://gitcode.com/gh_mirrors/op/OpenUserJS.org OpenUserJS.org作为自由开源软件用户脚本的集中平台,…...

【技术干货】Hermes Agent 0.8 深度解析:开源自主 AI 代理的生产级进化

摘要 本文深度解析 Hermes Agent 0.8 版本的核心技术升级,涵盖异步任务通知、动态模型切换、工具调用优化等关键特性,并提供基于 Python 的完整实战代码示例,助力开发者快速构建生产级 AI Agent 应用。背景介绍 Hermes Agent 是由 Nous Resea…...

2026届毕业生推荐的AI辅助论文神器横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek DeepSeek作为大语言模型,在学术论文写作范畴有着一定辅助意义,研究者…...

Kandinsky-5.0-I2V-Lite-5s图像转视频实战:Python入门级调用与效果生成

Kandinsky-5.0-I2V-Lite-5s图像转视频实战:Python入门级调用与效果生成 1. 开篇:为什么选择Kandinsky-5.0-I2V-Lite-5s 想把手头的照片变成会动的短视频吗?Kandinsky-5.0-I2V-Lite-5s这个工具可以帮你轻松实现。作为一款专为图像转视频设计…...

别再让图片拖慢你的大模型!6种视觉Token压缩方案实战解析(含InternVL、BLIP2代码)

别再让图片拖慢你的大模型!6种视觉Token压缩方案实战解析(含InternVL、BLIP2代码) 当多模态大模型(MLLM)遇上高分辨率图像,视觉Token数量激增往往成为推理速度的瓶颈。本文将从工程实践角度,拆解…...

3大创新技术:重构Android设备标识获取的新范式

3大创新技术:重构Android设备标识获取的新范式 【免费下载链接】Android_CN_OAID 安卓设备唯一标识解决方案,可替代移动安全联盟(MSA)统一 SDK 闭源方案。包括国内手机厂商的开放匿名标识(OAID)、海外手机平…...

Seurat去批次整合实战:如何用多线程加速FindIntegrationAnchors处理大型单细胞数据集

Seurat多线程加速实战:突破大型单细胞数据集整合的性能瓶颈 当单细胞RNA测序技术遇上高通量时代,研究人员手中的数据集正以惊人的速度膨胀。面对数十万细胞的整合分析,传统的单线程处理模式往往让实验陷入漫长的等待——特别是当运行到FindIn…...

CTF-NetA:零基础也能掌握的CTF流量分析终极指南

CTF-NetA:零基础也能掌握的CTF流量分析终极指南 【免费下载链接】CTF-NetA CTF-NetA是一款专门针对CTF比赛的网络流量分析工具,可以对常见的网络流量进行分析,快速自动获取flag。 项目地址: https://gitcode.com/gh_mirrors/ct/CTF-NetA …...

智慧交通货车装载状态满载空载卡车是否载货检测数据集VOC+YOLO格式1053张3类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数):1053标注数量(xml文件个数):1053标注数量(txt文件个数):1053标注类别…...