当前位置: 首页 > article >正文

论云原生层次架构在自动驾驶云控平台中的应用

【摘要】2024年3月我作为核心系统架构师主导了某新能源车企“新一代自动驾驶云控与数据平台”的重构与研发工作。该平台主要负责接入现役50万辆在线车辆处理海量的多模态工况数据并支撑大规模自动驾驶算法的并行仿真与实时监控。原有的传统IT架构在面临海量数据并发写入与异构算力调度时暴露出资源利用率低下、服务治理混乱等严重问题。为此我全面引入了云原生层次架构对平台进行重构。本文结合该项目深入论述了云原生层次架构的设计与实践在基础设施层用 Kubernetes 结合 Ray 分布式框架解决仿真训练算力分配僵化的问题实现异构计算任务的秒级弹性和细粒度调度在微服务应用层用 Service Mesh服务网格技术解决跨语言异构微服务治理复杂的痛点实现业务算法与网络通信底座的彻底解耦在数据服务层用 PostgreSQL 结合数据湖与 Elasticsearch 构建多模态数据底座解决海量异构数据的存储与检索瓶颈实现底层数据的无限水平扩展与实时报警的毫秒级响应。该平台已于2024年10月正式上线平稳运行各项性能指标均达到预期圆满完成了架构升级目标。【正文】随着 L2 级自动驾驶技术的普及我司旗下自动驾驶车辆保有量已突破50万大关。为了支撑海量数据的闭环迭代2024年3月公司正式启动“新一代自动驾驶云控与数据平台”的重构项目。该平台的核心功能包括车辆实时健康监控告警、影子模式下的算法流量灰度验证以及PB级多模态数据如点云、图像、车端日志的离线仿真训练。在平台初创期底层依赖的是传统的基于虚拟机的单体与SOA架构。随着接入车辆的激增痛点日益凸显首先仿真训练任务呈明显的潮汐特性传统静态分配机器的方式导致算力极大浪费且缺乏对复杂计算图的调度能力其次自动驾驶研发涉及 C、Python、Go 等多种语言跨语言的服务调用与链路追踪极度混乱最后单机关系型数据库加上零散的文件系统根本无法承受50万辆车每秒高频并发的复合数据写入与复杂查询。作为该项目的核心系统架构师我全面负责平台的技术选型与架构演进。经过深度评估我决定采用业内领先的云原生层次架构从底层基础设施到上层数据服务进行彻底重构。在基础设施层的重构中我采用Kubernetes Volcano 调度器结合Ray 分布式计算框架解决了大批次仿真训练任务面临的算力分配僵化与任务编排极其困难的问题。在自动驾驶研发中算法团队提交的数十万个并行仿真任务既包含 CPU 密集型的预处理又包含 GPU 密集型的模型推理。为了根治传统调度框架难以高效混编的痛点我从底层硬件到上层调度重构了整个 IaaS 资源池。首先在硬件资源层我引入了vGPU 虚拟化技术对底层昂贵的物理显卡进行细粒度切分确保轻量级的仿真推理模型可以共享物理卡避免了算力的独占浪费其次在集群调度层我引入了Volcano 批处理调度器利用其核心的组调度Gang Scheduling机制彻底解决了大规模 AI 任务并发申请碎片化 vGPU 资源时极易产生的“死锁”问题确保了底层 Pod 的高并发统一起停最后在应用计算层我引入了专为 AI 设计的Ray框架并将数据清洗与仿真微服务封装为 Ray 的 Actor 与 Task。通过 KubeRay 组件Ray 能够智能感知任务的复杂依赖关系DAG图并由 Volcano 提供底层的极致调度在几十秒内精准弹出成百上千个 Worker 节点进行分布式计算。这一‘底层切分硬件、中层统筹调度、上层重构编排’的云原生混合架构不仅赋予了系统极强的异构算力调度能力更将集团内部的 GPU 综合利用率提升了三倍以上。在微服务应用层的设计上我全面引入 Service Mesh服务网格技术解决了跨语言、跨团队异构系统服务治理极其复杂的痛点实现了业务算法逻辑与底层网络通信的彻底解耦。自动驾驶云端系统是一个极其复杂的异构生态网关接入层由 Go 语言开发业务控制逻辑由 Java 编写而核心的感知与规控算法服务往往是用 C 或 Python 实现的。在过去为了实现服务间的限流、熔断和全链路追踪我们需要在每种语言的 SDK 中硬编码治理逻辑导致业务代码臃肿不堪。更致命的是在进行算法“影子模式”测试时极难在代码层面对特定车型的流量进行精准拷贝与路由。为此我选用了基于 Istio 的 Service Mesh 架构将流量路由、超时重试、熔断降级等非业务功能全部下沉到伴生于应用容器的 Sidecar边车代理中。开发与算法人员只需专注具体的规控逻辑而 Sidecar 会透明地接管所有进出流量。借助这一云原生通信底座我们极其轻松地实现了基于车架号VIN和地域标签的动态流量路由让实车上报的数据可以无缝复制并引流到新版本的算法集群进行“影子验证”大幅加速了自动驾驶算法的迭代安全与效率。在底层数据服务层的规划中我采用 PostgreSQL 结合流式数据湖与 Elasticsearch 构建了多模态数据底座彻底解决了50万辆车高并发上报数据的存储成本与检索性能瓶颈问题实现了平台数据的无限水平扩展与毫秒级查询响应。云控平台最核心的挑战在于处理复杂异构数据既有结构化的车辆配置信息又有半结构化的车端日志还有非结构化的海量点云与图像。面对这一致命瓶颈我彻底革新了数据层架构采用了“各司其职”的混合存储策略。首先我保留了成熟稳定的 PostgreSQL配合分布式中间件专门处理强一致性的车辆注册状态、用户账号及业务订单等核心关系型数据确保交易的绝对安全其次对于海量的离线训练数据我引入了基于对象存储OSS的流式数据湖Iceberg将 PB 级的点云和图像数据低成本持久化供 Ray 框架进行高吞吐扫描最后针对诸如“电池热失控告警日志分析”这类需要极低延迟的实时全文检索需求我将清洗后的文本日志与告警事件通过 Kafka 准实时同步至 Elasticsearch 集群。这套多模态的云原生数据架构不仅大幅降低了系统的整体存储成本还完美支撑了结构化事务、复杂检索与大规模离线计算等多元化业务场景确保了车辆高危故障告警的绝对实时。经过团队大半年的日夜奋战新一代自动驾驶云控与数据平台于2024年10月顺利全量上线。在随后的冬季寒冷工况大并发实测中新平台经受住了百万级连接洪峰的严苛洗礼。系统核心链路接口的响应时间稳定在 50 毫秒以内异构微服务的灰度发布成功率达到了100%整体资源服务器的持有成本显著下降。回顾整个项目的历程云原生层次架构的全面落地不仅是一次技术的升级更是自动驾驶研发效能的一次革命。通过底层 K8sRay 的算力自动化、应用层治理的网格化以及数据层多模态底座的构建平台拥有了面向百万级车队演进的强悍基石。当然目前系统在边缘计算车端计算与云端编排的协同深度整合上还有进一步优化的空间。在未来的平台迭代中我计划探索引入 KubeEdge 等云原生边缘计算框架将部分实时性要求极高的清洗与告警微服务直接下发至车端的车机系统中运行在现有云原生架构的基础上追求更为极致的“车云协同”与端到端的高可用性。

相关文章:

论云原生层次架构在自动驾驶云控平台中的应用

【摘要】2024年3月,我作为核心系统架构师,主导了某新能源车企“新一代自动驾驶云控与数据平台”的重构与研发工作。该平台主要负责接入现役50万辆在线车辆,处理海量的多模态工况数据,并支撑大规模自动驾驶算法的并行仿真与实时监控…...

ElastiFlow企业级网络流量监控解决方案:5大核心优势与架构深度解析

ElastiFlow企业级网络流量监控解决方案:5大核心优势与架构深度解析 【免费下载链接】elastiflow Network flow analytics (Netflow, sFlow and IPFIX) with the Elastic Stack 项目地址: https://gitcode.com/gh_mirrors/el/elastiflow 在数字化转型浪潮中&a…...

Notepad2-mod终极指南:掌握这款高效开源文本编辑器的深度开发与扩展

Notepad2-mod终极指南:掌握这款高效开源文本编辑器的深度开发与扩展 【免费下载链接】notepad2-mod LOOKING FOR DEVELOPERS - Notepad2-mod, a Notepad2 fork, a fast and light-weight Notepad-like text editor with syntax highlighting 项目地址: https://gi…...

Zed与VSCode争议背后真相:性能瓶颈到底是谁的锅

别被骗了!Zed比VS Code快?真正的原因让你哭笑不得!本文深入分析开发者社区对Zed编辑器与VS Code的争议,澄清性能瓶颈的真相在于语言服务器协议(LSP)而非编辑器本身,揭示Zed真正的优势在于原生Vim模式和架构简洁性&…...

【上篇】SenseNova-U1:基于NEO-unify架构统一多模态理解与生成

📣 更新动态 [2026.05.15] 发布 SenseNova-U1-8B-MoT-信息图表 📊,优化信息图表生成功能。详情请参阅 U1信息图表模型,并查看 ✨ 信息图表展示 获取100个生成示例。 ✨ 点击展开历史动态 [2026.05.10] 发布🔥SenseNo…...

图片跨域之谜:img 标签真的“畅通无阻”吗

&#x1f5bc;️ 图片跨域之谜&#xff1a;img 标签真的“畅通无阻”吗&#xff1f; &#x1f914; 核心疑问 在前端开发中&#xff0c;我们常听到“同源策略”限制了跨域请求。但是&#xff0c;当你直接在 HTML 中写 <img src"https://other-domain.com/logo.png&qu…...

C++的内存管理详细解释

一、C/C内存分布栈又叫堆栈&#xff0c;非静态局部变量/函数参数/返回值等等&#xff0c;栈是向下增长的。内存映射段是高效的I/O映射方式&#xff0c;用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存&#xff0c;做进程间通信。堆用于程序运行时动态内存分…...

Internet Archive Downloader终极指南:三步永久保存数字图书馆书籍

Internet Archive Downloader终极指南&#xff1a;三步永久保存数字图书馆书籍 【免费下载链接】internet_archive_downloader A chrome/firefox extension that download books from Internet Archive(archive.org) and HathiTrust Digital Library (hathitrust.org) 项目地…...

宏裕塑胶代理沙伯基础创新SABIC(原GE塑料)全线工程塑料产品与技术服务

宏裕塑胶依托源头直采模式&#xff0c;整合沙伯基础创新 SABIC&#xff08;原 GE 塑料&#xff09;等国际一线品牌工程塑料原料&#xff0c;为制造业企业提供高性价比、稳定可控的供应链解决方案&#xff0c;助力客户降本增效&#xff0c;适用于汽车零配件、精密电子、注塑生产…...

SABIC塑料解决方案:宏裕塑胶全面代理原GE塑料高性能材料产品

宏裕塑胶依托源头直采优势整合沙伯基础创新SABIC等国际品牌资源&#xff0c;为制造业客户提供高性价比通用工程塑料原料及全流程技术支撑&#xff0c;助力企业降本增效。其代理产品涵盖PETG、PCTG、PBT、TPEE等全品类工程塑料&#xff0c;专为塑胶制品厂、汽车零部件厂等客户群…...

宏裕塑胶携手沙伯基础创新塑料,打造高端工程塑料解决方案

导读&#xff1a;在制造业转型升级的关键节点&#xff0c;高端工程塑料解决方案正成为企业提升产品竞争力的核心要素。宏裕塑胶携手沙伯基础创新塑料&#xff0c;打造高端工程塑料解决方案&#xff0c;通过整合国际顶尖原料资源与本土技术服务能力&#xff0c;为下游企业提供兼…...

SABIC塑料与宏裕塑胶的卓越合作:高性能材料的行业应用

导读&#xff1a;在制造业转型升级的关键时期&#xff0c;高性能工程塑料的应用正成为企业提升产品竞争力的核心要素。SABIC塑料与宏裕塑胶的卓越合作&#xff0c;为行业提供了从原料选型到技术落地的完整解决方案&#xff0c;这种强强联合的模式正在重新定义高端材料供应体系。…...

零经验应届生简历怎么写?3分钟AI生成直接拿面试

毕业季到了&#xff0c;你是不是也跟我一样&#xff0c;简历投了几十份&#xff0c;结果石沉大海&#xff0c;连个面试机会都没有&#xff1f;尤其看到那些社招大佬&#xff0c;简历上项目经验、数据成果写得一套一套的&#xff0c;再看看自己的&#xff0c;除了实习经历就是课…...

2026年同步网盘哪个好?10款支持本地文件夹自动同步与实时备份工具盘点

在 2026 年&#xff0c;数据即资产。传统“手动上传”已难以满足高频办公&#xff1a;文件一多就容易漏传、版本混乱、协作效率下降。本地文件夹自动同步&#xff08;落盘即上云&#xff09;正在成为衡量网盘生产力的核心指标——既能防止硬盘故障导致的数据丢失&#xff0c;也…...

如何彻底解决游戏键盘冲突:Hitboxer SOCD Cleaner完整指南

如何彻底解决游戏键盘冲突&#xff1a;Hitboxer SOCD Cleaner完整指南 【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否在激烈的游戏对战中遇到过这样的困扰&#xff1f;同时按下W和S键时角色突然卡顿&…...

[寻找时间序列数据中异常值终极指南(第三部分)](https://towardsdatascience.com/the-ultimate-guide-to-finding-outliers-in-yo

原文&#xff1a;towardsdatascience.com/the-ultimate-guide-to-finding-outliers-in-your-time-series-data-part-3-0ff73ce28ca3...

在多元市场中的数据角色招聘与面试

原文&#xff1a;towardsdatascience.com/the-two-sides-of-hiring-recruiting-vs-interviewing-for-data-roles-in-diverse-markets-f65b49990687 招聘桌两边的故事 我有在招聘桌两边的故事&#xff0c;有些是成功的&#xff0c;有些则不那么成功。 例如&#xff0c;我可以告…...

HS2汉化补丁终极指南:轻松实现Honey Select 2中文界面

HS2汉化补丁终极指南&#xff1a;轻松实现Honey Select 2中文界面 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 还在为Honey Select 2的日文界面而困扰吗&…...

番茄小说下载器终极指南:三步打造你的私人数字图书馆

番茄小说下载器终极指南&#xff1a;三步打造你的私人数字图书馆 【免费下载链接】fanqienovel-downloader 下载番茄小说 项目地址: https://gitcode.com/gh_mirrors/fa/fanqienovel-downloader 你是否曾在深夜追更小说时突然断网&#xff1f;或者想在地铁上继续阅读却发…...

告别手动下载:用CNKI-download轻松实现知网文献批量获取

告别手动下载&#xff1a;用CNKI-download轻松实现知网文献批量获取 【免费下载链接】CNKI-download :frog: 知网(CNKI)文献下载及文献速览爬虫 (Web Scraper for Extracting Data) 项目地址: https://gitcode.com/gh_mirrors/cn/CNKI-download 还在为毕业论文的文献收…...

如何在脑电信号处理的星辰大海中,找到你的开源坐标?[特殊字符]

如何在脑电信号处理的星辰大海中&#xff0c;找到你的开源坐标&#xff1f;&#x1f680; 【免费下载链接】eeglab EEGLAB is an open source signal processing environment for electrophysiological signals running on Matlab and developed at the SCCN/UCSD 项目地址: …...

pyqt 风格

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ 样式模块 定义全局样式表和动态样式生成 """from typing import Dictclass StyleManager:"""样式管理器"""# 颜色常量COLORS {bg_dark: #0F172A,bg_medium:…...

深度解密:如何彻底掌控Windows Defender的系统级权限与持久化配置

深度解密&#xff1a;如何彻底掌控Windows Defender的系统级权限与持久化配置 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-con…...

经手100万+终端后,聊聊校园门锁Sub-1G和Cat.1怎么选

做校园联网门锁项目的人大概都遇到过这个纠结&#xff1a;组网方案到底选Sub-1G还是4G Cat.1&#xff1f;我们团队&#xff08;KEENZY中科易安&#xff09;经手了100万在线终端的运行数据&#xff0c;可以明确地说——两种方案没有绝对的优劣&#xff0c;只有场景是否匹配。选错…...

家居用品展行业深度分析:格局、痛点与前景

家居用品展是家居产业的风向标与商贸核心枢纽&#xff0c;2026年行业正处于存量焕新、设计驱动、数智赋能的关键转型期。本文从发展现状、核心格局、痛点拆解、趋势机遇、前景预判五大维度&#xff0c;深度剖析家居用品展行业的底层逻辑与发展脉络&#xff0c;助力从业者把握行…...

福州儿童康复推荐

当我们谈论儿童康复时&#xff0c;其实是在谈论一个家庭面对未知时的所有期许与不安。每一个孩子的成长节奏都值得被尊重&#xff0c;尤其是那些在语言、社交或行为上稍显“慢热”的小天使。在福州&#xff0c;有这样一处地方&#xff0c;它不追求“速成”&#xff0c;也不承诺…...

AI人工智能行业的现状:为什么说AI从业者的需求越来越大

一、AI产业爆发式增长&#xff1a;需求激增的时代底色2026年&#xff0c;人工智能产业已步入爆发式增长的黄金期&#xff0c;成为驱动全球经济复苏与产业变革的核心引擎。从全球市场来看&#xff0c;2025年AI市场规模达7575.8亿美元&#xff0c;同比增长18.7%&#xff0c;预计2…...

家庭宽带上网背后的隐形功臣:一文拆解光猫/路由器里的NAT和DHCP是怎么协同工作的

家庭网络中的隐形守护者&#xff1a;NAT与DHCP如何编织你的数字生活 当你躺在沙发上用手机追剧时&#xff0c;是否想过为什么所有家庭设备都能和平共处在同一网络&#xff1f;192.168.1.x这串神秘数字背后&#xff0c;藏着两套精密的协议系统——它们像建筑物的水电管线般隐形却…...

今日算法(构造二叉搜索树)

题目描述给你一个整数数组 nums&#xff0c;其中元素已经按 升序 排列&#xff0c;请你将其转换为一棵 平衡 二叉搜索树&#xff08;BST&#xff09;。平衡二叉搜索树&#xff1a;左右两个子树的高度差的绝对值不超过 1每个节点的左右子树都是平衡二叉树二叉搜索树的中序遍历结…...

别再用 STVP 了!用 IAR 3.11.1 调试 STM8S003 点灯程序,效率翻倍

告别STVP&#xff1a;用IAR 3.11.1高效调试STM8S003点灯程序全指南 在嵌入式开发领域&#xff0c;工具链的选择往往决定了开发效率的上限。对于STM8系列开发&#xff0c;许多工程师仍在使用STVP这种基础的烧录工具&#xff0c;却不知已经错过了IAR Embedded Workbench带来的效…...