精选案例展 | 智己汽车—全栈可观测驱动智能化运营与成本优化
本案例为“观测先锋 · 2024 可观测平台创新应用案例大赛”精选案例,同时荣获IT168“2024技术卓越奖评选-年度创新解决方案”奖。
项目背景
近年来,中国汽车行业进入转型升级阶段,智能网联技术成为行业发展的核心。车联网、自动驾驶等技术的加速研发与应用,推动电动化、智能化、网联化和共享化“四大趋势”不断发展。中国在新能源汽车领域持续保持全球领先地位,2020年发布的《智能汽车创新发展战略》明确提出,到2025年,中国将实现有条件自动驾驶智能汽车的规模化生产,并推动高度自动驾驶技术在特定环境下的市场化应用,基于此,国内车企通过云计算、容器化、微服务等技术加速数字化转型,推动智能化、网联化与服务化的深度融合。然而,数字化转型也带来系统稳定性、性能瓶颈和潜在风险,车企需在激烈的市场竞争中提升技术水平,以抓住技术变革的机遇,实现可持续发展。
在这一宏观背景下,智己汽车在2024年度实现了非凡的跃升。全年销量攀升至6.55万辆,同时对于核心技术研发的投入亦呈现出强劲的增长态势。智己始终把核心技术创新作为战略重点,持续优化其云架构,整合云资源种类70+、各类线路30+及系统数量1000+,极大提升了平台的可扩展性与稳定性。
可观测性建设过程中的难点及挑战
1. 在智己汽车的混合云环境建设中,运维难度显著增加。由于云平台的异构性,智己汽车产品架构需要支持复杂的多云场景,确保不同云资源之间的高效协同。如何实现跨云平台的可观测性,确保系统稳定性和快速定位问题成为核心挑战。此外,混合云环境下的成本管控也变得更加复杂,智己汽车需要在不同云服务商之间优化资源使用,避免非必要开支。安全合规性方面,数据加密、访问控制和合规性要求也必须严格保障。综合来看,智己汽车面临着混合云环境下运维、监控、安全与成本管控等多重挑战。
2. 可观测性能力建设缺乏统一的认知和建设方式。尽管可观测性概念在云原生时代快速发展,但许多企业对其理解仍停留在传统监控手段上,对可观测性的内涵及应用场景缺乏全面了解。此前,智己汽车在可观测性建设方面的应用和实践仍处于初步阶段,缺乏统一的认知和清晰的建设路径。这导致在可观测性技术落地和最佳实施上存在一定不足。
3. 复杂业务系统故障排查困难,影响客户体验。智己汽车业务涵盖零部件和整车的研发、制造、销售、以及汽车服务与贸易等,业务之间盘根错杂,支撑系统繁多。一旦IT系统或该系统所在链路出现故障,通过各平台和应用访问产品的客户会第一时间收到相关报错信息。传统IT接到业务故障投诉后,需要对各种关联系统的网络、应用、数据库、主机进行逐一排查,极大地影响客户访问体验,对业务造成严重影响。
应用场景
1. 基础设施统一纳管—多云单平台。Bonree ONE一体化智能可观测平台赋能智己汽车实现业务请求的全链路追踪与性能分析,打造统一化多云管理平台,实现了对异构云资源的集中管理,同时审查不同的云基础架构中的多个应用,帮助企业快速识别和定位应用故障,提高排障效率,赋能智己汽车优化云服务表现。
2. 基础设施统一纳管—自动化运维。Bonree ONE平台为用户提供了端到端的可观测性,覆盖整个堆栈的自动化管理。通过实现从应用部署、更新、配置和管理,到数据采集监控、服务生命周期管理和故障诊断的全流程自动化,极大地提升了IT运维效率,确保基础设施的统一纳管和高效运维。
3. 多深度拓扑及监控。智己汽车通过Bonree ONE实现了多深度拓扑和监控,全面记录了请求从接收到处理完成整个生命周期内的调用链路。例如,在接口优化方面,通过平台实时监控请求链路,成功发现app前端OTA查询接口超时问题,定位到数据库连接数不足,并通过接口代码优化解决;在压测并发场景下,Bonree ONE帮助团队定位到大数据服务数据库中的SQL执行延迟,提出限流优化方案;在根因分析方面,平台帮助解决B端查询响应超时问题,避免了循环调用,并在TO C业务中准确定位前端报错的根因,识别为人车绑定关系错误并提供解决方案。
项目成果与收益
1. 实现了云资源管理从“一次性采购”向“持续运营”的转变。智己汽车成功应用Bonree ONE一体化智能可观测平台,并通过FinOps实现了云资源管理的转型,实现从“一次性采购”到“持续运营”的转变,推动了技术、业务和财务的深度协同。凭借Bonree ONE强大的数据处理能力及多维度的可观测能力,智己汽车实现了精准的云成本优化,能够有效预测和控制未来成本,确保云资源的高效使用和财务透明度。同时,智己汽车实现了事中监控与异常可视化,能够实时跟踪云资源使用情况并及时识别潜在问题,助力智己汽车践行“持续运营”,优化组织、文化、流程和自动化,实现了全面的资源优化与业务增长的可持续平衡。
2. 云平台基础资源成本节约30%。通过应用Bonree ONE一体化智能可观测平台,智己汽车实现了云平台基础资源成本节约30%。平台通过运行成本的可视化,提供用量、预测趋势分析,并通过维度分类对成本浪费进行精准识别和展示,助力智己汽车实现了资源优化及弹性预测与定时弹性能力优化,进一步提升了资源配置效率,确保了灵活计费方案的实施,全面提升成本控制能力。
3. 提升混合云管平台资源的管理与优化能力。智己汽车通过Bonree ONE一体化智能可观测平台,提升了混合云管平台资源的管理与优化能力。Bonree ONE支持统一自动化编排、可视化监控、资源管理和告警功能,实时跟踪云资源使用情况,快速响应潜在问题。同时,助力混合云管平台通过费用管理、成本分析、实时费用追踪等,精确优化云成本。Bonree ONE适配多云环境、提升业务敏捷性等优势,显著增强了整体治理能力。
4. 故障感知和根因定位时间缩短80%。接入Bonree ONE一体化智能可观测平台后,运维和业务同事能够在接到报障单后迅速查看故障时间段的会话记录,迅速定位为前端问题。进一步通过下钻链路和服务指标,精准识别后端执行异常步骤,并与后端同事共享详细链路信息。后端同事通过绑定的指标视图,直观看到报错链路调用信息、服务指标和数据库慢查询。最终,团队迅速确认问题并给出解决方案,故障排查时间从原本的120分钟缩短至20分钟,大幅提升了问题定位效率和响应速度。
总 结
在多云环境下,智己汽车实现了从“云资源管理”到“持续运营“的全面转型,显著升了云资源的使用效率、成本控制能力以及故障排查速度。智己汽车通过精确的成本优化与自动化运维,在保障系统稳定性的同时,进一步提升了其整体运营效率与可持续发展能力,为推动智能化、网联化与服务化的深度融合打下了坚实的基础。未来,智己汽车将在可观测性与云资源优化的基础上,不断深耕技术创新之路,持续提升自身在全球智能汽车领域竞争力,引领未来出行的智能革命。
企业介绍
智己汽车是由上汽集团、浦东新区、阿里巴巴集团三方联合打造的高端智能纯电汽车品牌。通过人工智能、大数据让用户成为汽车价值链的核心驱动,打破用户与企业的边界,从底层打通整车与驾乘体验高度相关的ECU控制器,将客户场景和汽车感知充分融合,鼓励用户进行高度自定义,实现汽车智能化宽度和深度的全新突破。
相关文章:

精选案例展 | 智己汽车—全栈可观测驱动智能化运营与成本优化
本案例为“观测先锋 2024 可观测平台创新应用案例大赛”精选案例,同时荣获IT168“2024技术卓越奖评选-年度创新解决方案”奖。 项目背景 近年来,中国汽车行业进入转型升级阶段,智能网联技术成为行业发展的核心。车联网、自动驾驶等技术的加速…...
MySQL 使用 `WHERE` 子句时 `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的区别解析
文章目录 1. COUNT() 函数的基本作用2. COUNT(*)、COUNT(1) 和 COUNT(column) 的详细对比2.1 COUNT(*) —— 统计所有符合条件的行2.2 COUNT(1) —— 统计所有符合条件的行2.3 COUNT(column) —— 统计某一列非 NULL 的记录数 3. 性能对比3.1 EXPLAIN 分析 4. 哪种方式更好&…...
Linux运维——网络管理
Linux网络管理 一、Linux网络应用要点二、命令常见用法2.1、curl2.1.1、发送GET请求2.1.2、发送POST请求2.1.3、设置请求头2.1.4、处理cookies2.1.5、处理重定向2.1.6、调试和详细信息2.1.7、使用代理2.1.8、文件上传2.1.9、其它常用选项2.1.10、综合示例 2.2、wget2.2.1、基本…...

STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数
STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件,不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F401RCT6开发板…...

Jmeter+Jenkins接口压力测试持续集成
项目介绍 接口功能测试应用: http://www.weather.com.cn/data/cityinfo/<city_code>.html 测试功能:获取对应城市的天气预报 请求方法:Get 压测脚本开发工具:jmeter 源码脚本位置: https://github.com/shife…...

深入浅出ES6:现代JavaScript的基石
ES6(ECMAScript 2015)是JavaScript语言的一次重大更新,引入了许多新特性,使JavaScript更加强大、优雅和易于维护。这些特性已经成为现代JavaScript开发的基石,掌握它们对于任何JavaScript开发者都至关重要。本文将深入…...
实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能
下面将详细介绍如何实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能。我们将按照以下步骤进行: 步骤1&#x…...

潜水泵,高效排水,守护城市与农田|深圳鼎跃
洪水是常见的自然灾害,在春夏季节的我国降水多为丰富,容易造成城市内部的洪涝灾害。特别是低洼地区的积水,不仅容易造成城市交通的出行不便,还存在潜在的隐患,严重影响了人们正常生活。 潜水泵作为一种高效、可靠的排水…...

易基因:RNA甲基化修饰和R-loop的交叉调控:从分子机制到临床意义|深度综述
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 R-loop(RNA-DNA杂合结构)是转录调控、DNA复制和修复等关键细胞过程的重要组成部分。但R-loop异常积累可能会破坏基因组完整性,从而导致多种疾病的发生…...

115 道 MySQL 面试题,从简单到深入!
1. 什么是数据库事务? 数据库事务是一个作为单个逻辑工作单元执行的一系列操作。事务具有ACID属性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性…...

一周学会Flask3 Python Web开发-flask3上下文全局变量session,g和current_app
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili flask3提供了session,g和current_app上下文全局变量来方便我们操作访问数据。 以下是一个表格,用于比较Flask中的…...
MFC学习笔记-1
一、编辑框和按钮 //.h文件private:CString str;//给窗口类加了一个变量(定义一个成员变量),关联到IDC_EDIT1中(要在实现中关联,源文件文件夹中)CString str2;//接收button2,和IDC_EDIT2绑定 p…...

Linux搜索查找类指令
1、find指令 基本语法:find [搜索范围] [选项] 功能:将从指定目录向下递归地遍历其各个子目录,将满足条件的文件或目录显示在终端。 常用选项: 操作 命令示例 说明 查找指定路径下的所有文件 find /path/to/dir 查找指定目…...

江协科技/江科大-51单片机入门教程——P[1-1] 课程简介P[1-2] 开发工具介绍及软件安装
本教程也力求在玩好单片机的同时了解一些计算机的基本概念,了解电脑的一些基本操作,了解电路及其元器件的基本理论,为我们学习更高级的单片机,入门IT和信息技术行业,打下一定的基础。 目录 1.课程简介 2.开发工具及…...

监听load和hashchange事件
监听load和hashchange事件 上篇文章中,我们已经将菜谱的数据给拿到,并且已经可以渲染到页面上,本篇我们将为程序添加一些事件; 注:本项目来自于Jonas Schmedtmann创建,文章仅仅作为学习作用! 菜…...
深度剖析Seata源码:解锁分布式事务处理的核心逻辑
文章目录 写在文章开头如何使用源码(配置转掉)基于AT模式详解Seata全链路流程Seata服务端启动本地服务如何基于GlobalTransaction注解开启事务客户端如何开启分布式事务RM和TC如何协调处理分支事务RM生成回滚日志事务全局提交与回滚小结参考写在文章开头 在当今分布式系统日益…...

在 Ansys Mechanical 中解决干涉拟合
有意和无意的过盈配合在工程设计和有限元分析 (FEA) 中很常见。当两个组件重叠或接触时,就会发生这种情况,从而产生应力和变形,必须仔细分析以确保功能正常。有意干涉,例如轴和轴承之间的压配合或用于固定金…...
JMeter性能问题
性能测试中TPS上不去的几种原因 性能测试中TPS上不去的几种原因_tps一直上不去-CSDN博客 网络带宽 连接池 垃圾回收机制 压测脚本 通信连接机制 数据库配置 硬件资源 压测机 业务逻辑 系统架构 CPU过高什么原因 性能问题分析-CPU偏高 - 西瓜汁拌面 - 博客园 US C…...

美国国防部(DoD)SysML v2迁移指南项目
DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 分享一篇SysML v1向SysML v2迁移的资料。 下载地址:https://ndia.dtic.mil/wp-content/uploads/2023/systems/Thurs_1560710_Stirk.pdf 核心内容用DeepSeek整理如下&#…...

JavaWeb-GenericServlet源码分析(适配器/模板方法)
文章目录 类直接实现Servlet接口的弊端Servlet接口的方法适配器设计模式 适配器对象的改造关于init方法的ServletConfig对象来源使用模板方法设计模式改造init方法 GenericServlet内置抽象类ServletConfig接口ServletConfig接口简介测试再谈GenericServlet抽象类 类直接实现Ser…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...

19c补丁后oracle属主变化,导致不能识别磁盘组
补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...

CTF show Web 红包题第六弹
提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框,很难让人不联想到SQL注入,但提示都说了不是SQL注入,所以就不往这方面想了 先查看一下网页源码,发现一段JavaScript代码,有一个关键类ctfs…...

Xshell远程连接Kali(默认 | 私钥)Note版
前言:xshell远程连接,私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...

深入理解JavaScript设计模式之单例模式
目录 什么是单例模式为什么需要单例模式常见应用场景包括 单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量 惰性单例通用的惰性单例 结语 什么是单例模式 单例模式(Singleton Pattern&#…...

使用 SymPy 进行向量和矩阵的高级操作
在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...

零基础在实践中学习网络安全-皮卡丘靶场(第九期-Unsafe Fileupload模块)(yakit方式)
本期内容并不是很难,相信大家会学的很愉快,当然对于有后端基础的朋友来说,本期内容更加容易了解,当然没有基础的也别担心,本期内容会详细解释有关内容 本期用到的软件:yakit(因为经过之前好多期…...
Fabric V2.5 通用溯源系统——增加图片上传与下载功能
fabric-trace项目在发布一年后,部署量已突破1000次,为支持更多场景,现新增支持图片信息上链,本文对图片上传、下载功能代码进行梳理,包含智能合约、后端、前端部分。 一、智能合约修改 为了增加图片信息上链溯源,需要对底层数据结构进行修改,在此对智能合约中的农产品数…...
Mysql8 忘记密码重置,以及问题解决
1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

STM32---外部32.768K晶振(LSE)无法起振问题
晶振是否起振主要就检查两个1、晶振与MCU是否兼容;2、晶振的负载电容是否匹配 目录 一、判断晶振与MCU是否兼容 二、判断负载电容是否匹配 1. 晶振负载电容(CL)与匹配电容(CL1、CL2)的关系 2. 如何选择 CL1 和 CL…...