精选案例展 | 智己汽车—全栈可观测驱动智能化运营与成本优化
本案例为“观测先锋 · 2024 可观测平台创新应用案例大赛”精选案例,同时荣获IT168“2024技术卓越奖评选-年度创新解决方案”奖。

项目背景
近年来,中国汽车行业进入转型升级阶段,智能网联技术成为行业发展的核心。车联网、自动驾驶等技术的加速研发与应用,推动电动化、智能化、网联化和共享化“四大趋势”不断发展。中国在新能源汽车领域持续保持全球领先地位,2020年发布的《智能汽车创新发展战略》明确提出,到2025年,中国将实现有条件自动驾驶智能汽车的规模化生产,并推动高度自动驾驶技术在特定环境下的市场化应用,基于此,国内车企通过云计算、容器化、微服务等技术加速数字化转型,推动智能化、网联化与服务化的深度融合。然而,数字化转型也带来系统稳定性、性能瓶颈和潜在风险,车企需在激烈的市场竞争中提升技术水平,以抓住技术变革的机遇,实现可持续发展。
在这一宏观背景下,智己汽车在2024年度实现了非凡的跃升。全年销量攀升至6.55万辆,同时对于核心技术研发的投入亦呈现出强劲的增长态势。智己始终把核心技术创新作为战略重点,持续优化其云架构,整合云资源种类70+、各类线路30+及系统数量1000+,极大提升了平台的可扩展性与稳定性。

可观测性建设过程中的难点及挑战
1. 在智己汽车的混合云环境建设中,运维难度显著增加。由于云平台的异构性,智己汽车产品架构需要支持复杂的多云场景,确保不同云资源之间的高效协同。如何实现跨云平台的可观测性,确保系统稳定性和快速定位问题成为核心挑战。此外,混合云环境下的成本管控也变得更加复杂,智己汽车需要在不同云服务商之间优化资源使用,避免非必要开支。安全合规性方面,数据加密、访问控制和合规性要求也必须严格保障。综合来看,智己汽车面临着混合云环境下运维、监控、安全与成本管控等多重挑战。

2. 可观测性能力建设缺乏统一的认知和建设方式。尽管可观测性概念在云原生时代快速发展,但许多企业对其理解仍停留在传统监控手段上,对可观测性的内涵及应用场景缺乏全面了解。此前,智己汽车在可观测性建设方面的应用和实践仍处于初步阶段,缺乏统一的认知和清晰的建设路径。这导致在可观测性技术落地和最佳实施上存在一定不足。
3. 复杂业务系统故障排查困难,影响客户体验。智己汽车业务涵盖零部件和整车的研发、制造、销售、以及汽车服务与贸易等,业务之间盘根错杂,支撑系统繁多。一旦IT系统或该系统所在链路出现故障,通过各平台和应用访问产品的客户会第一时间收到相关报错信息。传统IT接到业务故障投诉后,需要对各种关联系统的网络、应用、数据库、主机进行逐一排查,极大地影响客户访问体验,对业务造成严重影响。
应用场景
1. 基础设施统一纳管—多云单平台。Bonree ONE一体化智能可观测平台赋能智己汽车实现业务请求的全链路追踪与性能分析,打造统一化多云管理平台,实现了对异构云资源的集中管理,同时审查不同的云基础架构中的多个应用,帮助企业快速识别和定位应用故障,提高排障效率,赋能智己汽车优化云服务表现。


2. 基础设施统一纳管—自动化运维。Bonree ONE平台为用户提供了端到端的可观测性,覆盖整个堆栈的自动化管理。通过实现从应用部署、更新、配置和管理,到数据采集监控、服务生命周期管理和故障诊断的全流程自动化,极大地提升了IT运维效率,确保基础设施的统一纳管和高效运维。
3. 多深度拓扑及监控。智己汽车通过Bonree ONE实现了多深度拓扑和监控,全面记录了请求从接收到处理完成整个生命周期内的调用链路。例如,在接口优化方面,通过平台实时监控请求链路,成功发现app前端OTA查询接口超时问题,定位到数据库连接数不足,并通过接口代码优化解决;在压测并发场景下,Bonree ONE帮助团队定位到大数据服务数据库中的SQL执行延迟,提出限流优化方案;在根因分析方面,平台帮助解决B端查询响应超时问题,避免了循环调用,并在TO C业务中准确定位前端报错的根因,识别为人车绑定关系错误并提供解决方案。

项目成果与收益
1. 实现了云资源管理从“一次性采购”向“持续运营”的转变。智己汽车成功应用Bonree ONE一体化智能可观测平台,并通过FinOps实现了云资源管理的转型,实现从“一次性采购”到“持续运营”的转变,推动了技术、业务和财务的深度协同。凭借Bonree ONE强大的数据处理能力及多维度的可观测能力,智己汽车实现了精准的云成本优化,能够有效预测和控制未来成本,确保云资源的高效使用和财务透明度。同时,智己汽车实现了事中监控与异常可视化,能够实时跟踪云资源使用情况并及时识别潜在问题,助力智己汽车践行“持续运营”,优化组织、文化、流程和自动化,实现了全面的资源优化与业务增长的可持续平衡。

2. 云平台基础资源成本节约30%。通过应用Bonree ONE一体化智能可观测平台,智己汽车实现了云平台基础资源成本节约30%。平台通过运行成本的可视化,提供用量、预测趋势分析,并通过维度分类对成本浪费进行精准识别和展示,助力智己汽车实现了资源优化及弹性预测与定时弹性能力优化,进一步提升了资源配置效率,确保了灵活计费方案的实施,全面提升成本控制能力。
3. 提升混合云管平台资源的管理与优化能力。智己汽车通过Bonree ONE一体化智能可观测平台,提升了混合云管平台资源的管理与优化能力。Bonree ONE支持统一自动化编排、可视化监控、资源管理和告警功能,实时跟踪云资源使用情况,快速响应潜在问题。同时,助力混合云管平台通过费用管理、成本分析、实时费用追踪等,精确优化云成本。Bonree ONE适配多云环境、提升业务敏捷性等优势,显著增强了整体治理能力。

4. 故障感知和根因定位时间缩短80%。接入Bonree ONE一体化智能可观测平台后,运维和业务同事能够在接到报障单后迅速查看故障时间段的会话记录,迅速定位为前端问题。进一步通过下钻链路和服务指标,精准识别后端执行异常步骤,并与后端同事共享详细链路信息。后端同事通过绑定的指标视图,直观看到报错链路调用信息、服务指标和数据库慢查询。最终,团队迅速确认问题并给出解决方案,故障排查时间从原本的120分钟缩短至20分钟,大幅提升了问题定位效率和响应速度。

总 结
在多云环境下,智己汽车实现了从“云资源管理”到“持续运营“的全面转型,显著升了云资源的使用效率、成本控制能力以及故障排查速度。智己汽车通过精确的成本优化与自动化运维,在保障系统稳定性的同时,进一步提升了其整体运营效率与可持续发展能力,为推动智能化、网联化与服务化的深度融合打下了坚实的基础。未来,智己汽车将在可观测性与云资源优化的基础上,不断深耕技术创新之路,持续提升自身在全球智能汽车领域竞争力,引领未来出行的智能革命。
企业介绍
智己汽车是由上汽集团、浦东新区、阿里巴巴集团三方联合打造的高端智能纯电汽车品牌。通过人工智能、大数据让用户成为汽车价值链的核心驱动,打破用户与企业的边界,从底层打通整车与驾乘体验高度相关的ECU控制器,将客户场景和汽车感知充分融合,鼓励用户进行高度自定义,实现汽车智能化宽度和深度的全新突破。
相关文章:
精选案例展 | 智己汽车—全栈可观测驱动智能化运营与成本优化
本案例为“观测先锋 2024 可观测平台创新应用案例大赛”精选案例,同时荣获IT168“2024技术卓越奖评选-年度创新解决方案”奖。 项目背景 近年来,中国汽车行业进入转型升级阶段,智能网联技术成为行业发展的核心。车联网、自动驾驶等技术的加速…...
MySQL 使用 `WHERE` 子句时 `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的区别解析
文章目录 1. COUNT() 函数的基本作用2. COUNT(*)、COUNT(1) 和 COUNT(column) 的详细对比2.1 COUNT(*) —— 统计所有符合条件的行2.2 COUNT(1) —— 统计所有符合条件的行2.3 COUNT(column) —— 统计某一列非 NULL 的记录数 3. 性能对比3.1 EXPLAIN 分析 4. 哪种方式更好&…...
Linux运维——网络管理
Linux网络管理 一、Linux网络应用要点二、命令常见用法2.1、curl2.1.1、发送GET请求2.1.2、发送POST请求2.1.3、设置请求头2.1.4、处理cookies2.1.5、处理重定向2.1.6、调试和详细信息2.1.7、使用代理2.1.8、文件上传2.1.9、其它常用选项2.1.10、综合示例 2.2、wget2.2.1、基本…...
STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数
STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件,不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F401RCT6开发板…...
Jmeter+Jenkins接口压力测试持续集成
项目介绍 接口功能测试应用: http://www.weather.com.cn/data/cityinfo/<city_code>.html 测试功能:获取对应城市的天气预报 请求方法:Get 压测脚本开发工具:jmeter 源码脚本位置: https://github.com/shife…...
深入浅出ES6:现代JavaScript的基石
ES6(ECMAScript 2015)是JavaScript语言的一次重大更新,引入了许多新特性,使JavaScript更加强大、优雅和易于维护。这些特性已经成为现代JavaScript开发的基石,掌握它们对于任何JavaScript开发者都至关重要。本文将深入…...
实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能
下面将详细介绍如何实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能。我们将按照以下步骤进行: 步骤1&#x…...
潜水泵,高效排水,守护城市与农田|深圳鼎跃
洪水是常见的自然灾害,在春夏季节的我国降水多为丰富,容易造成城市内部的洪涝灾害。特别是低洼地区的积水,不仅容易造成城市交通的出行不便,还存在潜在的隐患,严重影响了人们正常生活。 潜水泵作为一种高效、可靠的排水…...
易基因:RNA甲基化修饰和R-loop的交叉调控:从分子机制到临床意义|深度综述
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 R-loop(RNA-DNA杂合结构)是转录调控、DNA复制和修复等关键细胞过程的重要组成部分。但R-loop异常积累可能会破坏基因组完整性,从而导致多种疾病的发生…...
115 道 MySQL 面试题,从简单到深入!
1. 什么是数据库事务? 数据库事务是一个作为单个逻辑工作单元执行的一系列操作。事务具有ACID属性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性…...
一周学会Flask3 Python Web开发-flask3上下文全局变量session,g和current_app
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili flask3提供了session,g和current_app上下文全局变量来方便我们操作访问数据。 以下是一个表格,用于比较Flask中的…...
MFC学习笔记-1
一、编辑框和按钮 //.h文件private:CString str;//给窗口类加了一个变量(定义一个成员变量),关联到IDC_EDIT1中(要在实现中关联,源文件文件夹中)CString str2;//接收button2,和IDC_EDIT2绑定 p…...
Linux搜索查找类指令
1、find指令 基本语法:find [搜索范围] [选项] 功能:将从指定目录向下递归地遍历其各个子目录,将满足条件的文件或目录显示在终端。 常用选项: 操作 命令示例 说明 查找指定路径下的所有文件 find /path/to/dir 查找指定目…...
江协科技/江科大-51单片机入门教程——P[1-1] 课程简介P[1-2] 开发工具介绍及软件安装
本教程也力求在玩好单片机的同时了解一些计算机的基本概念,了解电脑的一些基本操作,了解电路及其元器件的基本理论,为我们学习更高级的单片机,入门IT和信息技术行业,打下一定的基础。 目录 1.课程简介 2.开发工具及…...
监听load和hashchange事件
监听load和hashchange事件 上篇文章中,我们已经将菜谱的数据给拿到,并且已经可以渲染到页面上,本篇我们将为程序添加一些事件; 注:本项目来自于Jonas Schmedtmann创建,文章仅仅作为学习作用! 菜…...
深度剖析Seata源码:解锁分布式事务处理的核心逻辑
文章目录 写在文章开头如何使用源码(配置转掉)基于AT模式详解Seata全链路流程Seata服务端启动本地服务如何基于GlobalTransaction注解开启事务客户端如何开启分布式事务RM和TC如何协调处理分支事务RM生成回滚日志事务全局提交与回滚小结参考写在文章开头 在当今分布式系统日益…...
在 Ansys Mechanical 中解决干涉拟合
有意和无意的过盈配合在工程设计和有限元分析 (FEA) 中很常见。当两个组件重叠或接触时,就会发生这种情况,从而产生应力和变形,必须仔细分析以确保功能正常。有意干涉,例如轴和轴承之间的压配合或用于固定金…...
JMeter性能问题
性能测试中TPS上不去的几种原因 性能测试中TPS上不去的几种原因_tps一直上不去-CSDN博客 网络带宽 连接池 垃圾回收机制 压测脚本 通信连接机制 数据库配置 硬件资源 压测机 业务逻辑 系统架构 CPU过高什么原因 性能问题分析-CPU偏高 - 西瓜汁拌面 - 博客园 US C…...
美国国防部(DoD)SysML v2迁移指南项目
DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 分享一篇SysML v1向SysML v2迁移的资料。 下载地址:https://ndia.dtic.mil/wp-content/uploads/2023/systems/Thurs_1560710_Stirk.pdf 核心内容用DeepSeek整理如下&#…...
JavaWeb-GenericServlet源码分析(适配器/模板方法)
文章目录 类直接实现Servlet接口的弊端Servlet接口的方法适配器设计模式 适配器对象的改造关于init方法的ServletConfig对象来源使用模板方法设计模式改造init方法 GenericServlet内置抽象类ServletConfig接口ServletConfig接口简介测试再谈GenericServlet抽象类 类直接实现Ser…...
Java 8 Stream API 入门到实践详解
一、告别 for 循环! 传统痛点: Java 8 之前,集合操作离不开冗长的 for 循环和匿名类。例如,过滤列表中的偶数: List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...
8k长序列建模,蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂
蛋白质结合剂(如抗体、抑制肽)在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上,高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术,但这类方法普遍面临资源消耗巨大、研发周期冗长…...
大学生职业发展与就业创业指导教学评价
这里是引用 作为软工2203/2204班的学生,我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要,而您认真负责的教学态度,让课程的每一部分都充满了实用价值。 尤其让我…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...
C# 求圆面积的程序(Program to find area of a circle)
给定半径r,求圆的面积。圆的面积应精确到小数点后5位。 例子: 输入:r 5 输出:78.53982 解释:由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982,因为我们只保留小数点后 5 位数字。 输…...
深度学习习题2
1.如果增加神经网络的宽度,精确度会增加到一个特定阈值后,便开始降低。造成这一现象的可能原因是什么? A、即使增加卷积核的数量,只有少部分的核会被用作预测 B、当卷积核数量增加时,神经网络的预测能力会降低 C、当卷…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...
系统掌握PyTorch:图解张量、Autograd、DataLoader、nn.Module与实战模型
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文通过代码驱动的方式,系统讲解PyTorch核心概念和实战技巧,涵盖张量操作、自动微分、数据加载、模型构建和训练全流程&#…...
学习一下用鸿蒙DevEco Studio HarmonyOS5实现百度地图
在鸿蒙(HarmonyOS5)中集成百度地图,可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API,可以构建跨设备的定位、导航和地图展示功能。 1. 鸿蒙环境准备 开发工具:下载安装 De…...
Linux部署私有文件管理系统MinIO
最近需要用到一个文件管理服务,但是又不想花钱,所以就想着自己搭建一个,刚好我们用的一个开源框架已经集成了MinIO,所以就选了这个 我这边对文件服务性能要求不是太高,单机版就可以 安装非常简单,几个命令就…...
