Observability:实现 OpenTelemetry 原生可观察性的商业价值
作者:来自 Elastic David Hope

利用开放标准和简化的数据收集转变组织的可观察性策略。
现代组织面临着前所未有的可观察性挑战。随着系统变得越来越复杂和分散,传统的监控方法难以跟上步伐。由于数据量每两年翻一番,系统跨越多个云和技术,组织需要一种新的方法来保持对其运营的可见性。挑战不仅在于收集更多数据,还在于使这些数据在整个组织中具有可操作性和价值。
工具孤岛和碎片化可观察性的成本
碎片化可观察性的隐性成本远远超出了工具许可证和基础设施费用。组织正在努力应对复杂的监控工具网络,每个工具都有自己的代理、仪表板和数据格式。这种碎片化造成了巨大的运营开销,团队花费宝贵的时间来维护和关联不同系统的数据,而不是推动创新。
考虑一下这个典型的企业场景:当事件发生时,团队必须浏览多种工具来拼凑发生的事情。一个团队在他们的应用程序性能监控 (application performance monitoring - APM) 工具中检查应用程序性能指标;另一个团队在另一个系统中检查基础设施指标;其他团队在另一个平台上挖掘日志。这种碎片化不仅会减慢事件响应速度,而且会使预防问题变得更加困难。
这对团队生产力的影响是巨大的。工程师通常需要在多个工具之间切换上下文来解决问题,从而延长解决问题的时间并增加运营成本。此外,缺乏标准化数据使得跨系统关联信息变得困难,从而产生盲点,可能导致服务中断和客户不满。
为什么 OpenTelemetry 和开放标准会改变一切
OpenTelemetry (OTel) 代表了组织处理可观察性方式的根本转变。作为继 Kubernetes 之后第二活跃的云原生计算基金会项目,OTel 正在打破长期困扰可观察性解决方案的供应商锁定障碍。通过提供标准化的方式来收集和传输遥测数据,OTel 使组织能够选择最适合其需求的工具,而不受专有格式的限制。
这种标准化充当了创新的催化剂。当团队不再需要担心底层的仪表机制时,他们可以专注于从数据中提取有意义的见解。社区驱动标准的力量确保 OTel 继续随着行业需求而发展,并得到 Elastic、Microsoft 和 Google 等主要贡献者的支持。
该项目的惊人增长说明了它自己的故事。凭借超过 9,160 名贡献者、55,640 多个代码提交和 1,100 多家贡献公司,OpenTelemetry 已成为可观察性仪表的事实标准。广泛的采用确保了长期可持续性和持续创新。
OpenTelemetry 带来的实际业务成果
采用 OpenTelemetry 的组织在其运营中看到了切实的好处。通过整合工具和简化维护可以降低成本,而标准化数据收集可以更快地解决问题并提高服务可靠性。当每个人都使用相同的可观察性语言时,团队可以更有效地协作,从而更快地交付功能并改善客户体验。
以下是实践中的情况。
财务影响:
- 通过整合监控解决方案降低工具成本
- 通过标准化实践降低培训和入职成本
- 通过更好的资源利用率(运行更少的代理)降低基础设施成本
运营效率:
- 平均解决时间 (MTTR) 减少 40%–60%
- 简化部署和配置管理
- 减少警报噪音和误报
创新加速:
- 通过内置可观察性加快功能部署
- 改进实验能力
- 通过全面的数据分析做出更好的决策
随着组织对其整个技术堆栈有了清晰的了解,资源分配变得更加高效。这种全面的视角可以实现更好的容量规划和更明智的投资决策,最终带来更好的业务成果。
OpenTelemetry 成功之路
成功采用 OpenTelemetry 始于专注的方法。从一个可以快速展示价值的试点项目开始,无论是检测关键服务还是解决特定的可观察性挑战。培养内部冠军也至关重要——确定了解标准化可观察性的技术和业务优势的团队成员。
采用过程中的关键里程碑
1. 评估阶段:
- 评估当前可观察性成本和痛点
- 确定高价值的初始用例
- 设定明确的成功指标
2. 试点实施:
- 为初始部署选择有界上下文
- 实施基本检测
- 测量和记录早期结果
3. 扩展阶段:
- 在团队之间扩展成功模式
- 制定内部最佳实践
- 构建自动化部署流程
4. 优化阶段:
- 微调数据收集和采样
- 实施高级用例
- 分享成功案例和经验教训
为你的可观察性策略做好未来准备
可观察性的未来正受到不断增加的系统复杂性和数据量的塑造。OpenTelemetry 等开放标准确保组织能够适应这些变化,而不会被锁定在特定的供应商解决方案中。Elastic 对 OpenTelemetry 生态系统的承诺 —— 体现在其作为前三大贡献者的地位和捐赠,包括 Elastic Common Schema 和 Universal Profiling —— 有助于确保组织拥有成功所需的工具。
OpenTelemetry 有能力解决的新兴趋势:
- 边缘计算和物联网可观察性要求
- AI/机器学习 (ML) 系统监控需求
- 跨云服务网格可观察性
- 安全遥测集成
采取下一步行动
首先,通过考虑以下因素来评估你当前的可观察性实践在整个组织中的可访问性:
- 有多少不同的团队需要了解你的遥测数据?
- 对于尝试使用可观察性数据的团队来说,存在哪些专业知识障碍?
- 你当前的数据收集管道有多统一?
- 维护当前可观察性工具所需的总工作量是多少?
通过以下方式衡量你的进度:
- 提高团队间可观察性数据的可访问性
- 减少维护多种收集机制所花费的时间
- 改善不同类型遥测数据之间的相关性
- 加快新团队加入可观察性实践
- 降低遥测管道的复杂性
过渡到 OpenTelemetry 不仅是为了更好的工具,还在于让组织中的每个人都可以访问和使用可观察性。通过现在采用开放标准和简化的管道,你可以让你的团队专注于最重要的事情:构建和改进你的应用程序。立即开始你的旅程,加入不断壮大的组织社区,让可观察性为每个人服务。
准备好让可观察性更容易实现了吗?访问 elastic.co/observability 了解 Elastic 和 OpenTelemetry 如何简化你的可观察性实践。
本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。
原文:OpenTelemetry: The key to modern enterprise observability | Elastic | Elastic Blog
相关文章:
Observability:实现 OpenTelemetry 原生可观察性的商业价值
作者:来自 Elastic David Hope 利用开放标准和简化的数据收集转变组织的可观察性策略。 现代组织面临着前所未有的可观察性挑战。随着系统变得越来越复杂和分散,传统的监控方法难以跟上步伐。由于数据量每两年翻一番,系统跨越多个云和技术&am…...
C语言中的线程本地变量
这处线程本地变量可不是简单的函数中的本地变量。线程除了可以共享存在于进程内的全局变量外,还可以有属于自己的线程本地变量。线程本地变量的值只能够在某个具体线程的生存期内可用。变量的实际存储空间会在线程开始时分配,线程结束时回收。线程不会对…...
Zabbix 推送告警 消息模板 美化(钉钉Webhook机器人、邮件)
目前网络上已经有很多关于Zabbix如何推送告警信息到钉钉机器人、到邮件等文章。 但是在搜索下来,发现缺少了对告警信息的美化的文章。 本文不赘述如何对Zabbix对接钉钉、对接邮件,仅介绍我采用的美化消息模板的内容。 活用AI工具可以减轻很多学习、脑力负…...
罗格斯大学:通过输入嵌入对齐选择agent
📖标题:AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback 🌐来源:arXiv, 2501.13333 🌟摘要 🔸多代理系统必须决定哪个代理最适合给定的任务。我们提出了一种新的架…...
机器学习7-全连接神经网络3-过拟合与超参数
机器学习6-全连接神经网络3-过拟合欠拟合 过拟合应对过拟合-最优方案:获取更多的训练数据应对过拟合-次优方案:正则化应对过拟合-次优方案2:随机失活综合考量 超参数超参数优化方法 过拟合 机器学习的根本问题是优化和泛化的问题。优化——是…...
【PyTorch】7.自动微分模块:开启神经网络 “进化之门” 的魔法钥匙
目录 1. 梯度基本计算 2. 控制梯度计算 3. 梯度计算注意 4. 小节 个人主页:Icomi 专栏地址:PyTorch入门 在深度学习蓬勃发展的当下,PyTorch 是不可或缺的工具。它作为强大的深度学习框架,为构建和训练神经网络提供了高效且灵活…...
11 3D变换模块(transform3d.rs)
transform3d.rs代码定义了一个名为 Transform3D 的 Rust 结构体,它用于表示一个3D变换矩阵。这个结构体是泛型的,包含三个类型参数:T、Src 和 Dst。其中,T 用于矩阵元素的数据类型,Src 和 Dst 用于表示变换的源和目标类…...
MATLAB基础应用精讲-【数模应用】梯度直方图(HOG)(附C++和python代码实现)(二)
目录 前言 几个高频面试题目 HOG与SIFT区别 边缘特征与梯度方向直方图的关系 算法原理 什么是HOG 图像中像素点的梯度计算 为每个cell构造梯度方向直方图HOG 数学模型 方向梯度直方图计算步骤 第一步:预处理 第二步:计算梯度图像 第三步:在8*8的网格中计算梯度…...
pytorch生成对抗网络
人工智能例子汇总:AI常见的算法和例子-CSDN博客 生成对抗网络(GAN,Generative Adversarial Network)是一种深度学习模型,由两个神经网络组成:生成器(Generator)和判别器࿰…...
Baklib在企业知识管理领域的领先地位与三款竞品的深度剖析
内容概要 在现代企业中,知识管理已成为提高工作效率和推动创新的重要手段。Baklib作为一款领先的知识中台,以其集成化和智能化的特性,帮助企业在这一领域取得了显著成就。该平台具备强大的知识收集、整理、存储和共享功能,通过构…...
2 MapReduce
2 MapReduce 1. MapReduce 介绍1.1 MapReduce 设计构思 2. MapReduce 编程规范3. Mapper以及Reducer抽象类介绍1.Mapper抽象类的基本介绍2.Reducer抽象类基本介绍 4. WordCount示例编写5. MapReduce程序运行模式6. MapReduce的运行机制详解6.1 MapTask 工作机制6.2 ReduceTask …...
人工智能学习(四)之机器学习基本概念
机器学习基本概念详细解析:从生活实例轻松入门 在当今数字化时代,机器学习作为人工智能领域的核心技术之一,正深刻地改变着我们的生活和工作方式。从智能语音助手到图像识别系统,从个性化推荐引擎到自动驾驶汽车,机器…...
大模型openai范式接口调用方法
本文将介绍如下内容: 一、为什么选择 OpenAI 范式接口?二、调用 Openai 接口官方调用 Demo 示例三、自定义调用 Openai 接口 一、为什么选择 OpenAI 范式接口? OpenAI 范式接口因其简洁、统一和高效的设计,成为了与大型语言模型…...
DeepSeek API接口中的openAI是什么意思?
老六哥的小提示:我们可能不会被AI轻易淘汰,但是会被“会使用AI的人”淘汰。 DeepSeek是一款基于先进推理技术的大型语言模型,能够根据用户提供的简洁提示词生成高质 曾经有外媒评价说:DeepSeek盗用了openAI的技术,或者…...
重构字符串(767)
767. 重构字符串 - 力扣(LeetCode) 解法: class Solution { public:string reorganizeString(string s){string res;//因为1 < s.length < 500 , uint64_t 类型足够uint16_t n s.size();if (n 0) {return res;}unordere…...
测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):4862 标注数量(xml文件个数):4862 标注数量(txt文件个数):4862 …...
【C++语言】卡码网语言基础课系列----12. 位置互换
文章目录 练习题目位置互换具体代码实现 小白寄语诗词共勉 练习题目 位置互换 题目描述: 给定一个长度为偶数位的字符串,请编程实现字符串的奇偶位互换。 输入描述: 输入包含多组测试数据。 输入的第一行是一个整数n,表示有测试…...
[权限提升] Windows 提权 维持 — 系统错误配置提权 - PATH 环境变量提权
关注这个专栏的其他相关笔记:[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01:PATH 环境变量提权原理 在 Windows 操作系统中,Path 环境变量是一个包含多个目录路径的列表,系统通过这些路径来查找可执行文件(如 .exe、.bat 等)。当你在命令提示符或运行对话框中输入命令时…...
吴恩达深度学习——优化神经网络
本文来自https://www.bilibili.com/video/BV1FT4y1E74V,仅为本人学习所用。 文章目录 优化样本大小mini-batch 优化梯度下降法动量梯度下降法指数加权平均概念偏差纠正 动量梯度下降法 RMSpropAdam优化算法 优化学习率局部最优问题(了解) 优…...
揭秘算法 课程导读
目录 一、老师介绍 二、课程目标 三、课程安排 一、老师介绍 学问小小谢 我是一个热爱分享知识的人,我深信知识的力量能够启迪思考,丰富生活。 欢迎每一位对知识有渴望的朋友,如果你对我的创作感兴趣,或者我们有着共同的兴趣点&…...
17.[前端开发]Day17-形变-动画-vertical-align
1 transform CSS属性 - transform transform的用法 表示一个或者多个 不用记住全部的函数,只用掌握这四个常用的函数即可 位移 - translate <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta ht…...
【单层神经网络】基于MXNet库简化实现线性回归
写在前面 同最开始的两篇文章 完整程序及注释 导入使用的库# 基本 from mxnet import autograd, nd, gluon # 模型、网络 from mxnet.gluon import nn from mxnet import init # 学习 from mxnet.gluon import loss as gloss # 数据集 from mxnet.gluon…...
第1节课:算法初印象—开启算法世界的大门
目录 一、算法是什么(一)官方定义(二)算法的五大特性(三)算法与程序的关系 二、算法在生活中的奇妙体现(一)日常出行中的算法(二)购物消费中的算法࿰…...
[C语言日寄] <stdio.h> 头文件功能介绍
在C语言的世界里,<stdio.h> 是一个极其重要的头文件,它提供了标准输入输出功能,是C语言程序与用户交互的核心工具。今天,我们就来深入探讨 <stdio.h> 的功能、使用注意事项以及它的拓展应用。 功能介绍 <stdio.h…...
Python的那些事第五篇:数据结构的艺术与应用
新月人物传记:人物传记之新月篇-CSDN博客 目录 一、列表(List):动态的容器 二、元组(Tuple):不可变的序列 三、字典(Dict):键值对的集合 四、集合…...
Linux:线程池和单例模式
一、普通线程池 1.1 线程池概念 线程池:一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价&…...
【算法-位运算】位运算遍历 LogTick 算法
文章目录 1. 引入2. LogTick 优化遍历过程3. 题目3.1 LeetCode3097 或值至少为 K 的最短子数组 II3.2 LeetCode2411 按位或最大的最小子数组长度3.3 LeetCode3209 子数组按位与值为 K 的数目3.4 LeetCode3171 找到按位或最接近 K 的子数组3.5 LeetCode1521 找到最接近目标值的函…...
【memgpt】letta 课程4:基于latta框架构建MemGpt代理并与之交互
Lab 3: Building Agents with memory 基于latta框架构建MemGpt代理并与之交互理解代理状态,例如作为系统提示符、工具和agent的内存查看和编辑代理存档内存MemGPT 代理是有状态的 agents的设计思路 每个步骤都要定义代理行为 Letta agents persist information over time and…...
Python的那些事第九篇:从单继承到多继承的奇妙之旅
Python 继承:从单继承到多继承的奇妙之旅 目录 Python 继承:从单继承到多继承的奇妙之旅 一、引言 二、继承的概念与语法 三、单继承 四、多继承 五、综合代码示例 六、总结 一、引言 在编程的世界里,继承就像是一场神奇的魔法&#…...
Excel to form ?一键导入微软表单
一句话痛点 “你的Excel越强大,手动复制到Forms就越痛苦。” 合并单元格崩溃成乱码、下拉菜单变纯文本、条件逻辑消失无踪——这些不是技术问题,而是低效工作模式的死刑判决书。 直击解决方案:3分钟,3步,300%效率 1…...
