提升系统管理:监控和可观察性在DevOps中的作用
在不断发展的DevOps世界中,深入了解系统行为、诊断问题和提高整体性能的能力是首要任务之一。监控和可观察性是促进这一过程的两个关键概念,为系统的健康和性能提供了宝贵的可见性。虽然这些术语经常可以互换使用,但它们代表着理解和管理复杂系统的不同方法。在本文中,将探讨监视和可观察性之间的差异,提供示例来说明它们的应用,并强调各自的又是。同时,本文还将深入研究用于有效监测和可观测性的技术和工具。
监控:了解系统状态
监控的重点是收集和分析有关系统或应用程序状态的数据。它通常包括设置特定的指标、阈值和警报机制,以跟踪各种组件的性能和可用性。常见的监测技术和工具包括:
- 指标监控:使用Nagios、Zabbix、Prometheus和Datadog等工具监控预定义的指标,如CPU使用情况、内存消耗、磁盘空间、网络流量和特定于应用程序的指标。
- 日志监控:使用ELK Stack(Elasticsearch、Logstash和Kibana)、Splunk或Graylog等工具分析系统不同组件生成的日志,以识别错误、安全漏洞或异常行为。
- 综合监控:使用Selenium、Pingdom或New Relic Synthetics等工具模拟用户交互并监控系统响应,以确保可用性和性能。
可观察性:理解系统行为
可观察性采用更全面的方法,通过分析相互关联的组件及其关系来理解和解释复杂系统的行为。它强调回答问题和调查超出预定义度量的系统行为的能力。可观测性使用的技术和工具包括:
- 分布式跟踪:使用Jaeger、Zipkin或AWS X-Ray等工具捕获和分析通过分布式系统的请求流。它支持识别瓶颈、延迟问题和依赖关系。
- 应用程序日志记录:使用Fluentd、Logback或Log4j等工具收集具有上下文信息的结构化日志,以跟踪执行路径、解决问题并全面了解系统行为。
- 实时分析:利用流数据平台(如Apache Kafka或Apache Flink)和可视化工具(如Grafana或Kibana)来处理和分析大容量、实时数据流,以获得系统性能洞察。
监控和可观察性用例
以下是监控和可观察性在DevOps中发挥重要作用的几个常见用例:
应用程序性能监控(APM)
- 监控:跟踪响应时间、错误率和资源利用率等指标,以确保最佳性能。例如,设置CPU使用率高或响应时间慢的警报。
- 可观察性:分析分布式跟踪和日志,以识别性能瓶颈,了解依赖关系,并排除问题。例如,使用分布式跟踪来查明跨微服务的延迟问题。
基础设施监控
- 监控:跟踪服务器指标(CPU、内存、磁盘空间)和网络指标(带宽、延迟),以确保基础设施运行状况。例如,监视磁盘空间以避免由于磁盘已满而导致的潜在停机。
- 可观察性:分析日志和事件,以识别异常行为或安全威胁。例如,使用日志分析来检测未经授权的访问尝试或系统日志中的异常模式。
云资源监控
- 监控:跟踪云服务(如AWS CloudWatch、Azure Monitor)的资源利用率和性能指标,以优化成本并确保服务可用性。例如,监视自动扩展组中已配置实例的数量。
- 可观察性:分析云提供商日志、跟踪和指标,以深入了解云资源的行为并诊断问题。例如,使用可观察性工具来识别无服务器架构中的性能瓶颈。
持续集成/持续部署(CI/CD)管道
- 监控:跟踪构建和部署指标(例如,构建持续时间、成功/失败率),以确保CI/CD管道的效率和可靠性。例如,监视生成队列长度以防止出现瓶颈。
- 可观察性:分析来自CI/CD工具(例如Jenkins, CircleCI)的日志和事件,以排除构建或部署失败的故障。例如,使用可观察性来调查部署失败的原因。
网络监控
- 监控:跟踪网络流量、延迟和数据包丢失,以确保网络性能并识别潜在问题。例如,监控网络带宽利用率以防止拥塞。
- 可观察性:分析网络日志、数据包捕获和流数据,以诊断网络问题、检测安全漏洞或识别异常行为。例如,使用可观察性工具来调查网络错误的突然增加。
这些只是监控和可观察性如何应用于各种DevOps用例的几个例子。具体的用例和需求可能因系统、基础设施和团队需求的性质而异。
总结
- 监控通过捕获预定义的指标和基于阈值的警报来提供系统运行状况和性能的快照。它可用于检测特定问题或事件,并提供有关系统或应用程序状态的即时反馈。
- 可观察性提供了对复杂系统更全面的了解,支持主动故障排除和根本原因分析。它侧重于获取上下文信息,揭示预定义指标之外的见解,培养持续改进的文化。
- 实现可观察性通常需要额外的工具和架构考虑,这可能会增加复杂性和资源需求。然而,深度系统理解的好处以及解决未知或未预料到的问题的能力使其值得投资。
监控和可观察性都是现代DevOps实践的重要组成部分,但它们涉及系统可见性的不同方面。监控提供了系统运行状况的集中和即时视图,跟踪预定义的度量和阈值,而可观察性提供了对系统行为的整体理解,捕获上下文信息并支持深入分析。
通过结合监控和可观察性技术并利用适当的工具,团队可以获得对系统性能的全面了解,及早发现问题,并不断优化其系统。在监视预定义的度量和通过可观察性探索不可预见的场景之间保持平衡,使团队能够在DevOps的动态世界中有效地管理和改进其软件系统的可靠性、性能和恢复能力。
相关文章:

提升系统管理:监控和可观察性在DevOps中的作用
在不断发展的DevOps世界中,深入了解系统行为、诊断问题和提高整体性能的能力是首要任务之一。监控和可观察性是促进这一过程的两个关键概念,为系统的健康和性能提供了宝贵的可见性。虽然这些术语经常可以互换使用,但它们代表着理解和管理复杂…...

IIS搭建本地电脑服务器:通过内网穿透技术实现公网访问的步骤指南
1.前言 在网上各种教程和介绍中,搭建网页都会借助各种软件的帮助,比如网页运行的Apache和Nginx、数据库软件MySQL和MSSQL之类,为方便用户使用,还出现了XAMPP、PHPStudy、宝塔面板等等一系列集成服务,都是为了方便我们…...

Linux系统中驱动入门设备树DTS(经典)
设备树(DTS:device tree source),字面意思就是一块电路板上设备如上图中CPU、DDR、I2C、GPIO、SPI等,按照树形结构描绘成的一棵树。按照策略和功能分离的思路,就是驱动代码(功能)和设备树DTS配置…...

关系型数据库与非关系型数据库类比
关系型数据库和非关系型数据库都有多种不同类型,每种类型都针对不同的数据存储需求和使用场景。以下是一些常见的关系型数据库和非关系型数据库类型: 关系型数据库类型: MySQL: 一种开源的关系型数据库管理系统,用于处…...

Ubuntu入门03——Ubuntu用户操作
1.Ubuntu如何进入root用户 进入ROOT用户的指令: Linux用su命令来切换用户: su root执行命令后,会提示你输入密码,而Ubuntu是没有设置root初始密码的。 若su命令不能切换root,提示su: Authentication failure&#x…...

输出图元(四)8-1 图元、屏幕坐标、指定二维世界坐标系统
用于图形应用的通用软件包称为计算机图形应用编程接口(CCAPI)它提供可以在C等程序设计语言中用来创建图形的函数库。如第3 章所指出的,函数库可以分成几种类型。创建图形时最先要做的一件事就是要描述显示场景的组成部分。图形的组成部分可以是树木和地形家具和墙壁…...

机器学习---决策树的划分依据(熵、信息增益、信息增益率、基尼值和基尼指数)
1. 熵 物理学上,熵 Entropy 是“混乱”程度的量度。 系统越有序,熵值越低;系统越混乱或者分散,熵值越⾼。 1948年⾹农提出了信息熵(Entropy)的概念。 从信息的完整性上进⾏的描述:当系统的有序…...

java解析json
1. 解析根节点为“{}”的json {"id": 1525490,"name": "有缘网" }代码: String jsonString "{\"id\":1525490\",\"name\":\"有缘网\"}";JSONObject jsonObject JSONObject.…...

PAT 1163 Dijkstra Sequence
个人学习记录,代码难免不尽人意。 Dijkstra’s algorithm is one of the very famous greedy algorithms. It is used for solving the single source shortest path problem which gives the shortest paths from one particular source vertex to all the other v…...

嵌入式学习之进程
1.进程间通信概述 UNIX系统IPC是各种进程通信方式的统称。 2.管道通信原理 特点: 1.它是半双工的(即数据只能在一个方向上流动),具有固定的读端和写端。 2.它只能用于具有亲缘关系的进程之间通信(也是父子进程或者…...

C#-单例模式
文章目录 单例模式的概述为什么会有单例模式如何创建单例模式1、首先要保证,该对象 有且仅有一个2、其次,需要让外部能够获取到这个对象 示例通过 属性 获取单例 单例模式的概述 总结来说: 单例 就是只有 一个实例对象。 模式 说的是设计模式…...

WSNs 安全技术
WSNs 多用于军事,特殊现场的警戒保护、商业区域的安防,作为任务型网 络,不仅要进行数据传输,而且要进行数据采集和融合,任务的协同控制等,如何 保证任务执行的机密性,数据产生的可靠性数据融合…...

H5如何做页面下拉刷新和上拉加载
这里以vant为例 结构 <van-pull-refreshv-model"isLoading"success-text"刷新成功"refresh"onRefresh"><van-liststyle"height:100%"v-model"loading":finished"finished"finished-text"没有更多了…...

Camunda 7.x 系列【42】事件子流程
有道无术,术尚可求,有术无道,止于术。 本系列Spring Boot 版本 2.7.9 本系列Camunda 版本 7.19.0 源码地址:https://gitee.com/pearl-organization/camunda-study-demo 文章目录 1. 概述2. 案例演示2.1 流程模型2.2 测试1. 概述 事件子流程是由事件触发的子流程,可存在…...

JVM类的加载过程
加载过程 JVM的类的加载过程分为五个阶段:加载、验证、准备、解析、初始化。 加载 加载阶段就是将编译好的的class文件通过字节流的方式从硬盘或者通过网络加载到JVM虚拟机当中来。(我们平时在Idea中书写的代码就是放在磁盘中的,也可以通…...

Jmeter如何设置中文版
第一步:找到 apache-jmeter-5.4.3\bin目录下的 jmeter.properties 第二步:打开 三,ctrf 输入languageen,注释掉,增加以行修改如下 四,ctrs 保存修改内容,重新打开jmeter就可以了...

flutter自定义按钮-文本按钮
目录 前言 需求 实现 前言 最近闲着无聊学习了flutter的一下知识,发现flutter和安卓之间,页面开发的方式还是有较大的差异的,众所周知,android的页面开发都是写在xml文件中的,而flutter直接写在代码里(da…...

无涯教程-Android - CheckBox函数
CheckBox是可以由用户切换的on/off开关。为用户提供一组互不排斥的可选选项时,应使用复选框。 CheckBox 复选框属性 以下是与CheckBox控件相关的重要属性。您可以查看Android官方文档以获取属性的完整列表以及可以在运行时更改这些属性的相关方法。 继承自 android.widget.T…...

[Go版]算法通关村第十五关青铜——用4KB内存寻找重复元素
目录 题目:用4KB内存寻找重复元素思路分析:使用位存储如何存储这32000个整数?每个整数对应在位图中的存储状态举例如何判断是重复的?具体的步骤 复杂度:时间复杂度 O ( n ) O(n) O(n)、空间复杂度 O ( 1 ) O(1) O(1)Go…...

OJ练习第159题——消灭怪物的最大数量
消灭怪物的最大数量 力扣链接:1921. 消灭怪物的最大数量 题目描述 你正在玩一款电子游戏,在游戏中你需要保护城市免受怪物侵袭。给你一个 下标从 0 开始 且长度为 n 的整数数组 dist ,其中 dist[i] 是第 i 个怪物与城市的 初始距离&#…...

Prometheus-Rules(规则)
文章目录 一、介绍二、配置 Prometheus 使用规则文件三、 规则文件语法规则文件语法全局Recording rules(记录规则)2 Alerting rules(警报规则)3 模板化如何使用四、检查规则文件语法五、发送警报通知一、介绍 Prometheus规则是一种逻辑表达式,可用于定义有关监控数据的逻…...

打卡智能中国(六):村里出了“飞行员”
提起返乡青年,你的第一印象是什么?失败、躺平、卷不动了? 我们在浙江、福建、青海等地,参观一些农业智能化项目时,陪同参观的“飞手”,高兴地跟我们分享自己的心路历程: 在家门口做农业无人机操…...

自动化运维工具Ansible之playbooks剧本
自动化运维工具Ansible之playbooks剧本 一、playbooks1.playbooks简述2.playbooks剧本格式3.playbooks组成部分 二、实例1.编写脚本2.运行playbook3.定义、引用变量4.指定远程主机sudo切换用户5.when条件判断6.迭代7.Templates 模块8.tags 模块9.Roles 模块 三、编写应用模块1.…...

K8S访问控制------认证(authentication )、授权(authorization )、准入控制(admission control )体系
一、账号分类 在K8S体系中有两种账号类型:User accounts(用户账号),即针对human user的;Service accounts(服务账号),即针对pod的。这两种账号都可以访问 API server,都需要经历认证、授权、准入控制等步骤,相关逻辑图如下所示: 二、authentication (认证) 在…...

开开心心带你学习MySQL数据库之第三篇上
学校的项目组有必要加入吗? 看你的初心. ~~如果初心是通过这个经历能够提高自己的技术水平 ~~是可以考虑的 ~~如果初心是通过这个经历提高自己找工作的概率 ~~这个是不靠谱的,啥用没有 ~~如果初心是通过这个体验更美好的大学生活 ~~靠谱的 秋招,应届生,找工作是非常容易的!!! …...

Mysql批量插入大量数据的方法
使用存储过程进行插入, 在navicate中示例如下: 输入需要的参数点击完成 在begin end中输入代码,示例代码如下 CREATE DEFINERskip-grants userskip-grants host PROCEDURE batch_insert() BEGINdeclare i int default 0; set i0;while i<1…...

centos安装nginx实操记录(加安全配置)
1.下载与安装 yum -y install nginx2.启动命令 /usr/sbin/nginx -c /etc/nginx/nginx.conf3.新建配置文件 cd /etc/nginx/conf.d vim index.conf配了一个负责均衡,如不需要,可将 server localhost: 多余的去掉 upstream web_server{server localhost…...

【中等】49. 字母异位词分组
原题链接:https://leetcode.cn/problems/group-anagrams 49. 字母异位词分组 给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 示例 1: 输入: strs [“…...

Python3 条件控制
Python3 条件控制 Python 条件语句是通过一条或多条语句的执行结果(True 或者 False)来决定执行的代码块。 可以通过下图来简单了解条件语句的执行过程: 代码执行过程: if 语句 Python中if语句的一般形式如下所示: if conditi…...

IDEA自定义模板
IDEA自定义模板 (1)定义sop模板 ①在Live Templates中增加模板 ②先定义一个模板的组 ③在模板组里新建模板 ④定义模板 Abbreviation:模板的缩略名称Description:模板的描述Template text:模板的代码片段应用范围。比如点击Define。选择如下&…...