Prometheus技术文档-概念
Prometheus是一个开源的项目连接如下:
Prometheus首页、文档和下载 - 服务监控系统 - OSCHINA - 中文开源技术交流社区
基本概念:
Prometheus是一个开源的系统监控和告警系统,由Google的BorgMon监控系统发展而来。它主要用于监控和度量各种时间序列数据,比如系统性能、网络延迟、应用程序错误等。Prometheus通过采集监控数据并存储在时间序列数据库中,然后使用PromQL查询语言进行数据分析和可视化。Prometheus的核心组件包括Prometheus Server、Exporters和Pushgateway。它支持多种服务发现机制,比如Kubernetes、EC2、GCE等,以自动发现和监控服务的运行状态。Prometheus还提供了安全和权限控制的机制,如身份验证、授权等,以确保数据的访问安全。它已经成为继k8s之后第二大在CNCF托管的项目,被广泛应用于各种数据中心环境的监控。
具有如下特性:
-
高维度数据模型
-
自定义查询语言
-
可视化数据展示
-
高效的存储策略
-
易于运维
-
提供各种客户端开发库
-
警告和报警
-
数据导出
学习Prometheus的重要概念
- 监控指标(Metrics):Prometheus采集各种监控数据,并将它们存储为时间序列数据。这些数据通过特定的度量标准来描述系统的各个方面,比如系统CPU使用率、网络流量、应用程序错误等。
- 存储持久化(Storage Persistence):Prometheus将采集的监控数据存储在时间序列数据库中,这种数据库专门设计用于存储大规模的时间序列数据。Prometheus支持多种存储后端,如本地磁盘、远程存储等。
- 数据查询语言(Query Language):Prometheus使用PromQL作为其数据查询语言。PromQL允许用户从存储库中查询和分析监控数据,并以各种方式进行可视化。
- 警报规则(Alerting Rules):Prometheus提供警报规则,用于根据监控数据的阈值触发警报。警报可以发送给不同的接收器,比如电子邮件、Slack、PagerDuty等。
- 数据可视化(Data Visualization):Prometheus提供了一个仪表盘(Dashboard)界面,用于展示监控数据和警报状态。用户可以通过拖放和自定义配置来创建自己的仪表盘。
- 服务发现(Service Discovery):Prometheus支持各种服务发现机制,比如Kubernetes、EC2、GCE等,以自动发现和监控服务的运行状态。
- 安全和权限控制(Security and Access Control):Prometheus也提供了安全和权限控制的机制,如身份验证、授权等,以确保数据的访问安全。
- 数据导出(Data Extraction):Prometheus还支持从其他数据源提取数据,比如通过使用Pushgateway将不能直接被Prometheus采集的数据推送到Pushgateway中,然后由Prometheus从Pushgateway中提取数据。
Prometheus支持多种服务发现机制,以自动发现和监控服务的运行状态:
- Kubernetes:Prometheus可以与Kubernetes集群集成,通过Kubernetes的API自动发现和监控Kubernetes中的服务和容器。这种服务发现机制适用于在Kubernetes环境中运行的分布式系统。
- EC2(Elastic Cloud Compute):EC2是Amazon Web Services(AWS)提供的云服务,Prometheus可以通过EC2的API发现和监控EC2实例。这种服务发现机制适用于在AWS环境中运行的分布式系统。
- GCE(Google Cloud Engine):GCE是Google Cloud提供的云服务,Prometheus可以通过GCE的API发现和监控GCE实例。这种服务发现机制适用于在Google Cloud环境中运行的分布式系统。
这些服务发现机制允许Prometheus自动发现和监控各种服务和实例,从而简化和自动化了监控过程。
使用场景:
Prometheus是一个广泛使用的开源系统监控和告警系统,适用于多种场景。以下是一些常见的使用场景:
- 云原生生态系统:Prometheus是CNCF(Cloud Native Computing Foundation)的托管项目之一,与Kubernetes等云原生技术紧密集成。它在云原生生态系统中的使用非常普遍,可以自动发现和监控Kubernetes集群中的服务和容器。
- 分布式系统和微服务:Prometheus适用于分布式系统和微服务架构,可以监控各种服务和应用程序的性能指标,如CPU使用率、内存消耗、网络延迟等。
- 系统性能和健康状况监控:Prometheus可以监控整个系统的性能和健康状况,包括服务器、网络设备、操作系统等。它可以采集各种系统级别的性能指标,如CPU使用率、磁盘使用率、网络带宽等。
- 业务指标监控:Prometheus也可以用于监控业务指标,比如应用程序的错误率、用户活跃度、业务交易量等。这些指标可以帮助开发人员和业务分析师更好地了解系统的性能和业务状况。
- 自动化部署和容器管理:Prometheus可以与自动化部署和容器管理工具集成,如Docker、Kubernetes、Helm等。它可以监控容器的创建、删除和更新过程,以及自动化部署的流程和结果。
- 实时告警和应急响应:Prometheus与AlertManager一起,可以设置告警规则并触发告警。告警可以发送给不同的接收器,如电子邮件、Slack、PagerDuty等,以实现实时告警和应急响应。
使用原因
- 开源和社区支持:Prometheus是一个开源项目,拥有庞大的社区支持和用户群体。这使得用户可以轻松获取各种资源和支持,如文档、示例和插件等。
- 简单易用:Prometheus的架构简单,易于安装和配置。它采用简单的数据模型和查询语言,使得用户可以轻松地收集、存储和分析数据。
- 数据采集和可扩展性:Prometheus支持多种数据采集方法,如静态配置、服务发现和自动发现等。它还可以通过横向扩展来提高监控的性能和容量。
- 数据查询和可视化:Prometheus内置了强大的数据查询语言(PromQL),用户可以使用它来轻松地查询和分析数据。此外,Prometheus还提供了可视化的功能,可以将数据以图表的形式展示给用户。
- 告警功能:Prometheus与AlertManager一起,可以设置告警规则并触发告警。告警可以发送给不同的接收器,如电子邮件、Slack、PagerDuty等,以实现实时告警和应急响应。
- 与云原生技术的紧密集成:Prometheus与Kubernetes等云原生技术紧密集成,可以自动发现和监控Kubernetes集群中的服务和容器。这使得在云原生环境中使用Prometheus成为自然而然的选择。
同类型产品对比:
与Prometheus同类型的产品包括Open-Falcon、Zabbix和Graphite等。以下是它们的比较:
1、Open-Falcon:Open-Falcon是一个开源的监控系统,具有强大的数据采集、存储和分析能力。它支持多种数据源和协议,并具有灵活的告警机制。Open-Falcon的架构灵活,可以灵活扩展,并与许多其他技术集成。与Prometheus相比,Open-Falcon在数据采集和告警方面具有更多功能,但在数据模型和查询语言方面较为简单。
2、Zabbix:Zabbix是一个成熟的监控系统,具有广泛的功能和强大的性能。它支持多种监控方式,包括主动监控和被动监控,并可以自定义监控脚本。Zabbix采用关系型数据库存储数据,具有强大的报告和分析功能。与Prometheus相比,Zabbix在功能和性能方面更加成熟,但在数据模型和查询语言方面较为传统。
宏时数据-Zabbix中国
3、Graphite:Graphite是一个专注于性能指标数据存储和可视化的系统。它采用简单的数据模型,并允许存储命名时间序列数据。Graphite具有快速查询和可视化能力,但与其他监控系统相比,它的功能较为有限。与Prometheus相比,Graphite在数据可视化和存储方面具有优势,但在数据模型和查询语言方面较为简单。
这些系统各有优缺点,选择哪个系统取决于具体需求和使用场景。Prometheus在数据模型、查询语言和社区支持方面具有优势,但在数据采集和存储方面可能需要额外的组件。Open-Falcon在数据采集和告警方面具有更多功能,而Zabbix在功能和性能方面更加成熟,Graphite则专注于性能指标数据的存储和可视化。
版本更新对比:
- Prometheus 2.0.0:该版本带来了新的存储引擎,与检索系统的改变相结合,可带来可观的性能提升。此外,Prometheus服务器每秒采集百万样本成为可能。同时,新的存储引擎不向后兼容,但有一种方法可以透明地访问仍存储在1.x中的旧数据。另外,该版本改进了PromQL中的陈旧语义,现在只需要一个刮擦间隔即可使时间序列失效,而无需等待整整5分钟。规则文件格式也已更改为YAML,按组组织规则并按顺序执行。出于安全原因,默认情况下已禁用admin和生命周期API。
- Prometheus 1.8.0:该版本的主要变化包括改进的远程写和拉取样本的配置,可以更好地控制内存使用;改进的HTTP摄入,包括错误处理和配置;改进的监控,包括限制正在进行的HTTP请求的数量;以及改进的文本展示格式的兼容性,支持更多的情况。
Prometheus的每个版本都有一些更新和改进,包括存储引擎、PromQL、规则文件格式等方面。用户可以根据自己的需求选择适合的版本。同时,Prometheus还在不断发展和改进中,以满足不断变化的监控需求和技术环境。
相关文章:

Prometheus技术文档-概念
Prometheus是一个开源的项目连接如下: Prometheus首页、文档和下载 - 服务监控系统 - OSCHINA - 中文开源技术交流社区 基本概念: Prometheus是一个开源的系统监控和告警系统,由Google的BorgMon监控系统发展而来。它主要用于监控和度量各种…...
JQuery判断radio(单选框)是否选中和获取选中值方法总结
使用checked属性判断选中、jquery获取radio单选按钮的值、获取一组radio被选中项的值、设置单选按钮被选中等,详细如下: 一、利用获取选中值判断选中 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.…...
Effective Python 读书笔记
文章目录 前言第1章:用Pythonic方式来思考 1. 用Pythonic方式来思考 2. 遵循PEP8风格3. 了解bytes, str, unicode区别4. 用辅助函数取代复杂表达式5. 了解切割序列的方法6. 单次切片操作内,不要同时指定start, end, stride 7. 用列表推导取代map, filter…...
Monge矩阵
Monge矩阵 对一个m*n的实数矩阵A,如果对所有i,j,k和l,1≤ i<k ≤ m和1≤ j<l ≤ n,有 A[i,j]A[k,l] ≤ A[i,l]A[k,j] 那么,此矩阵A为Monge矩阵。 换句话说,每当我们从矩阵中挑…...

(5)所有角色数据分析页面的构建-5
所有角色数据分析页面,包括一个时间轴柱状图、六个散点图、六个柱状图(每个属性角色的生命值/防御力/攻击力的max与min的对比)。 """绘图""" from pyecharts.charts import Timeline from find_type import FindType import pandas …...
专利进阶(三):专利撰写资料汇总
文章目录 一、前言二、资料汇总三、拓展阅读 一、前言 在专利撰写前,需要首先了解专利撰写所需遵守的基本规则。可以借助的撰写工具是什么。文献检索在哪里?注意事项是什么?本篇博文会就以上问题进行逐一解答。 专利撰写基本原则࿱…...
maven编译始终提示无效的目标发行版的解决方法
摘自个人印象笔记2021-05-07:https://app.yinxiang.com/fx/55e1d5f4-aeea-446a-a768-0f1a48195f5b(图显示不完整可查看原笔记内容)1:确保IDE中的编译版本正确 在idea中,主要看项目属性中和setting的java compiler中对应的jdk版本是否正确&…...

系统架构设计高级技能 · 软件可靠性分析与设计(三)【系统架构设计师】
系列文章目录 系统架构设计高级技能 软件架构概念、架构风格、ABSD、架构复用、DSSA(一)【系统架构设计师】 系统架构设计高级技能 系统质量属性与架构评估(二)【系统架构设计师】 系统架构设计高级技能 软件可靠性分析与设计…...

界面控件DevExpress WPF Chart组件——拥有超快的数据可视化库!
DevExpress WPF Chart组件拥有超大的可视化数据集,并提供交互式仪表板与高性能WPF图表库。DevExpress Charts提供了全面的2D / 3D图形集合,包括数十个UI定制和数据分析/数据挖掘选项。 PS:DevExpress WPF拥有120个控件和库,将帮助…...
【网络安全】等保测评安全物理环境
【网络安全】等保测评&安全物理环境 前言第1章 安全物理环境1.1 物理位置选择1.2 物理访问控制(高风险项)1.3 防盗窃1.4 防雷击1.5 防火1.6 防水防潮1.7 防静电1.8 温湿度控制1.9 电力供应1.10 电磁防护 前言 等级保护对象是由计算机或其他信息终端…...

Intellij IDEA 导入 eclipse web 项目详细操作
Eclipse当中的web项目都会有这两个文件。但是idea当中应该是没有的,所以导入会出现兼容问题。但是本篇文章会教大家如何导入,并且导入过后还能使用tomcat运行。文章尽可能以图片的形式进行演示。我的idea使用的版本是2022.3.3版本。当然按正常来说版本之…...
安卓java A应用切换到B应用,来回切换不执行OnCreate
需求:安卓java如何做到A应用切换到B应用,如果B应用没启动就启动,如果B应用已经启动就仅仅切换到B应用。B应用再切换回A应用,不要重复执行OnCreate! 在 A 应用中的: 在 A 应用中,如果你希望在切换回 B 应用…...
【Linux】批量恢复文件权限
批量恢复文件权限 Linux 中,如果意外误操作将根目录目录权限批量设置,比如 chmod -R 777 / ,系统中的大部分服务以及命令将无法使用,这时候可以通过系统自带的 getfacl 命令来拷贝和还原系统权限,若是其他系统目录被误…...

数据可视化(八)堆叠图,双y轴,热力图
1.双y轴绘制 #双Y轴可视化数据分析图表 #add_subplot() dfpd.read_excel(mrbook.xlsx) x[i for i in range(1,7)] y1df[销量] y2df[rate] #用来正常显示负号 plt.rcParams[axes.unicode_minus]False figplt.figure() ax1fig.add_subplot(1,1,1)#一行一列,第一个区域…...

前台自动化测试:基于敏捷测试驱动开发(TDD)的自动化测试原理
一、自动化测试概述 自动化测试主要应用到查询结果的自动化比较,把借助自动化把相同的数据库数据的相同查询条件查询到的结果同理想的数据进行自动化比较或者同已经保障的数据进行不同版本的自动化比较,减轻人为的重复验证测试。多用户并发操作需要自动…...

基于SLAM的规划算法仿真复现|SLAM|智能规划
图片来自百度百科 前言 那么这里博主先安利一些干货满满的专栏了! 首先是博主的高质量博客的汇总,这个专栏里面的博客,都是博主最最用心写的一部分,干货满满,希望对大家有帮助。 高质量博客汇总https://blog.csdn.n…...
sqlite3多线程操作问题
在项目中使用sqlite3,有时会报database is locked 两种方式 1、多线程读,多线程写,只使用共同一个数据库连接,即使用同一个SQLiteHelper连接,调用sqlite3_busy_timeout 2、多线程读,单线程写,每…...
ACCESS数据库增删改查
[添加COM组件] A: Microsoft ADO Ext. 2.8 for DDL and Security B: Microsoft ActiveX Data Objects 2.8 Library [添加头文件]using System.Data.OleDb; using System.Data; using ADOX; using System.IO; using System; using System.Collections.Generic; using System.L…...

动捕系统mockup_optitrack替换为VRPN传递信息
motive:启动→载入已有→layout选择capture→view选择data streming→复选marker右键create刚体→rename刚体→修改local interface为本机ip→勾选vrpn ROS端:roslaunch vrpn_client_ros vrpn_efy.launch 记得修改server地址为motiveip地址 关掉motive…...

【服务平台】Rancher运行和管理Docker和Kubernetes,提供管理生产中的容器所需的整个软件堆栈
Rancher是一个开源软件平台,使组织能够在生产中运行和管理Docker和Kubernetes。使用Rancher,组织不再需要使用一套独特的开源技术从头开始构建容器服务平台。Rancher提供了管理生产中的容器所需的整个软件堆栈。 完整软件堆栈 Rancher是供采用容器的团…...

电商平台 API、数据抓取与爬虫技术的区别及优势分析
一、技术定义与核心原理 电商平台 API(应用程序编程接口) 作为平台官方提供的标准化数据交互通道,API 通过 HTTP 协议实现不同系统间的结构化数据传输。开发者需申请授权(如 API 密钥),按照文档规范调用接口…...
副本(Replica)在Elasticsearch中扮演什么角色?
在Elasticsearch(ES)中,副本(Replica)是主分片(Primary Shard)的镜像拷贝,与主分片共同构成分布式索引的高可用性和高性能架构。副本的设计目标是解决数据冗余、负载均衡和故障恢复等核心问题,其具体作用和原理如下: 一、副本的核心角色与功能 1. 数据冗余与故障恢…...

Linux:shell脚本常用命令
一、设置主机名称 1、查看主机名称 2、用文件的方式更改主机名称 重启后: 3、 通过命令修改主机名 重启后: 二、网络管理命令 1、查看网卡 2、设置网卡 (1)网卡未被设置过时 (2)当网卡被设定,…...
阻止H5页面中键盘收起的问题
在移动端H5开发中,当输入框失去焦点时,键盘会自动收起,但有时我们需要阻止这种行为。以下是几种解决方案: 常见原因 输入框失去焦点触发键盘收起页面滚动或触摸其他区域导致键盘收起某些浏览器(特别是iOS Safari)的默认行为 解…...

Go语言开发的GMQT物联网MQTT消息服务器(mqtt Broker)支持海量MQTT连接和快速低延时消息传输-提供源码可二次开发定制需求
关于GMQT物联网MQTT消息平台 GoFly社区推出《GMQT物联网MQTT消息平台》,完全使用高性能的Go语言编写,内嵌数据库(不依赖三方库), 全面支持MQTT的v3.0.0、v3.1.1以及完全兼容 MQTT v5 功能。利用Go语言高并发性、高效利用服务器资源、跨平台支…...

Express教程【001】:Express创建基本的Web服务器
文章目录 1、初识express1.1 什么是Express1.2 主要特点1.3 Express的基本使用1.3.1 安装1.3.2 创建基本的Web服务器 1、初识express 目标: 能够使用express.static()快速托管静态资源能够使用express路由精简项目结构能够使用常见的express中间件能够使用express创…...
React从基础入门到高级实战:React 核心技术 - 动画与过渡效果:提升 UI 交互体验
React 动画与过渡效果:提升 UI 交互体验 在现代 Web 开发中,动画和过渡效果不仅仅是视觉上的点缀,它们在提升用户体验、引导用户注意力以及增强交互性方面扮演着重要角色。作为一款广受欢迎的前端框架,React 提供了多种实现动画的…...

重读《人件》Peopleware -(13)Ⅱ 办公环境 Ⅵ 电话
当你开始收集有关工作时间质量的数据时,你的注意力自然会集中在主要的干扰源之一——打进来的电话。一天内接15个电话并不罕见。虽然这看似平常,但由于重新沉浸所需的时间,它可能会耗尽你几乎一整天的时间。当一天结束时,你会纳闷…...
【C/C++】chrono简单使用场景
chrono使用场景举例 1 输出格式化字符串 示例代码 auto now std::chrono::system_clock::now(); auto t std::chrono::system_clock::to_time_t(now); auto ms std::chrono::duration_cast<std::chrono::milliseconds>(now.time_since_epoch()) % 1000;std::ostrin…...

WPF的基础控件:布局控件(StackPanel DockPanel)
布局控件(StackPanel & DockPanel) 1 StackPanel的Orientation属性2 DockPanel的LastChildFill3 嵌套布局示例4 性能优化建议5 常见问题排查 在WPF开发中,布局控件是构建用户界面的基石。StackPanel和DockPanel作为两种最基础的布局容器&…...