当前位置: 首页 > news >正文

Prometheus技术文档-概念

 Prometheus是一个开源的项目连接如下:

Prometheus首页、文档和下载 - 服务监控系统 - OSCHINA - 中文开源技术交流社区

基本概念:

 

        Prometheus是一个开源的系统监控和告警系统,由Google的BorgMon监控系统发展而来。它主要用于监控和度量各种时间序列数据,比如系统性能、网络延迟、应用程序错误等。Prometheus通过采集监控数据并存储在时间序列数据库中,然后使用PromQL查询语言进行数据分析和可视化。Prometheus的核心组件包括Prometheus Server、Exporters和Pushgateway。它支持多种服务发现机制,比如Kubernetes、EC2、GCE等,以自动发现和监控服务的运行状态。Prometheus还提供了安全和权限控制的机制,如身份验证、授权等,以确保数据的访问安全。它已经成为继k8s之后第二大在CNCF托管的项目,被广泛应用于各种数据中心环境的监控。

具有如下特性:

  • 高维度数据模型

  • 自定义查询语言

  • 可视化数据展示

  • 高效的存储策略

  • 易于运维

  • 提供各种客户端开发库

  • 警告和报警

  • 数据导出

学习Prometheus的重要概念

  1. 监控指标(Metrics):Prometheus采集各种监控数据,并将它们存储为时间序列数据。这些数据通过特定的度量标准来描述系统的各个方面,比如系统CPU使用率、网络流量、应用程序错误等。
  2. 存储持久化(Storage Persistence):Prometheus将采集的监控数据存储在时间序列数据库中,这种数据库专门设计用于存储大规模的时间序列数据。Prometheus支持多种存储后端,如本地磁盘、远程存储等。
  3. 数据查询语言(Query Language):Prometheus使用PromQL作为其数据查询语言。PromQL允许用户从存储库中查询和分析监控数据,并以各种方式进行可视化。
  4. 警报规则(Alerting Rules):Prometheus提供警报规则,用于根据监控数据的阈值触发警报。警报可以发送给不同的接收器,比如电子邮件、Slack、PagerDuty等。
  5. 数据可视化(Data Visualization):Prometheus提供了一个仪表盘(Dashboard)界面,用于展示监控数据和警报状态。用户可以通过拖放和自定义配置来创建自己的仪表盘。
  6. 服务发现(Service Discovery):Prometheus支持各种服务发现机制,比如Kubernetes、EC2、GCE等,以自动发现和监控服务的运行状态。
  7. 安全和权限控制(Security and Access Control):Prometheus也提供了安全和权限控制的机制,如身份验证、授权等,以确保数据的访问安全。
  8. 数据导出(Data Extraction):Prometheus还支持从其他数据源提取数据,比如通过使用Pushgateway将不能直接被Prometheus采集的数据推送到Pushgateway中,然后由Prometheus从Pushgateway中提取数据。

Prometheus支持多种服务发现机制,以自动发现和监控服务的运行状态:

  1. Kubernetes:Prometheus可以与Kubernetes集群集成,通过Kubernetes的API自动发现和监控Kubernetes中的服务和容器。这种服务发现机制适用于在Kubernetes环境中运行的分布式系统。
  2. EC2(Elastic Cloud Compute):EC2是Amazon Web Services(AWS)提供的云服务,Prometheus可以通过EC2的API发现和监控EC2实例。这种服务发现机制适用于在AWS环境中运行的分布式系统。
  3. GCE(Google Cloud Engine):GCE是Google Cloud提供的云服务,Prometheus可以通过GCE的API发现和监控GCE实例。这种服务发现机制适用于在Google Cloud环境中运行的分布式系统。

这些服务发现机制允许Prometheus自动发现和监控各种服务和实例,从而简化和自动化了监控过程。

使用场景:

Prometheus是一个广泛使用的开源系统监控和告警系统,适用于多种场景。以下是一些常见的使用场景:

  1. 云原生生态系统:Prometheus是CNCF(Cloud Native Computing Foundation)的托管项目之一,与Kubernetes等云原生技术紧密集成。它在云原生生态系统中的使用非常普遍,可以自动发现和监控Kubernetes集群中的服务和容器。
  2. 分布式系统和微服务:Prometheus适用于分布式系统和微服务架构,可以监控各种服务和应用程序的性能指标,如CPU使用率、内存消耗、网络延迟等。
  3. 系统性能和健康状况监控:Prometheus可以监控整个系统的性能和健康状况,包括服务器、网络设备、操作系统等。它可以采集各种系统级别的性能指标,如CPU使用率、磁盘使用率、网络带宽等。
  4. 业务指标监控:Prometheus也可以用于监控业务指标,比如应用程序的错误率、用户活跃度、业务交易量等。这些指标可以帮助开发人员和业务分析师更好地了解系统的性能和业务状况。
  5. 自动化部署和容器管理:Prometheus可以与自动化部署和容器管理工具集成,如Docker、Kubernetes、Helm等。它可以监控容器的创建、删除和更新过程,以及自动化部署的流程和结果。
  6. 实时告警和应急响应:Prometheus与AlertManager一起,可以设置告警规则并触发告警。告警可以发送给不同的接收器,如电子邮件、Slack、PagerDuty等,以实现实时告警和应急响应。

使用原因

  1. 开源和社区支持:Prometheus是一个开源项目,拥有庞大的社区支持和用户群体。这使得用户可以轻松获取各种资源和支持,如文档、示例和插件等。
  2. 简单易用:Prometheus的架构简单,易于安装和配置。它采用简单的数据模型和查询语言,使得用户可以轻松地收集、存储和分析数据。
  3. 数据采集和可扩展性:Prometheus支持多种数据采集方法,如静态配置、服务发现和自动发现等。它还可以通过横向扩展来提高监控的性能和容量。
  4. 数据查询和可视化:Prometheus内置了强大的数据查询语言(PromQL),用户可以使用它来轻松地查询和分析数据。此外,Prometheus还提供了可视化的功能,可以将数据以图表的形式展示给用户。
  5. 告警功能:Prometheus与AlertManager一起,可以设置告警规则并触发告警。告警可以发送给不同的接收器,如电子邮件、Slack、PagerDuty等,以实现实时告警和应急响应。
  6. 与云原生技术的紧密集成:Prometheus与Kubernetes等云原生技术紧密集成,可以自动发现和监控Kubernetes集群中的服务和容器。这使得在云原生环境中使用Prometheus成为自然而然的选择。

同类型产品对比:

与Prometheus同类型的产品包括Open-Falcon、Zabbix和Graphite等。以下是它们的比较:

1、Open-Falcon:Open-Falcon是一个开源的监控系统,具有强大的数据采集、存储和分析能力。它支持多种数据源和协议,并具有灵活的告警机制。Open-Falcon的架构灵活,可以灵活扩展,并与许多其他技术集成。与Prometheus相比,Open-Falcon在数据采集和告警方面具有更多功能,但在数据模型和查询语言方面较为简单。

2、Zabbix:Zabbix是一个成熟的监控系统,具有广泛的功能和强大的性能。它支持多种监控方式,包括主动监控和被动监控,并可以自定义监控脚本。Zabbix采用关系型数据库存储数据,具有强大的报告和分析功能。与Prometheus相比,Zabbix在功能和性能方面更加成熟,但在数据模型和查询语言方面较为传统。

宏时数据-Zabbix中国

3、Graphite:Graphite是一个专注于性能指标数据存储和可视化的系统。它采用简单的数据模型,并允许存储命名时间序列数据。Graphite具有快速查询和可视化能力,但与其他监控系统相比,它的功能较为有限。与Prometheus相比,Graphite在数据可视化和存储方面具有优势,但在数据模型和查询语言方面较为简单。

        这些系统各有优缺点,选择哪个系统取决于具体需求和使用场景。Prometheus在数据模型、查询语言和社区支持方面具有优势但在数据采集和存储方面可能需要额外的组件。Open-Falcon在数据采集和告警方面具有更多功能,而Zabbix在功能和性能方面更加成熟,Graphite则专注于性能指标数据的存储和可视化。

版本更新对比:

  1. Prometheus 2.0.0:该版本带来了新的存储引擎,与检索系统的改变相结合,可带来可观的性能提升。此外,Prometheus服务器每秒采集百万样本成为可能。同时,新的存储引擎不向后兼容,但有一种方法可以透明地访问仍存储在1.x中的旧数据。另外,该版本改进了PromQL中的陈旧语义,现在只需要一个刮擦间隔即可使时间序列失效,而无需等待整整5分钟。规则文件格式也已更改为YAML,按组组织规则并按顺序执行。出于安全原因,默认情况下已禁用admin和生命周期API。
  2. Prometheus 1.8.0:该版本的主要变化包括改进的远程写和拉取样本的配置,可以更好地控制内存使用;改进的HTTP摄入,包括错误处理和配置;改进的监控,包括限制正在进行的HTTP请求的数量;以及改进的文本展示格式的兼容性,支持更多的情况。

        Prometheus的每个版本都有一些更新和改进,包括存储引擎、PromQL、规则文件格式等方面。用户可以根据自己的需求选择适合的版本。同时,Prometheus还在不断发展和改进中,以满足不断变化的监控需求和技术环境。

相关文章:

Prometheus技术文档-概念

Prometheus是一个开源的项目连接如下: Prometheus首页、文档和下载 - 服务监控系统 - OSCHINA - 中文开源技术交流社区 基本概念: Prometheus是一个开源的系统监控和告警系统,由Google的BorgMon监控系统发展而来。它主要用于监控和度量各种…...

JQuery判断radio(单选框)是否选中和获取选中值方法总结

使用checked属性判断选中、jquery获取radio单选按钮的值、获取一组radio被选中项的值、设置单选按钮被选中等&#xff0c;详细如下&#xff1a; 一、利用获取选中值判断选中 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.…...

Effective Python 读书笔记

文章目录 前言第1章&#xff1a;用Pythonic方式来思考 1. 用Pythonic方式来思考 2. 遵循PEP8风格3. 了解bytes, str, unicode区别4. 用辅助函数取代复杂表达式5. 了解切割序列的方法6. 单次切片操作内&#xff0c;不要同时指定start, end, stride 7. 用列表推导取代map, filter…...

Monge矩阵

Monge矩阵 对一个m*n的实数矩阵A&#xff0c;如果对所有i&#xff0c;j&#xff0c;k和l&#xff0c;1≤ i<k ≤ m和1≤ j<l ≤ n&#xff0c;有 A[i,j]A[k,l] ≤ A[i,l]A[k,j] 那么&#xff0c;此矩阵A为Monge矩阵。 换句话说&#xff0c;每当我们从矩阵中挑…...

(5)所有角色数据分析页面的构建-5

所有角色数据分析页面&#xff0c;包括一个时间轴柱状图、六个散点图、六个柱状图(每个属性角色的生命值/防御力/攻击力的max与min的对比)。 """绘图""" from pyecharts.charts import Timeline from find_type import FindType import pandas …...

专利进阶(三):专利撰写资料汇总

文章目录 一、前言二、资料汇总三、拓展阅读 一、前言 在专利撰写前&#xff0c;需要首先了解专利撰写所需遵守的基本规则。可以借助的撰写工具是什么。文献检索在哪里&#xff1f;注意事项是什么&#xff1f;本篇博文会就以上问题进行逐一解答。 专利撰写基本原则&#xff1…...

maven编译始终提示无效的目标发行版的解决方法

摘自个人印象笔记2021-05-07&#xff1a;https://app.yinxiang.com/fx/55e1d5f4-aeea-446a-a768-0f1a48195f5b(图显示不完整可查看原笔记内容)1&#xff1a;确保IDE中的编译版本正确 在idea中&#xff0c;主要看项目属性中和setting的java compiler中对应的jdk版本是否正确&…...

系统架构设计高级技能 · 软件可靠性分析与设计(三)【系统架构设计师】

系列文章目录 系统架构设计高级技能 软件架构概念、架构风格、ABSD、架构复用、DSSA&#xff08;一&#xff09;【系统架构设计师】 系统架构设计高级技能 系统质量属性与架构评估&#xff08;二&#xff09;【系统架构设计师】 系统架构设计高级技能 软件可靠性分析与设计…...

界面控件DevExpress WPF Chart组件——拥有超快的数据可视化库!

DevExpress WPF Chart组件拥有超大的可视化数据集&#xff0c;并提供交互式仪表板与高性能WPF图表库。DevExpress Charts提供了全面的2D / 3D图形集合&#xff0c;包括数十个UI定制和数据分析/数据挖掘选项。 PS&#xff1a;DevExpress WPF拥有120个控件和库&#xff0c;将帮助…...

【网络安全】等保测评安全物理环境

【网络安全】等保测评&安全物理环境 前言第1章 安全物理环境1.1 物理位置选择1.2 物理访问控制&#xff08;高风险项&#xff09;1.3 防盗窃1.4 防雷击1.5 防火1.6 防水防潮1.7 防静电1.8 温湿度控制1.9 电力供应1.10 电磁防护 前言 等级保护对象是由计算机或其他信息终端…...

Intellij IDEA 导入 eclipse web 项目详细操作

Eclipse当中的web项目都会有这两个文件。但是idea当中应该是没有的&#xff0c;所以导入会出现兼容问题。但是本篇文章会教大家如何导入&#xff0c;并且导入过后还能使用tomcat运行。文章尽可能以图片的形式进行演示。我的idea使用的版本是2022.3.3版本。当然按正常来说版本之…...

安卓java A应用切换到B应用,来回切换不执行OnCreate

需求&#xff1a;安卓java如何做到A应用切换到B应用&#xff0c;如果B应用没启动就启动&#xff0c;如果B应用已经启动就仅仅切换到B应用。B应用再切换回A应用&#xff0c;不要重复执行OnCreate! 在 A 应用中的&#xff1a; 在 A 应用中&#xff0c;如果你希望在切换回 B 应用…...

【Linux】批量恢复文件权限

批量恢复文件权限 Linux 中&#xff0c;如果意外误操作将根目录目录权限批量设置&#xff0c;比如 chmod -R 777 / &#xff0c;系统中的大部分服务以及命令将无法使用&#xff0c;这时候可以通过系统自带的 getfacl 命令来拷贝和还原系统权限&#xff0c;若是其他系统目录被误…...

数据可视化(八)堆叠图,双y轴,热力图

1.双y轴绘制 #双Y轴可视化数据分析图表 #add_subplot() dfpd.read_excel(mrbook.xlsx) x[i for i in range(1,7)] y1df[销量] y2df[rate] #用来正常显示负号 plt.rcParams[axes.unicode_minus]False figplt.figure() ax1fig.add_subplot(1,1,1)#一行一列&#xff0c;第一个区域…...

前台自动化测试:基于敏捷测试驱动开发(TDD)的自动化测试原理

一、自动化测试概述 自动化测试主要应用到查询结果的自动化比较&#xff0c;把借助自动化把相同的数据库数据的相同查询条件查询到的结果同理想的数据进行自动化比较或者同已经保障的数据进行不同版本的自动化比较&#xff0c;减轻人为的重复验证测试。多用户并发操作需要自动…...

基于SLAM的规划算法仿真复现|SLAM|智能规划

图片来自百度百科 前言 那么这里博主先安利一些干货满满的专栏了&#xff01; 首先是博主的高质量博客的汇总&#xff0c;这个专栏里面的博客&#xff0c;都是博主最最用心写的一部分&#xff0c;干货满满&#xff0c;希望对大家有帮助。 高质量博客汇总https://blog.csdn.n…...

sqlite3多线程操作问题

在项目中使用sqlite3&#xff0c;有时会报database is locked 两种方式 1、多线程读&#xff0c;多线程写&#xff0c;只使用共同一个数据库连接&#xff0c;即使用同一个SQLiteHelper连接&#xff0c;调用sqlite3_busy_timeout 2、多线程读&#xff0c;单线程写&#xff0c;每…...

ACCESS数据库增删改查

[添加COM组件] A: Microsoft ADO Ext. 2.8 for DDL and Security B: Microsoft ActiveX Data Objects 2.8 Library [添加头文件]using System.Data.OleDb; using System.Data; using ADOX; using System.IO; using System; using System.Collections.Generic; using System.L…...

动捕系统mockup_optitrack替换为VRPN传递信息

motive&#xff1a;启动→载入已有→layout选择capture→view选择data streming→复选marker右键create刚体→rename刚体→修改local interface为本机ip→勾选vrpn ROS端&#xff1a;roslaunch vrpn_client_ros vrpn_efy.launch 记得修改server地址为motiveip地址 关掉motive…...

【服务平台】Rancher运行和管理Docker和Kubernetes,提供管理生产中的容器所需的整个软件堆栈

Rancher是一个开源软件平台&#xff0c;使组织能够在生产中运行和管理Docker和Kubernetes。使用Rancher&#xff0c;组织不再需要使用一套独特的开源技术从头开始构建容器服务平台。Rancher提供了管理生产中的容器所需的整个软件堆栈。  完整软件堆栈 Rancher是供采用容器的团…...

Spring Boot 实现流式响应(兼容 2.7.x)

在实际开发中&#xff0c;我们可能会遇到一些流式数据处理的场景&#xff0c;比如接收来自上游接口的 Server-Sent Events&#xff08;SSE&#xff09; 或 流式 JSON 内容&#xff0c;并将其原样中转给前端页面或客户端。这种情况下&#xff0c;传统的 RestTemplate 缓存机制会…...

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括&#xff1a;采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中&#xff0c;设置任务排序规则尤其重要&#xff0c;因为它让看板视觉上直观地体…...

2.Vue编写一个app

1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template> <!--html--> </template>…...

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍,多层嵌套定位示例

文章目录 ★ position 的五种类型及基本用法 ★ 一、position 属性概述 二、position 的五种类型详解(初学者版) 1. static(默认值) 2. relative(相对定位) 3. absolute(绝对定位) 4. fixed(固定定位) 5. sticky(粘性定位) 三、定位元素的层级关系(z-i…...

如何为服务器生成TLS证书

TLS&#xff08;Transport Layer Security&#xff09;证书是确保网络通信安全的重要手段&#xff0c;它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书&#xff0c;可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...

Axios请求超时重发机制

Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式&#xff1a; 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章 参考资料 源码&#xff1a; https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

CRMEB 框架中 PHP 上传扩展开发:涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展 扩展入口文件 文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全&#xff08;Thread Safety&#xff09; 线程安全是指在多线程环境下&#xff0c;某个函数、类或代码片段能够被多个线程同时调用时&#xff0c;仍能保证数据的一致性和逻辑的正确性&#xf…...

企业如何增强终端安全?

在数字化转型加速的今天&#xff0c;企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机&#xff0c;到工厂里的物联网设备、智能传感器&#xff0c;这些终端构成了企业与外部世界连接的 “神经末梢”。然而&#xff0c;随着远程办公的常态化和设备接入的爆炸式…...