Prometheus架构组件
Prometheus 是一个开源的监控与告警系统,专为动态的云原生环境(如 Kubernetes)设计。其架构基于主动拉取(Pull)模型,支持多维数据模型和灵活的查询语言(PromQL)。以下是 Prometheus 的核心架构组件及其工作原理的详细说明:
1. Prometheus 核心架构图
+-------------------+ +------------+ +--------------+
| 监控目标 | | Prometheus | | Alertmanager |
| (Exporters/Apps) |<----| Server |---->| |
+-------------------+ +-----+------+ +-------^------+| || 存储/查询 | 告警通知v |+-------------+ +-------v------+| 可视化工具 | | 通知渠道 || (Grafana) | | (Email/Slack)|+-------------+ +--------------+
2. 核心组件与功能
(1) Prometheus Server
- 功能:数据抓取、存储、处理查询和触发告警。
- 子模块:
- Retrieval(抓取模块):根据配置定期从监控目标(如 Exporters、应用程序)拉取指标数据。
- Time Series Database(TSDB):高效存储时间序列数据(默认本地存储,支持远程写入)。
- HTTP Server:提供 API 和 Web UI 用于查询(PromQL)和管理。
(2) 监控目标(Targets)
- Exporters:将第三方系统(如 Node、MySQL、Redis)的指标转换为 Prometheus 可读格式。
- 示例:
Node Exporter(主机监控)、cAdvisor(容器监控)。
- 示例:
- Instrumented Applications:应用程序直接通过客户端库(如 Go、Java、Python)暴露指标。
- 暴露端点:
http://<app>:<port>/metrics。
- 暴露端点:
- Pushgateway:处理短暂任务(如批处理作业)的指标推送。
- 任务将指标推送到 Pushgateway,Prometheus 再从 Pushgateway 拉取。
(3) Alertmanager
- 功能:接收 Prometheus Server 生成的告警,进行去重、分组、静默,并通过渠道(邮件、Slack 等)通知。
- 流程:
- Prometheus Server 根据告警规则(
alerting_rules.yml)触发告警。 - 告警发送至 Alertmanager。
- Alertmanager 按配置的路由策略分发告警。
- Prometheus Server 根据告警规则(
(4) 服务发现(Service Discovery)
- 作用:动态发现监控目标(如 Kubernetes Pods、云服务实例)。
- 支持的发现机制:
- Kubernetes:自动发现集群内的 Pods、Services、Endpoints。
- Consul/Etcd:基于服务注册中心发现目标。
- 文件发现:通过 JSON/YAML 文件静态配置目标列表。
- 云服务商:AWS EC2、Azure VM 等。
(5) 数据存储与远程集成
- 本地存储:默认使用 TSDB 存储数据,适合单节点中小规模场景。
- 远程存储:通过
remote_write和remote_read集成外部存储(如 Thanos、Cortex、InfluxDB),解决长期存储和高可用问题。
3. 工作流程
- 配置:定义抓取目标(
scrape_configs)和告警规则(alerting_rules.yml)。 - 服务发现:动态识别需要监控的端点(如 Kubernetes Pod IP)。
- 数据抓取:Prometheus Server 定期(如 15s)从目标拉取指标(HTTP 请求
/metrics)。 - 存储:抓取的指标存储于本地 TSDB,支持压缩和分块管理。
- 查询与告警:
- 用户通过 PromQL 查询数据(如
rate(http_requests_total[5m]))。 - 触发告警规则时,发送告警至 Alertmanager。
- 用户通过 PromQL 查询数据(如
- 告警处理:Alertmanager 过滤、分组并通知用户。
- 可视化:通过 Grafana 或 Prometheus Web UI 展示监控仪表盘。
4. 关键特性
(1) 拉取模型(Pull-based)
- 优势:集中控制抓取频率,避免客户端推送压力。
- 适用场景:可控的网络环境,如内部服务监控。
(2) 多维数据模型
- 数据结构:每个时间序列由
指标名称+标签组唯一标识。- 示例:
http_requests_total{method="POST", path="/api", status="200"}。
- 示例:
- 灵活性:通过标签过滤、聚合数据(如按
method统计请求量)。
(3) PromQL 查询语言
- 功能:支持实时聚合、切片、预测和连接操作。
- 示例查询:
sum(rate(container_cpu_usage_seconds_total[5m])) by (pod)。
- 示例查询:
(4) 动态服务发现
- 自动化:适应云环境中 IP 频繁变化的场景(如 Kubernetes Pod 重启)。
5. 典型应用场景
- Kubernetes 集群监控:结合
kube-state-metrics和cAdvisor监控容器资源使用。 - 微服务性能分析:通过客户端库(如 Spring Boot Actuator)暴露应用指标。
- 主机与中间件监控:使用
Node Exporter、MySQL Exporter监控基础设施。 - 批处理作业监控:通过
Pushgateway收集短期任务的运行状态。
6. 局限性及解决方案
| 局限性 | 解决方案 |
|---|---|
| 单点存储瓶颈 | 使用 Thanos/Cortex 实现远程存储和联邦集群 |
| 仅支持拉取模型 | 结合 Pushgateway 处理短暂任务 |
| 无长期数据保留 | 集成远程存储(如 InfluxDB) |
| 告警依赖静态配置 | 结合服务发现动态更新告警目标 |
总结
Prometheus 的架构以 高效拉取模型、多维数据 和 动态服务发现 为核心,结合 Alertmanager 和可视化工具,为云原生应用提供了强大的监控能力。尽管存在单点存储和长期数据管理的挑战,但通过与生态系统工具(如 Thanos、Grafana)集成,可扩展为生产级监控解决方案。
相关文章:
Prometheus架构组件
Prometheus 是一个开源的监控与告警系统,专为动态的云原生环境(如 Kubernetes)设计。其架构基于主动拉取(Pull)模型,支持多维数据模型和灵活的查询语言(PromQL)。以下是 Prometheus …...
算法思想之位运算(一)
欢迎拜访:雾里看山-CSDN博客 本篇主题:算法思想之位运算(一) 发布时间:2025.4.12 隶属专栏:算法 目录 算法介绍六大基础位运算符常用模板总结 例题位1的个数题目链接题目描述算法思路代码实现 比特位计数题目链接题目描述算法思路…...
【基于Servlet技术处理表单】
文章目录 一、实验背景与目的二、实验设计与实现思路1. 功能架构2. 核心代码实现3. 测试用例 总结 一、实验背景与目的 本次实验旨在深入理解Servlet工作原理,掌握JSP与Servlet的协同开发,实现前端表单与后端数据处理的交互。具体目标包括:设…...
[OS] mmap | fd是什么 | inode机制 | vfs封装
Linux 下一切皆文件 * 统统抽象为文件,系统封装一层结构体之后,通过指针来访问 * 文章后面的 几个思考题都挺好的 * 后面涉及到的inode 机制,去年暑假的这篇文章,有详细的记录到过 【Linux】(26) 详解磁盘与文件系统:从…...
cout和printf的区别
在C编程中,printf和cout都是用于输出的,但它们之间存在一些关键的区别。printf是C语言中的标准输出函数,而cout是C中引入的一个对象,它是iostream库的一部分。 printf的特点 printf是一个函数,需要明确指定输出的格式…...
STL详解 - vector的模拟实现
目录 一、整体设计 1.1 核心结构 1.2 迭代器实现 二、核心接口实现 2.1 构造函数系列 🌴默认构造 🌴迭代器范围构造 🌴元素填充构造 2.2 拷贝控制 🌵拷贝构造函数 🌵赋值运算符(现代写法…...
C++第三方库【JSON】nlohman/json
文章目录 优势使用API从文件中读取json从json文本创建json对象直接创建并操作json对象字符串 <> json对象文件流 <> json对象从迭代器读取像使用STL一样的访问STL容器转化为 json数组STL容器 转 json对象自定义类型转化为 json对象 限制 优势 直观的语法ÿ…...
超细的ollama下载以及本地部署deepseek项目
Ollama 是一个开源的本地化大语言模型(LLM)运行和部署工具,专注于让开发者能够快速、高效地在本地运行和管理各种开源大语言模型(如 LLaMA、Mistral、GPT 系列等)。它提供了一个统一的接口,简化了模型下载、…...
【Sequelize】关联模型和孤儿记录
一、关联模型的核心机制 1. 关联类型与组合规则 • 基础四类型: • hasOne:外键存储于目标模型(如用户档案表存储用户ID) • belongsTo:外键存储于源模型(如订单表存储用户ID) • hasMany&…...
Sentinel实战教程:流量控制与Spring Boot集成
Sentinel实战教程:流量控制与Spring Boot集成 1. Sentinel简介与核心概念 1.1 什么是Sentinel? Sentinel是阿里巴巴开源的流量控制组件,主要用于微服务架构中的流量防护。它通过限流、熔断、热点防护等机制,帮助系统在高并发场景下保持稳定运行。 1.2 核心功能与术语 流…...
编程技能:调试01,调试介绍
专栏导航 本节文章分别属于《Win32 学习笔记》和《MFC 学习笔记》两个专栏,故划分为两个专栏导航。读者可以自行选择前往哪个专栏。 (一)WIn32 专栏导航 上一篇:编程基础:位运算07,右移 回到目录 下一…...
循环神经网络 - 扩展到图结构之递归神经网络
本文我们来学习递归神经网络(Recursive Neural Network,RecNN),其是循环神经网络在有向无循环图上的扩展 。 递归神经网络是一类专门设计来处理具有层次结构或树形结构的数据的神经网络模型。它与更常见的循环神经网络(Recurrent Neural Net…...
【Kubernetes基础--Pod深入理解】--查阅笔记2
深入理解Pod 为什么要有个Pod1. 容器协作与资源共享2. 简化调度和资源管理3. 设计模式支持 Pod 基本用法Pod 容器共享 VolumePod 的配置管理ConfigMap 概述创建 ConfigMap 资源对象在 Pod 中使用 ConfigMap使用 ConfigMap 的限制条件 为什么要有个Pod Pod 的引入并非技术冗余&…...
【euclid】10.3 2D变换模块(transform2d.rs)bytemuck trait
这段代码是一个 Rust 的 unsafe trait 实现,用于标记 Transform2D 类型在特定条件下可以安全地被视为由全零字节组成的有效实例。让我们详细解释每个部分: 代码分解: #[cfg(feature "bytemuck")] unsafe impl<T: Zeroable, S…...
Maven超级详细安装部署
1.到底什么是Maven?搞清楚这个 Maven 是一个项目管理工具,主要用于 Java 项目的构建、依赖管理和文档生成。 它基于项目对象模型(POM),通过 pom.xml 文件定义项目的配置。 (简单说破:就是工程…...
C# + Python混合开发实战:优势互补构建高效应用
文章目录 前言🥏一、典型应用场景1. 桌面应用智能化2. 服务端性能优化3. 自动化运维工具 二、四大技术实现方案方案1:进程调用(推荐指数:★★★★☆)方案2:嵌入Python解释器(推荐指数࿱…...
云服务模式全知道:IaaS、PaaS、SaaS与DaaS深度解析
云服务模式详解:IaaS、PaaS、SaaS与DaaS 在当今数字化快速发展的时代,云计算已经成为企业和开发者不可或缺的一部分。它提供了灵活的资源和服务,使得用户可以根据自己的需求选择最合适的解决方案。本文将详细介绍四种主要的云服务模式&#…...
电机控制-隆博戈观测器(Luenberger state observer)
本文围绕基于无传感器控制策略的状态观测器展开,介绍其在电机领域的应用、原理、性能表现及无传感器驱动的优劣: 应用场景:适用于燃油泵、风扇等大量固定转速和低成本应用场景。工作原理:状态观测器利用完整的电机微分模型&#…...
RK3506+net9+VS2022跨平台调试C#程序
下载GetVsDbg.sh ,这脚本会下载一个压缩包,然后解压缩,设置x权限等等。但是目标板子连不上,就想办法获取到下载路径,修改这个脚本,显示这个下载链接后,复制一下,用电脑下下来 修改好…...
【16】数据结构之基于树的排序算法篇章
目录标题 选择排序简单选择排序树形选择排序 堆排序堆的定义Heap小跟堆大根堆堆的存储堆的代码设计堆排序的代码设计 排序算法综合比较 选择排序 基本思想:从待排序的序列中选出最大值或最小值,交换该元素与待排序序列的头部元素,对剩下的元…...
华熙生物亮相消博会,这次又带来了什么样的变化?
首先,从展示层面来看,华熙生物在消博会上构建科技桥梁,展台主视觉展示糖生物学发展历程与自身发展交织历程,这象征着中国生物科技企业从产业突围到定义全球标准的蜕变。这一展示不仅提升了华熙生物的品牌形象,更向外界…...
python自动化浏览器标签页的切换
#获取全部标签页的句柄返回句柄的列表 handleswebdriver.window_handles#获取全部标签页的句柄返回句柄的列表 print(len(handles)) 切换标签页 handleswebdriver.window_handles webdriver.switch_to.window(handles[index])#切换到第几个标签页就写几 关闭标签页 关闭标…...
大象机器人推出myCobot 280 RDK X5,携手地瓜机器人共建智能教育机
摘要 大象机器人全新推出轻量级高性能教育机械臂 myCobot 280 RDK X5,该产品集成地瓜机器人 RDK X5 开发者套件,深度整合双方在硬件研发与智能计算领域的技术优势,实现芯片架构、软件算法、硬件结构的全栈自主研发。作为国内教育机器人生态合…...
Redis 数据类型全解析:从基础到实战应用
精心整理了最新的面试资料和简历模板,有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 Redis 作为高性能的键值对存储系统,其丰富的数据类型是实现复杂业务逻辑的核心优势。本文将深入解析 Redis 六大核心数据类型及扩展类型ÿ…...
第一天 unity3D 引擎入门
一、为什么选择Unity进行3D开发? Unity作为全球使用最广泛的游戏引擎,在2022年的开发者调查中占据了62%的市场份额。它不仅支持3D/2D游戏开发,更在VR/AR、工业仿真、影视动画等领域大放异彩。对于初学者而言,Unity的独特优势在于…...
【初阶数据结构】——算法复杂度
一、前言 1、数据结构是什么? 数据结构(Data Structure)是计算机存储、组织数据的⽅式,指相互之间存在⼀种或多种特定关系的数 据元素的集合。没有⼀种单⼀的数据结构对所有⽤途都有⽤,所以我们要学各式各样的数据结构, 如&…...
MySQL:存储函数和存储过程
系列文章目录 1.MySQL编程基础 2.程序控制流语句 3.存储过程 4.游标 5.嵌入式SQL 文章目录 系列文章目录前言一、程序控制流语句:二、存储函数: 1.存储函数的特点:2.存储函数的定义:3.调用存储函数 三、存储过程:…...
常见的 API 设计风格
在软件开发中,常见的 API 设计风格主要有以下几种,每种风格适用于不同的场景和需求: 1. RESTful API (主流) 特点: 基于 HTTP 协议,使用标准方法(GET/POST/PUT/DELETE)资源导向(UR…...
Google-A2A协议全面解析:一文掌握Agent-to-Agent协议的核心与应用
前言: 在当今人工智能技术飞速发展的时代,智能体(Agent)已悄然融入我们生活的各个角落。无论是个人智能助手,还是企业的自动化工具,各类AI代理的应用愈发广泛。但目前这些智能体之间大多处于孤立状态&…...
Linux-服务器添加审计日志功能
#查看audit软件是否在运行(状态为active而且为绿色表示已经在运行) systemctl start auditd #如果没有在运行的话,查看是否被系统禁用 (audit为0表示被禁用) cat /proc/cmdline | grep -w "audit=0" #修改/etc/default/grub里面audit=0 改为audit=1 #更新GRUB…...
