当前位置: 首页 > news >正文

Prometheus 告警规则

Prometheus 告警规则

Prometheus官方内置的第三方报警通知包括:邮件、 即时通讯软件(如Slack、Hipchat)、移动应用消息推送(如Pushover)和自动化运维工具(例如:Pagerduty、Opsgenie、Victorops)

Prometheus告警流程

须知:

  1. Prometheus 从监控目标上收集信息(scrape_interval 是多长时间采集一次,默认是1m其中srcape_interval可以配置全局生效,也可以基于单个metrics定义),然后将监控信息持久存储在本地存储上。
  2. Prometheus 对告警规则做定期计算,其中evaluation_interval只有全局值;然后更新告警
groups:
# 实例存活告警规则
- name: exportrules:
# 实例存活告警- alert: memory        # 名称expr: memory_used > 30    # 算法for: 10s        # 告警持续时间labels:user: prometheusseverity: "{{ $labels.job }}: Memory usage exceeded 30G”annotations:description: "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 1 minutes."

注意:配置中的for语法就是用来设置告警持续时间的;如果配置中不设置for或者设置为0,那么pending状态会被直接跳过。
在这里插入图片描述

告警触发流程

  1. 假设采集周期为5s采集一次memory_used
  2. 采集到的指标告知给Alertmanager,当指标超过30时,这时会触发告警
  3. 然后根据采集到的指标按照10s一个周期计算表达式为真,并且符合for持续10s,将告警切换到pening状态
  4. 下个计算周期,表达式仍然为真,并且符合for 持续10s告警变更为Firing,并将告警从Prometheus发送给Alertmanager;
  5. 下个周期计算,表达式仍然为真,并且符合for 持续10s持续告警给Alertmanager;
  6. 一直到,表达式为假,告警状态边更为inactive,并发送给Alertmanager,告警已经解决

Alertmanager 分组 抑制 静默

分组
1、同类告警的聚合帮助运维排查问题
2、通过告警邮件的合并,减少告警数量
抑制

须知:抑制可以针对单个指标,也可以对分组。(下边内容我是以分组进行说明的)

告警延时的几个重要参数:
group_by:采用哪个标签作为分组的依据
group_wait:分组等待时间,比如:5s
group_interval:分组尝试再次发送告警的时间间隔,比如:5m
Repeat_interval:分组内发送相同告警的时间间隔,比如:60m
例:
有同组告警集A,如下:
a1
a2
a3
场景一:
a1先到达告警系统,此时在group_wait:5s的作用下,a1不会立刻告出来,a1等待5s,下一刻a2在5s内也触发,a1,a2会在5s后合并为一个分组,通过一个告警消息发出来;
a1,a2持续未解决,它们会在repeat_interval: 60m的作用下,每隔一小时发送告警消息

Alertmanager 配置文件说明

global:smtp_smarthost: 'smtp.163.com:25'        # 是用于发送邮件的邮箱的SMTP服务器地址+端口smtp_from: 'jugglee@163.com'             # 发送邮箱名称smtp_auth_username: 'jugglee@163.com'    # 邮箱名称smtp_auth_password: 'admin123'           # 是发送邮箱的授权码而不是登录密码smtp_require_tls: false                  # 不设置的话默认为true,当为true时会有starttls错误,可以用其他办法解决。为了简单这里直接设置为falsetemplates:                                 # 指出邮件的模板路径- '/alertmanager/template/*.tmpl'route:group_by: ['alertname', 'cluster', 'service']group_wait: 30sgroup_interval: 5mrepeat_interval: 10mreceiver: default-receiverreceivers:                                  # 下html指出邮件内容模板名,这里模板名为“alert.html”,在模板路径中的某个文件中定义
- name: 'default-receiver'email_configs:- to: 'whiiip@163.com'html: '{{ template "alert.html" . }}'headers: { Subject: "[WARN] 报警邮件test" }   # 为邮件标题

相关文章:

Prometheus 告警规则

Prometheus 告警规则 Prometheus官方内置的第三方报警通知包括:邮件、 即时通讯软件(如Slack、Hipchat)、移动应用消息推送(如Pushover)和自动化运维工具(例如:Pagerduty、Opsgenie、Victorops) Promethe…...

mulesoft MCIA 破釜沉舟备考 2023.02.13.02

mulesoft MCIA 破釜沉舟备考 2023.02.13.03 1. According to MuleSoft, which deployment charcateristic applies to a microservices application architecture?2. A mule application designed to fulfil two requirements3. A mule application must periodically process…...

获取DLL运行时路径的方法

之前项目中发现的问题,记录下解决方案1. 问题背景OVVRNTool项目中,底层图像基本操作功能由DLL库函数提供,上层基于DLL封装了两个应用CMD和GUI,然后通过Qt打包分发;发布是直接采用绿色免安装的方式打包,具体…...

“华为杯”研究生数学建模竞赛2006年-【华为杯】D题:学生面试中教师安排的优化与算法(附获奖论文)

赛题描述 高校自主招生是高考改革中的一项新生事物,现在仍处于探索阶段。某高校拟在全面衡量考生的高中学习成绩及综合表现后再采用专家面试的方式决定录取与否。该校在今年自主招生中,经过初选合格进入面试的考生有N人,拟聘请老师M人。每位学生要分别接受4位老师(简称该学…...

【JavaScript】复习 【对象参数】【函数参数】

js不会检查任何参数类型,任何参数都可以作为参数传递 1、对象参数 改变量随便改,改对象要看这个对象是不是有多个变量同时指向这个对象 const 用来定义常量,只能赋值一次。 变量------->对象------->属性 被const修饰的对象 …...

如何批量提取文件名到excel表格?

批量提取文件名到excel表格?关于这个问题相信很多人都遇到过,大多数人在第一次碰到的时候都不知道如何下手,大家都会立即在百度里面搜索相关方法教程,小编也试着搜索了一下,发现找到的很多方法都大同小异,需…...

CUDA线程层次一文搞懂|参加CUDA线上训练营

设备术语 Host:CPU 和 内存 (host memory)Device:GPU 和显存 (device memory) CUDA 线程层次 CUDA 线程层次分为: Thread 所有线程执行相同的核函数并行执行 Thread Block 执行在一个 Streaming Multiprocessor (SM&#xff09…...

Linux文件默认权限:umask

umask就是指定目前用户在建立文件或目录时候的权限默认值 查看方式有两种:一种可以直接输入umask,就可以看到数字类型的权限设置值,一种则是加入umask后加入-S(Symbolic)选项,就会以符号类型的方式来显示出…...

SonicWall:请立即修复SMA 1000 漏洞

近日,网络安全供应商SonicWall发布了关于安全移动访问 (SMA) 1000设备的三个安全漏洞的紧急报告,其中包括一个高威胁性的身份验证绕过漏洞。SonicWall指出,攻击者可以利用这些漏洞绕过授权,并可能破坏易受攻击的设备。 从报告中可…...

基于VS调试分析 + 堆栈观察问题代码段

文章目录问题代码段1 —— 阶乘之和问题代码段2 —— 越界的危害① 发现问题② 分析问题③ 思考问题【⭐堆栈原理⭐】④ 解决问题【DeBug与Release】👨程序员与测试人员👩✒总结与提炼问题代码段1 —— 阶乘之和 先来看一道C语言中比较基础的题目&#x…...

QFramework框架学习

主要学习内容TypeEventSystemActionKitTimer类1、TypeEventSystem-适用于一个条件触发,多个组件响应的情况例如:动物园系统中,点击肉食动物按钮,动物园中有肉食属性的动物都进行显示。步骤:1、动物自身脚本上进行判断是…...

移动OA系统,联动企业协作让办公高效无间断

移动oa系统,近年来随着企业办公节奏的变化及人们个性化办公需求的增加迎来了快速发展。一方面,它兼具OA系统诸多优势,既凝聚了企业基础管理工作,联动了企业协作、沟通交流,又进一步提高了企业的综合实力与市场竞争力。…...

结构体熟练掌握--实现通讯录

魔王的介绍:😶‍🌫️一名双非本科大一小白。魔王的目标:🤯努力赶上周围卷王的脚步。魔王的主页:🔥🔥🔥大魔王.🔥🔥🔥 ❤️‍&#x1…...

腾讯云CVM服务器购买流程手把手方法教程攻略

​购买腾讯云服务器有两种方式。一种是在官方活动中,简单方便,但ECS配置相对固定;另一种是在ECS页面定制购买。配置选项丰富,但地理可用性区域、计费模式、CPU内存实例规格、映像系统、存储系统磁盘、网络带宽和安全组的选择更为复…...

九龙证券|“春季躁动”行情要来?1月新增投资者数大增

新增投资者数量在上一年12月触及多年新低后,2023年1月份开端呈现反弹。 在新增投资者数量之外,近段时刻以来,包含A股商场股票成交额、北向资金净买入额、两融资金规划及成交额在内多个商场目标也呈现回暖的特征,目前A股商场交投氛…...

C语言(按位运算符和位移运算符)

目录 ​编辑 一.按位运算符 1.二进制反码或按位取反&#xff1a;~ 2.按位与&#xff1a;& 3.按位或&#xff1a;| 4.按位异或&#xff1a;^ 二.位移运算符 1.左移&#xff1a; << 2.右移&#xff1a; >> 一.按位运算符 C有四个按位逻辑运算符都用于整…...

删掉的照片怎么恢复?

每一张照片都是生活&#xff0c;留住每一个人的回忆。而这些有意义的照片&#xff0c;我们都会把它保存在我们的手机或电脑上&#xff0c;始终伴随着我们。但无论是手机还是电脑&#xff0c;都是需要时不时清理一下的。如果是清理垃圾图片时&#xff0c;不小心删除了需要的图片…...

【java】40 个 SpringBoot 常用注解(建议收藏)

本文目录一、Spring Web MVC 注解Spring Web MVC 注解RequestMappingRequestBodyGetMappingPostMappingPutMappingDeleteMappingPatchMappingControllerAdviceResponseBodyExceptionHandlerResponseStatusPathVariableRequestParamControllerRestControllerModelAttributeCross…...

【JMC】SMILES‑based deep generative scafold decorator for de‑novo drug design

SMILES-based deep generative scaffold decorator for de-novo drug design 基于SMILES的利用Fragment的分子生成模型 https://github.com/undeadpixel/reinvent-scaffold-decorator 1.背景 深度生成模型因其可以从有限的数量中生成新数据&#xff0c;目前已成功应用于生成…...

全链路异步,让你的 SpringCloud 性能优化10倍+

背景 随着业务的发展&#xff0c;微服务应用的流量越来越大&#xff0c;使用到的资源也越来越多。 在微服务架构下&#xff0c;大量的应用都是 SpringCloud 分布式架构&#xff0c;这种架构&#xff0c;总体是全链路同步模式。 同步编程模式不仅造成了资源的极大浪费&#x…...

智能体架构的创新突破:Agent-S框架的技术解析与实战应用

智能体架构的创新突破&#xff1a;Agent-S框架的技术解析与实战应用 【免费下载链接】Agent-S Agent S: an open agentic framework that uses computers like a human 项目地址: https://gitcode.com/GitHub_Trending/ag/Agent-S Agent-S作为开源的智能体框架&#xff…...

你的舵机抖得厉害?可能是PWM信号配置错了!STM32定时器避坑指南(实测MG996R)

STM32舵机控制实战&#xff1a;从PWM原理到MG996R精准调参 引言 当你第一次尝试用STM32控制舵机时&#xff0c;可能会遇到这样的场景&#xff1a;按照教程配置好PWM参数&#xff0c;烧录程序后却发现舵机要么纹丝不动&#xff0c;要么疯狂抖动&#xff0c;甚至发出刺耳的噪音…...

Dinky 1.2.3实战:手把手教你构建带多数据源Connector的Flink 1.20镜像并推上K8s

Dinky 1.2.3实战&#xff1a;构建多数据源Flink镜像与K8s集成全指南 1. 为什么需要定制Flink基础镜像&#xff1f; 在实时数据处理领域&#xff0c;Flink已成为事实上的标准计算引擎。但官方镜像往往只包含基础组件&#xff0c;当我们需要连接MySQL、Kafka、Paimon等不同数据源…...

LFM2.5-1.2B-Thinking-GGUF一文详解:为什么它适合CPU/低端GPU快速推理?

LFM2.5-1.2B-Thinking-GGUF一文详解&#xff1a;为什么它适合CPU/低端GPU快速推理&#xff1f; 1. 模型概述与核心优势 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型&#xff0c;专为低资源环境优化设计。这个1.2B参数的模型采用GGUF格式&#xff0c;结合l…...

新手必看,在快马平台上手mcp,从零理解模型上下文协议的核心机制

今天想和大家分享一个特别适合新手理解MCP&#xff08;模型上下文协议&#xff09;的小项目。作为一个刚接触AI开发不久的人&#xff0c;我发现在InsCode(快马)平台上学习这些概念特别方便&#xff0c;尤其是它能把复杂的协议用实际代码展示出来。 MCP简单来说就是AI模型和外部…...

HiDream_E1_1:全新AI绘图GGUFS模型来袭

HiDream_E1_1&#xff1a;全新AI绘图GGUFS模型来袭 【免费下载链接】HiDream_E1_1_bf16_ggufs 项目地址: https://ai.gitcode.com/hf_mirrors/ND911/HiDream_E1_1_bf16_ggufs 导语&#xff1a;AI图像生成领域再添新成员&#xff0c;HiDream_E1_1_bf16_ggufs模型正式发布…...

终极指南:AR.js增强现实如何在电商、教育和娱乐领域创造革命性体验

终极指南&#xff1a;AR.js增强现实如何在电商、教育和娱乐领域创造革命性体验 【免费下载链接】AR.js Image tracking, Location Based AR, Marker tracking. All on the Web. 项目地址: https://gitcode.com/gh_mirrors/arj/AR.js AR.js是一个轻量级的Web增强现实库&a…...

linux条件变量封装(2026.3.24)

条件变量的wait让线程休眠&#xff0c;Signal随机唤醒一个线程&#xff0c;然后又立马锁上。#include<iostream> #include<pthread.h> #include"Mutex.hpp"namespace CondModule{using namespace MutexModule;class Cond{public:Cond(){pthread_cond_ini…...

ClickHouse 3节点集群配置与分布式表实战指南

1. ClickHouse集群基础概念解析 第一次接触ClickHouse集群时&#xff0c;我被各种术语绕得头晕——分片、副本、分布式表、本地表&#xff0c;这些概念到底有什么区别&#xff1f;后来在实际项目中踩过几次坑才真正理解它们的含义。简单来说&#xff0c;**分片&#xff08;Shar…...

从零到一:手把手教你搭建专属DNF私服服务器

1. 准备工作&#xff1a;搭建DNF私服需要哪些东西 第一次接触DNF私服搭建的朋友可能会觉得这是个技术活&#xff0c;其实只要跟着步骤来&#xff0c;完全可以在2小时内搞定。我自己搭建过不下10个版本的DNF私服&#xff0c;从60怀旧版到最新的110级版本都玩过。先说说需要准备的…...