产品新说 | 指标的异常检测怎么做,能更好配合业务变化(二)

前言:
上期分享我们提到了指标异常检测实践要素中的三个方面:
以面对业务变动为前提,确定业务波动是周期性还是非周期性,进而选对算法;
通过确认业务的常规指标,确定异常方向进行监测(上基带 / 下基带 / both);
考虑不同时段的检测差异从而设定合理的运维日历并做出相应的算法模型匹配。
戳→擎创夏洛克AIOps:产品新说 | 指标异常?怎么做能更好配合业务变化(一)一键回看上期精彩
本期分享将继续通过一些场景小故事进行实践要素的后续分享
使用角色:张三( 企业应用运维人员 / 平台(云)运维人员 / 基础设施运维人员 )
实践重点:考虑不同时段的检测差异、优化模型参数、优化告警阈值、长期关注数据质量
产品:擎创夏洛克指标解析中心
一、考虑不同时段的检测差异 (工作日/非工作日的不同阈值需求)
依旧选择超级网银这一业务,该业务中有三大类型:跨行实时转账、跨行账户查询、跨行资金归集,这三类业务在对公和对私的交易时间安排上大有不同。

把跨行实时转账单拎出来,以交易量(对公)指标为监测目标,在工作日和非工作日的不同时段条件下,对于告警阈值规则的选择应该如何呢?张三通过指标解析中心以将其分为以下三类。
▲Part.1:敏感度高
正常工作日上班期间,对交易量(对公)指标检测设定的告警策略是在2个检测窗口内满足以下规则,则触发告警:
异常度大于90,则触发告警级别为严重;
异常度大于60,则触发告警级别为一般;

▲Part.2:敏感度低
周末双休及工作日下班时段,对交易量(对公)指标检测设定的告警策略是在3个检测窗口内满足以下规则,则触发告警:
异常度大于80,则触发告警级别为一般;
指标值小于100,则不监测;

▲Part.3:静默处理
在节假日期间,超级网银业务通常是停滞的,这期间设定告警监测为关闭状态。

根据业务类型在时间上的特点,设定不同的阈值及告警规则,能够节省算力的同时,更精确的监测指标是否存在异常。
二、优化告警阈值 (固定阈值 / 动态阈值 / 不监测)
指标在不同的阈值区间需要有不同的检测策略,通过算法检测智能设定阈值,应用不同规则模式,保障检测结果的准确性。
●以CPU的使用率为例

1.固定阈值
某一时段,CPU的使用率会随着业务的体量增长而水涨船高,由于负载过高会触碰警戒红线而引起告警,这个负载的极限值根据监控需求设置固定阈值即可。
2.动态阈值
这一天张三在白班值班,在不同时段业务交易的数量不同,因此CPU使用率的指标数值在中位区间来回波动,指标解析中心采用动态阈值的监测规则,在监测过程中发现有2次数值突破黄线大概率要触碰警戒红线的趋势,及时进行了告警,张三迅速查看并及时找到故障根源进行解决,使得业务运营没有出现损失。
3.不监测
与固定阈值相似的是,很多常规时段里(如工作日休息)业务是处于低交易状态的,因此指标数值一直在低位区间波动,这并不会造成任何负面影响,因此指标解析中心会对低区间的规则设定为不监测。
三、 长期关注数据质量 :(配置规则 / 查看告警)
指标异常检测需要由高质量的指标数据供给,来保证结果的高可用性,而保证数据供给质量的前提是对指标数据质量的监测能力。

张三为长期保证数据质量的可用性,通过指标解析中心配置了两条规则:
1.监控连续数据缺失:在检查周期内,连续x分钟/小时内无指标示例的数据则记录告警;
2.监控随机数据缺失:在检查周期内,按照比例检查各指标实例的确实情况,并记录。
做好规则配置以后,可以定期在告警中心里查看低质量的数据源及缺失数据的时长和比例,有据可循的进行针对性优化及改善。
四、优化算法模型 (简化算法调参)
算法的调优调参一直是令张三头疼的一件事儿,系统在使用动态阈值检测的时候,需要有一种自动优化模型的能力。指标解析中心在学习历史数据(建议训练学习周期为14-30天)的基础上,只要附加一些符合该类业务异常敏感度的设定,即能够自动简单的生成相对最优的算法模型,避免无效告警的出现。

本期关于指标解析中心的一些能力介绍到此告一段落,虽然是在说产品的一些功能,但其实这也是擎创在指标方向探索出来的一些能力建设思路,希望能为大家带来或多或少的帮助。未来,擎创将继续从业务视角出发,打造更具实战性、自动化的指标产品,助力业务运营更加平稳高效。

擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司致力于协助企业客户提升对运维数据的洞见能力,优化运维效率,充分体现科技运维对业务运营的影响力。
行业龙头客户的共同选择

更多运维思路与案例持续更新中,敬请期待
随手点关注,更新不迷路
相关文章:
产品新说 | 指标的异常检测怎么做,能更好配合业务变化(二)
前言:上期分享我们提到了指标异常检测实践要素中的三个方面:以面对业务变动为前提,确定业务波动是周期性还是非周期性,进而选对算法;通过确认业务的常规指标,确定异常方向进行监测(上基带 / 下基…...
华为OD机试题,用 Java 解【最短耗时】问题
最近更新的博客 华为OD机试题,用 Java 解【停车场车辆统计】问题华为OD机试题,用 Java 解【字符串变换最小字符串】问题华为OD机试题,用 Java 解【计算最大乘积】问题华为OD机试题,用 Java 解【DNA 序列】问题华为OD机试 - 组成最大数(Java) | 机试题算法思路 【2023】使…...
mysql数据库常见面试题
慢查询排查优化 排查 slow_query_log设置为on,就会记录慢查询sql;long_query_time可以设置慢查询sql的阈值时间;slow_query_log_file表示记录慢查询sql的日志路径。即我们可以通过打开记录慢查询的开关,设置慢查询的时间阈值&…...
【Android源码面试宝典】MMKV从使用到原理分析(一)
去年,我们写过一篇文章,对于android原生提供的key-value存储API SharePreference,进行了从使用到原理的深入分析,同时对其中存在的ANR问题、存取慢等问题,进行了深入的探索、总结。但是之前的文章,我们仅仅指出了问题,没有给大家提供解决方案,也就是说,SharePreferenc…...
你真的懂动态库吗?一文详解动态库的方方面
这里写目录标题创建动态库创建静态库动态库与静态库的区别动态链接与静态链接的区别动态库的加载过程dll的创建以及应用程序隐式链接到dll的过程dll的创建以及应用程序显示链接到dll的过程动态库的二进制兼容性创建动态库 1.【新建】-》【项目】-》【动态链接库】 新建的动态…...
I.MX6ULL内核开发12:使用设备树插件实现RGB灯驱动
目录 一、引言 二、设备树插件格式 三、实验说明 四、实验准备 4.1 通过内核工具编译设备树插件 五、实验效果 5.1 uboot加载 5.2 加载RGB驱动 一、引言 Linux4.4以后引入了动态设备树(Dynamic DevicesTree),这里翻译位“设备树插件…...
大家一起来找茬,新手第一次layout到底能挑出多少毛病?
有一个新手工程师在论坛上发了一篇帖子,把自己的处女PCB布线图贴出来。 如果不看其他网友的评论,你能看出多少问题呢?可以在留言区和我们互动哦~ 帖子里他还提出了自己的小见解:问一下,我觉得自动布线挺好用的啊&#…...
Java集合概述(Collection集合)
目录集合一、集合与数组二、集合类体系结构三、泛型(约定集合存储数据类型)四、Collection集合常用API五、Collection集合的遍历方式5.1 迭代器遍历5.2 增强for循环(for each):5.3 lambda表达式六、Collection集合存储自定义类型的对象七、常见数据结构集合 一、集合与数组 数…...
运动无线蓝牙耳机哪款好、运动无线蓝牙耳机推荐
作为 运动爱好者,每天早晨醒来后的第一件事就去家门口的湿地公园跑上一圈。各种运动装备都齐了,不过在耳机选择上还真的犯难,打着“运动耳机”旗号的产品也是种类繁多,那么到底什么样的无线耳机更适合运动呢?于是我花时…...
解决AAC音频编码时间戳的计算问题
1.主题音频是流式数据,并不像视频一样有P帧和B帧的概念。就像砌墙一样,咔咔往上摞就行了。一般来说,AAC编码中生成文件这一步,如果使用的是OutputStream流写入文件的话,就完全不需要计算时间。但在音视频同步或者使用A…...
Android 9.0 添加自定义开机广播
1.概述 在9.0的系统rom定制化开发中,由于系统开机广播接收受限,普通app接收不到这个广播,如果接收这个广播很多应用 感觉要好久收到这个广播, 所以需要自定义开机广播来使用自定义广播开启某些应用,实现自己的功能,接下来就需要分析下开机广播的流程,然后增加自定义广播…...
第四阶段10-添加类别,类别列表mapper层,service层,controller层
63. 添加类别–Mapper层 插入类别数据的功能此前已经完成! 64. 添加类别–Service层 在项目的根包下创建pojo.dto.CategoryAddNewDTO类: Data public class CategoryAddNewDTO implements Serializable {/*** 类别名称*/private String name;/*** 父…...
linux内核启动分析(一)
文章目录1.HEAD1.preserve_boot_args1.1 __inval_dcache_area2.el2_setup3. set_cpu_boot_mode_flag4. __create_page_tables4.1map_memory5. __cpu_setup6. __primary_switch6.1 __enable_mmu6.2 __primary_switched最近工作中经常使用飞腾E2000的开发版,也遇到一些…...
wireshark常见使用操作讲解以及几个故障解决案例分享
(1)网卡选择 对于电脑本身有多个网卡的时候,选择网卡就成为了一个困惑的地方,其实这里很简单,只要把鼠标放在对应的网卡上面就可以看到地址等信息,就容易判断出来了。 (2)过滤器 直…...
利用逻辑分析仪解析串口通讯数据
利用逻辑分析仪解析串口通讯数据🔧采用的是市面上最为广泛使用的USB逻辑分析仪: 📚资料下载: 链接: https://pan.baidu.com/s/1c9lwWDbtJxaJED-kzSbiJg 提取码: 5vnr🔨测试工具为:Logic 2.4.6,也可以使用Pu…...
新整理的前端面试题
pinia和vuex的区别(1)pinia它没有mutation,他只有state,getters,action【同步、异步】使用他来修改state数据(2)pinia他默认也是存入内存中,如果需要使用本地存储,在配置上比vuex麻烦…...
数据仓库-数仓分层
层级 全拼 职责划分 ODS(源数据层) Operational DataStore ODS层存储最原始的数据, 对数据不做任何加工处理; 源数据主要来自业务数据库和日志,这些数据是用户操作业务系统产生,所以叫操作型数据(Operational Data) 。 DWD(…...
【Linux】Linux根文件系统扩容
场景:根文件系统需要至少100GB的剩余空间,但是目前就剩余91GB。因此,我们需要对根文件系统进行扩容。# df -h 文件系统 容量 已用 可用 已用% 挂载点 devtmpfs 3.9G 0 3.9G 0% /dev tmpfs …...
RPC编程:Hessian RPC一个老的RPC框架(一)
RPC编程:Hessian RPC一个老的RPC框架一:Hessian RPC1:Hession RPC一个老的RPC框架2:老,为什么还要研究?3:Hession RPC概念二:Hessian RPC设计思想1:Hession依赖于服务器2…...
逆向 x蜂窝 zzzghostsigh
逆向 x蜂窝 zzzghostsigh 版本 9.3.7 新版本是64位的so charles 抓包 目标字段 zzzghostsigh frida java function hook_xPreAuthencode() {Java.perform(function() {var helper Java.use("com.mfw.tnative.AuthorizeHelper");helper.xPreAuthencode.implemen…...
Realistic Vision V5.1 生态工具集成展示:与Cursor等AI编程助手联动工作流
Realistic Vision V5.1 生态工具集成展示:与Cursor等AI编程助手联动工作流 最近在尝试把各种AI工具串起来用,发现了一件挺有意思的事。以前我们做开发,写代码是一个工具,画界面图是另一个工具,做流程图还得再开一个软…...
如何通过有效方法提升儿童专注力障碍的注意力集中度?
提升儿童专注力的有效策略与技巧解析 在帮助儿童提高注意力集中度的过程中,首先需要建立一个适合学习的环境。创造一个安静、整洁的学习空间,减少杂音和干扰,有助于孩子更好地专注。此外,开展一些分段学习的小技巧也是非常有效的方…...
如何高效获取QQ音乐资源?MCQTSS_QQMusic带来的无损音乐解析方案
如何高效获取QQ音乐资源?MCQTSS_QQMusic带来的无损音乐解析方案 【免费下载链接】MCQTSS_QQMusic QQ音乐解析 项目地址: https://gitcode.com/gh_mirrors/mc/MCQTSS_QQMusic MCQTSS_QQMusic是一款专注于QQ音乐资源解析的开源工具,能够帮助用户突破…...
Vivado综合策略的‘隐藏菜单’:手把手教你用TCL定制专属策略,榨干UltraScale+性能
Vivado综合策略的‘隐藏菜单’:手把手教你用TCL定制专属策略,榨干UltraScale性能 当你在Vivado中点击"Run Synthesis"时,是否曾好奇那些预设策略背后究竟发生了什么?对于大多数FPGA设计,Vivado提供的预设策略…...
从Mesh到点云:Open3D处理PLY/STL文件时,你可能忽略的顶点法线与可视化细节
从Mesh到点云:Open3D处理PLY/STL文件时,你可能忽略的顶点法线与可视化细节 当你在三维重建或逆向工程中处理PLY/STL文件时,是否遇到过转换后的点云看起来"不对劲"?表面出现不自然的明暗变化,或者下游深度学习…...
用UE5动画蒙太奇制作连招系统:三连击案例+特效通知完整流程
UE5连招系统深度实战:从动画蒙太奇到特效联动的全流程设计 在动作角色扮演游戏(ARPG)开发中,连招系统是战斗体验的核心支柱。想象一下这样的场景:玩家按下攻击键触发第一段斩击,在收招前0.2秒内再次输入&a…...
小白也能玩转AI语音:VoxCPM-1.5-WEBUI快速入门指南
小白也能玩转AI语音:VoxCPM-1.5-WEBUI快速入门指南 1. 为什么选择VoxCPM-1.5-WEBUI? 在AI语音技术日益普及的今天,找到一个既专业又容易上手的文本转语音工具并不容易。VoxCPM-1.5-WEBUI正是为解决这个问题而设计的,它让AI语音合…...
从DAP-Link看USB虚拟串口设计:手把手教你给STM32F407添加双通道调试功能
从DAP-Link看USB虚拟串口设计:手把手教你给STM32F407添加双通道调试功能 在嵌入式开发中,调试工具的性能直接影响开发效率。传统调试器往往需要额外串口芯片,而现代方案如DAP-Link通过USB CDC类实现虚拟串口,既节省硬件成本又能提…...
Kook Zimage 真实幻想 Turbo 与ChatGPT结合:智能图像生成方案
Kook Zimage 真实幻想 Turbo 与ChatGPT结合:智能图像生成方案 1. 引言 你有没有遇到过这样的情况:脑子里有一个很棒的创意画面,但就是不知道该怎么用文字描述出来?或者写了一大段描述词,生成的图片却总是不尽如人意&…...
AD23导出Gerber文件保姆级教程:从PCB到嘉立创下单,新手避坑指南
AD23导出Gerber文件全流程实战:从设计检查到嘉立创安全下单 第一次将精心设计的PCB转化为可生产的Gerber文件,就像新手司机首次独立上路——每个操作都可能隐藏着意想不到的陷阱。作为使用Altium Designer 23(AD23)的设计师&…...
