JAVA开发运维(云基础设备监控)
在大型的商用系统中,经常需要监控云设备的健康状态,性能情况,流量数据等。及时发现系统问题,及时修复,以确保系统的高可用。检查云资源的工作内容主要包括基础监控、主动拨测、用户体验、APM监控、指标体系、业务分析、智能警告 等。
一、基础监控
主机监控 提供操作系统的CPU、内存、磁盘、文件系统、网络的监控;同时提供进程级的监控;支持容器和进程的纵向调用,支持进程和组件的关联分析。
组件监控 支持Nginx、Apache、Redis、RabbitMQ、ActiveMQ、Zookeeper、Kafka、MySQL、Oracle、PostgreSQL、SQLServer、MongoDB、Elasticsearch等组件的指标监控,同时关联进程、主机、容器、APM提供纵向关联分析。
容器监控 支持Docker、Kubernetes的监控,自动发现容器进程,监控容器的CPU、内存、磁盘、网络;自动发现容器下运行的关键进程并与之关联,快速查看进程和容器的调用关系。
内网监控 从外部对应用或主机提供服务监控,支持ICMP监控、TCP监控、HTTP(s)监控。帮助用户监测局域网内网络的联通性和延迟。
二、主动拨测
拨测从用户视角,依托全球高质量布点网络,模拟用户的访问路径与习惯,能够让企业了解自身用户,无论何时何地,使用何种设备,能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。
移动应用拨测是基于自研自动化测试引擎和独一无二部署技术,模拟用户操作将核心业务流程脚本化并持续运行在生产环境中,实时采集业务性能数据,自动进行汇总分析的全方位自动化平台。能够让企业了解自身业务在用户视角下的实际情况:何时何地、使用何种设备、能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。
三、用户体验
采用SDK方式实现对App的崩溃、卡顿、超时等性能问题进行采集,并能对真实用户体验进行量化,实现版本迭代过程中的用户体验优化。
提供Web前端性能的监控与分析,量化前端用户体验指标,采集网页JS错误及网络请求错误,快速定位Web前端的性能问题,辅助进行Web前端性能优化。
提供对微信小程序、支付宝小程序的性能监控能力,并能够对小程序接口及小程序访问路径进行追踪,帮助开发人员有效进行小程序性能优化。

四、APM监控
全栈拓扑
自动发现业务系统之间、应用与业务系统之间、应用与服务组件之间的关联关系。通过拓扑可快速梳理业务调用逻辑,快速发现与定位问题。
业务接口分析
对业务系统中完成某一业务操作的动作事件进行相关事务级别的监控与分析,这也是应用性能管理的最小监控单元,帮助用户细粒度定位问题。
代码级别定位
针对某事务实例,对其进行代码级别的堆栈分析,精确定位到某一行业务逻辑代码,观察其因为什么报错或是由于什么原因导致执行缓慢,帮助研发和运维人员快速定位问题。
异常分析
统计当前系统内所有应用错误、代码异常、数据库错误类型等,对业务的影响分析,包括影响的用户数、影响的业务指标等,帮助研发、运维、业务人员分析系统性能影响范围。
故障主动预警
支持多维度、灵活的配置预警策略,提供7*24小时主动预警能力,主动运维,VIP用户保障,第一时间发现性能问题,降低异常时长,减少运维人力投入
五、指标体系
指标管理可以接入自有系列产品监控的指标,以及诸如Zabbix、Prometheus等多个数据源、多种协议的外部指标数据,贯穿业务到IT系统的全方位立体化可观测能力。

重要指标:
业务层
通用指标:业务可用性、业务错误数、完成业务数、报错业务数、活跃用户数、错误影响用户数、业务流可用性、完成业务流、报错业务流、在途业务流、活跃用户数、错误影响用户数、平均执行周期、操作可用性、操作成功次数、操作失败次数、同比环比 自定义指标:交易金额、订单总数、top10商家销售排名、top10热销商品等。
用户层
重要指标: 可用性:崩溃、卡顿、请求错误、操作可用性 网络性能:响应时间、网络时间、 用户体验性能:应用启动时间、页面可交互时间、页面首屏时间、操作时间。
网络层
重要指标: 页面监控:首屏时间、总下载时间、DNS时间、建连时间、首包时间、可用性等 文件监控:平均下载速度、DNS时间、建连时间、首包时间 Ping监测:延迟、丢包 事务:总下载时间、可用性、总下载字节数。
应用层
重要指标: 追踪:响应时间、执行时间、独占时间、投影时间、数据库响应时间 服务组件-数据库:吞吐率、响应时间、调用次数、异常次数、追踪次数 连接池:最大连接数、初始连接数、最小连接数、最大连接数、连接数使用率、连接数空闲率、平均连接时间 实例:吞吐率、响应时间、错误率、堆内存使用、非堆内存使用、GC time、GC count、线程数 应用:吞吐率、响应时间、错误率、错误数。
基础组件层
重要指标: 数据库:QPS、TPS、连接数、打开文件数、表容量、表行数、主从延迟、主从同步状态、SGA、PGA、表空间等 进程:CPU使用率、内存使用量、磁盘吞吐、网络吞吐,打开文件数、进程数等 容器:CPU使用率、内存使用量、磁盘吞吐、网络吞吐 主机:CPU使用率、内存使用率、磁盘分区使用率、磁盘读写吞吐量、磁盘读写IOPS、磁盘读写延迟、磁盘IOutil、网络吞吐率,网络错误等 网络或安全设备:CPU、内存、风扇、温度、电源等。
六、业务分析

七、智能告警
相关文章:
JAVA开发运维(云基础设备监控)
在大型的商用系统中,经常需要监控云设备的健康状态,性能情况,流量数据等。及时发现系统问题,及时修复,以确保系统的高可用。检查云资源的工作内容主要包括基础监控、主动拨测、用户体验、APM监控、指标体系、业务分析、…...
现在备考2023年5月软考网络工程师时间够吗?
距离2023年5月软考还有1个多月的时间,备考网络工程师的时间是够的,以下是一些备考方法: 1.了解考试内容 在你开始学习考试之前,了解考试的形式和内容是很重要的。这将帮助你把注意力集中在最有可能被测试的领域。你应该复习考试…...
webp怎么转换成png,4个方法教你快速处理
webp怎么转换成png?目前在一些比较大的图片素材网站下载的图片都是webp格式的。我们都知道webp格式图片,它在正常的图片浏览器中是无法打开的。 所以说我们要把webp图片转变成png格式,正常来说我们常用的图片处理软件也能进行格式转换&#x…...
程序员能干多久?程序员能干到多大年龄?
程序员可以工作多少年?大多数程序员认为程序员是吃青春饭的工作。编程只能干到30岁,最长可达35岁。我经常听到这样的话,都让人倍感压力。今天,我们来谈谈这个老话题...... 程序员能干多久? 根据国外的经验来说,干到…...
采购系统是如何管理供应商的?
随着数字化的推进,企业面临着越来越多的供应商管理问题。企业采购数字化转型已经成为大势所趋,对于采购数字化转型而言,供应商管理是重要一环。 供应商准入管理 在供应商准入阶段,企业需要从供应商资质、财务能力、信誉能力、管理…...
Linux学习笔记(2)--一些内核接口
1)dump_stack dump_stack()是Linux内核中的一个函数,用于在内核中输出当前的函数调用栈。该函数会输出当前线程(或进程)的函数调用栈信息,以及相应的调用地址和虚拟内存地址等信息,一般用于诊断程序运行时…...
学习风`宇博客用户权限菜单模块
文章目录 用户-角色-菜单-资源 各表关系图菜单 和 路由菜单表及分析分析 /api/admin/user/menus接口MenuServiceImpl#listUserMenus接口返回示例及分析 前端代码分析menu.jsSideBar.vue 接口权限控制资源表 及 分析分析 WebSecurityConfig权限控制整体流程先说登录UserDetailsS…...
centos7.6部署ELK集群(一)之elasticsearch7.7.0集群部署
32.3. 部署es7.7.0 32.3.1. 下载es(各节点都做) wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.7.0-linux-x86_64.tar.gz 32.3.2. 解压至安装目录(各节点都做) tar -xvf elasticsearch-7.7.0-li…...
leetcode142. 环形链表 II
给定一个链表的头节点 head ,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,评测系统内部使用整数…...
Linux: network: dummy 类型网络接口
文章目录 参考创建一个重要的用途是在container平台的应用dpdk相关的一个用途另一个用途ChatGPT的回复参考 https://tldp.org/LDP/nag/node72.html 这里举了一个例子,说为什么需要dummy类型的接口:就是一个类local loopback的一个接口,当应用需要给另一个本地的应用发送包的…...
java记录-lambda表达式、接口应用、方法引用
基本形式 (str)->{System.out.println(str) };调用作为参数的接口实例的方法 1、用一个类实现接口,然后使用该类实例调用方法 2、匿名内部类 3、在 接口(不能是抽象类) 有且只有一个抽象方法时,可以使用lamda表达式来重写这个…...
AI写作机器人-ai文章生成器在线
使用AI续写生成器,让内容创作事半功倍! 随着人工智能技术的不断进步和应用,AI续写生成器的出现为内容创作带来了全新的革命。这种技术可以让你的写作事半功倍,让你轻松生成高质量的文章和内容。在这篇文章中,我们将介绍…...
HarmonyOS原子化服务卡片整改、下架、升级失败部分原因及处理办法
随着HarmonyOS应用体系相关规则、团队的不断发展和完善,早期上架运营的HarmonyOS原子化服务卡片,很多都收到了整改、下架的通知,主要集中在用户协议、隐私声明、服务卡片的设计规范性等细节方面的问题;需要进行优化调整升级才行。…...
博客系统测试报告【可上线】
目录 1、测试概述 1.1、项目名称 1.2、测试时间 1.3、编写目的 1.4、测试范围 2、测试计划 2.1、测试用例 2.1.1、注册/登录模块 2.1.2、个人中心模块 2.1.3、找回密码模块 2.1.4、博客主列表模块 2.1.5、个人博客列表模块 2.1.6、个人草稿列表模块 2.1.7、博客详…...
shell中的for循环和if判断
一.编写脚本for1.sh,使用for循环创建20账户,账户名前缀由用户从键盘输入,账户初始密码由用户输入,例如: test1、test2、test3、.....、 test10 1.创建脚本for1.sh [rootserver ~]# vim for1.sh 2.编写脚本for1.sh 3.执行脚本for1.sh [roo…...
【Unity入门】16.脚本引用组件
【Unity入门】脚本引用组件 大家好,我是Lampard~~ 欢迎来到Unity入门系列博客,所学知识来自B站阿发老师~感谢 (一)脚本引用普通组件 (1)点击控制音频播放 还记得我们的车载音乐AudioSource吗?…...
无线蓝牙耳机哪款音质好?目前音质最好的无线蓝牙耳机推荐
现如今,蓝牙耳机已经是一个非常实用且常见的数码产品了,不少人喜欢戴着蓝牙耳机听歌,玩游戏。一款音质好的蓝牙耳机不止能听个响,还能给人极致的听觉享受。在此,我来给大家分享几款目前音质最好的无线蓝牙耳机…...
【云原生进阶之容器】第六章容器网络6.6.1--Cilium网络方案概述
《云原生进阶之容器》专题索引: 第一章Docker核心技术1.1节——Docker综述第一章Docker核心技术1.2节——Linux容器LXC第一章Docker核心技术1.3节——命名空间Namespace第一章Docker核心技术1.4节——chroot技术第一章Docker核心技术1.5.1节——cgroup综述...
集中式版本控制工具 —— SVN
一、简介 1️⃣ SVN 是什么? 代码版本管理工具他能记住每次的修改查看所有的修改记录恢复到任何历史版本恢复已经删除的文件 2️⃣ SVN 与 Git 相比有什么优势? 使用简单、上手快目录级权限控制,企业安全必备子目录 Checkout,…...
【Dom获取属性操作】JavaScript 全栈体系(十)
Web APIs 第四章 操作元素属性 一、操作元素常用属性 还可以通过 JS 设置/修改标签元素属性,比如通过 src更换 图片最常见的属性比如: href、title、src 等语法: 对象.属性 值 <!DOCTYPE html> <html lang"en">&…...
大数据学习栈记——Neo4j的安装与使用
本文介绍图数据库Neofj的安装与使用,操作系统:Ubuntu24.04,Neofj版本:2025.04.0。 Apt安装 Neofj可以进行官网安装:Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法 最新版…...
css的定位(position)详解:相对定位 绝对定位 固定定位
在 CSS 中,元素的定位通过 position 属性控制,共有 5 种定位模式:static(静态定位)、relative(相对定位)、absolute(绝对定位)、fixed(固定定位)和…...
C++ 求圆面积的程序(Program to find area of a circle)
给定半径r,求圆的面积。圆的面积应精确到小数点后5位。 例子: 输入:r 5 输出:78.53982 解释:由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982,因为我们只保留小数点后 5 位数字。 输…...
Rapidio门铃消息FIFO溢出机制
关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...
基于Java+MySQL实现(GUI)客户管理系统
客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息,对客户进行统一管理,可以把所有客户信息录入系统,进行维护和统计功能。可通过文件的方式保存相关录入数据,对…...
LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》
这段 Python 代码是一个完整的 知识库数据库操作模块,用于对本地知识库系统中的知识库进行增删改查(CRUD)操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述 该模块…...
【Linux】Linux安装并配置RabbitMQ
目录 1. 安装 Erlang 2. 安装 RabbitMQ 2.1.添加 RabbitMQ 仓库 2.2.安装 RabbitMQ 3.配置 3.1.启动和管理服务 4. 访问管理界面 5.安装问题 6.修改密码 7.修改端口 7.1.找到文件 7.2.修改文件 1. 安装 Erlang 由于 RabbitMQ 是用 Erlang 编写的,需要先安…...
绕过 Xcode?使用 Appuploader和主流工具实现 iOS 上架自动化
iOS 应用的发布流程一直是开发链路中最“苹果味”的环节:强依赖 Xcode、必须使用 macOS、各种证书和描述文件配置……对很多跨平台开发者来说,这一套流程并不友好。 特别是当你的项目主要在 Windows 或 Linux 下开发(例如 Flutter、React Na…...
客户案例 | 短视频点播企业海外视频加速与成本优化:MediaPackage+Cloudfront 技术重构实践
01技术背景与业务挑战 某短视频点播企业深耕国内用户市场,但其后台应用系统部署于东南亚印尼 IDC 机房。 随着业务规模扩大,传统架构已较难满足当前企业发展的需求,企业面临着三重挑战: ① 业务:国内用户访问海外服…...
链式法则中 复合函数的推导路径 多变量“信息传递路径”
非常好,我们将之前关于偏导数链式法则中不能“约掉”偏导符号的问题,统一使用 二重复合函数: z f ( u ( x , y ) , v ( x , y ) ) \boxed{z f(u(x,y),\ v(x,y))} zf(u(x,y), v(x,y)) 来全面说明。我们会展示其全微分形式(偏导…...
