当前位置: 首页 > news >正文

JAVA开发运维(云基础设备监控)

在大型的商用系统中,经常需要监控云设备的健康状态,性能情况,流量数据等。及时发现系统问题,及时修复,以确保系统的高可用。检查云资源的工作内容主要包括基础监控、主动拨测、用户体验、APM监控、指标体系、业务分析、智能警告 等。

一、基础监控

主机监控 提供操作系统的CPU、内存、磁盘、文件系统、网络的监控;同时提供进程级的监控;支持容器和进程的纵向调用,支持进程和组件的关联分析。

组件监控 支持Nginx、Apache、Redis、RabbitMQ、ActiveMQ、Zookeeper、Kafka、MySQL、Oracle、PostgreSQL、SQLServer、MongoDB、Elasticsearch等组件的指标监控,同时关联进程、主机、容器、APM提供纵向关联分析。

容器监控 支持Docker、Kubernetes的监控,自动发现容器进程,监控容器的CPU、内存、磁盘、网络;自动发现容器下运行的关键进程并与之关联,快速查看进程和容器的调用关系。

内网监控 从外部对应用或主机提供服务监控,支持ICMP监控、TCP监控、HTTP(s)监控。帮助用户监测局域网内网络的联通性和延迟。

二、主动拨测

拨测从用户视角,依托全球高质量布点网络,模拟用户的访问路径与习惯,能够让企业了解自身用户,无论何时何地,使用何种设备,能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。

移动应用拨测是基于自研自动化测试引擎和独一无二部署技术,模拟用户操作将核心业务流程脚本化并持续运行在生产环境中,实时采集业务性能数据,自动进行汇总分析的全方位自动化平台。能够让企业了解自身业务在用户视角下的实际情况:何时何地、使用何种设备、能否顺畅进行访问,实时掌握用户体验,确保企业的数字化业务平稳运营。

三、用户体验

采用SDK方式实现对App的崩溃、卡顿、超时等性能问题进行采集,并能对真实用户体验进行量化,实现版本迭代过程中的用户体验优化。

提供Web前端性能的监控与分析,量化前端用户体验指标,采集网页JS错误及网络请求错误,快速定位Web前端的性能问题,辅助进行Web前端性能优化。

提供对微信小程序、支付宝小程序的性能监控能力,并能够对小程序接口及小程序访问路径进行追踪,帮助开发人员有效进行小程序性能优化。 

 

四、APM监控

全栈拓扑

自动发现业务系统之间、应用与业务系统之间、应用与服务组件之间的关联关系。通过拓扑可快速梳理业务调用逻辑,快速发现与定位问题。

业务接口分析

对业务系统中完成某一业务操作的动作事件进行相关事务级别的监控与分析,这也是应用性能管理的最小监控单元,帮助用户细粒度定位问题。

代码级别定位

针对某事务实例,对其进行代码级别的堆栈分析,精确定位到某一行业务逻辑代码,观察其因为什么报错或是由于什么原因导致执行缓慢,帮助研发和运维人员快速定位问题。

异常分析

统计当前系统内所有应用错误、代码异常、数据库错误类型等,对业务的影响分析,包括影响的用户数、影响的业务指标等,帮助研发、运维、业务人员分析系统性能影响范围。

故障主动预警

支持多维度、灵活的配置预警策略,提供7*24小时主动预警能力,主动运维,VIP用户保障,第一时间发现性能问题,降低异常时长,减少运维人力投入

五、指标体系

指标管理可以接入自有系列产品监控的指标,以及诸如Zabbix、Prometheus等多个数据源、多种协议的外部指标数据,贯穿业务到IT系统的全方位立体化可观测能力。 

 

重要指标:

业务层

通用指标:业务可用性、业务错误数、完成业务数、报错业务数、活跃用户数、错误影响用户数、业务流可用性、完成业务流、报错业务流、在途业务流、活跃用户数、错误影响用户数、平均执行周期、操作可用性、操作成功次数、操作失败次数、同比环比 自定义指标:交易金额、订单总数、top10商家销售排名、top10热销商品等。

用户层

重要指标: 可用性:崩溃、卡顿、请求错误、操作可用性 网络性能:响应时间、网络时间、 用户体验性能:应用启动时间、页面可交互时间、页面首屏时间、操作时间。

网络层

重要指标: 页面监控:首屏时间、总下载时间、DNS时间、建连时间、首包时间、可用性等 文件监控:平均下载速度、DNS时间、建连时间、首包时间 Ping监测:延迟、丢包 事务:总下载时间、可用性、总下载字节数。

应用层

重要指标: 追踪:响应时间、执行时间、独占时间、投影时间、数据库响应时间 服务组件-数据库:吞吐率、响应时间、调用次数、异常次数、追踪次数 连接池:最大连接数、初始连接数、最小连接数、最大连接数、连接数使用率、连接数空闲率、平均连接时间 实例:吞吐率、响应时间、错误率、堆内存使用、非堆内存使用、GC time、GC count、线程数 应用:吞吐率、响应时间、错误率、错误数。

基础组件层

重要指标: 数据库:QPS、TPS、连接数、打开文件数、表容量、表行数、主从延迟、主从同步状态、SGA、PGA、表空间等 进程:CPU使用率、内存使用量、磁盘吞吐、网络吞吐,打开文件数、进程数等 容器:CPU使用率、内存使用量、磁盘吞吐、网络吞吐 主机:CPU使用率、内存使用率、磁盘分区使用率、磁盘读写吞吐量、磁盘读写IOPS、磁盘读写延迟、磁盘IOutil、网络吞吐率,网络错误等 网络或安全设备:CPU、内存、风扇、温度、电源等。

六、业务分析

 

七、智能告警

 

 

相关文章:

JAVA开发运维(云基础设备监控)

在大型的商用系统中,经常需要监控云设备的健康状态,性能情况,流量数据等。及时发现系统问题,及时修复,以确保系统的高可用。检查云资源的工作内容主要包括基础监控、主动拨测、用户体验、APM监控、指标体系、业务分析、…...

现在备考2023年5月软考网络工程师时间够吗?

距离2023年5月软考还有1个多月的时间,备考网络工程师的时间是够的,以下是一些备考方法: 1.了解考试内容 在你开始学习考试之前,了解考试的形式和内容是很重要的。这将帮助你把注意力集中在最有可能被测试的领域。你应该复习考试…...

webp怎么转换成png,4个方法教你快速处理

webp怎么转换成png?目前在一些比较大的图片素材网站下载的图片都是webp格式的。我们都知道webp格式图片,它在正常的图片浏览器中是无法打开的。 所以说我们要把webp图片转变成png格式,正常来说我们常用的图片处理软件也能进行格式转换&#x…...

程序员能干多久?程序员能干到多大年龄?

程序员可以工作多少年?大多数程序员认为程序员是吃青春饭的工作。编程只能干到30岁,最长可达35岁。我经常听到这样的话,都让人倍感压力。今天,我们来谈谈这个老话题...... 程序员能干多久? 根据国外的经验来说,干到…...

采购系统是如何管理供应商的?

随着数字化的推进,企业面临着越来越多的供应商管理问题。企业采购数字化转型已经成为大势所趋,对于采购数字化转型而言,供应商管理是重要一环。 供应商准入管理 在供应商准入阶段,企业需要从供应商资质、财务能力、信誉能力、管理…...

Linux学习笔记(2)--一些内核接口

1)dump_stack dump_stack()是Linux内核中的一个函数,用于在内核中输出当前的函数调用栈。该函数会输出当前线程(或进程)的函数调用栈信息,以及相应的调用地址和虚拟内存地址等信息,一般用于诊断程序运行时…...

学习风`宇博客用户权限菜单模块

文章目录 用户-角色-菜单-资源 各表关系图菜单 和 路由菜单表及分析分析 /api/admin/user/menus接口MenuServiceImpl#listUserMenus接口返回示例及分析 前端代码分析menu.jsSideBar.vue 接口权限控制资源表 及 分析分析 WebSecurityConfig权限控制整体流程先说登录UserDetailsS…...

centos7.6部署ELK集群(一)之elasticsearch7.7.0集群部署

32.3. 部署es7.7.0 32.3.1. 下载es(各节点都做) wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.7.0-linux-x86_64.tar.gz 32.3.2. 解压至安装目录(各节点都做) tar -xvf elasticsearch-7.7.0-li…...

leetcode142. 环形链表 II

给定一个链表的头节点 head ,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,评测系统内部使用整数…...

Linux: network: dummy 类型网络接口

文章目录 参考创建一个重要的用途是在container平台的应用dpdk相关的一个用途另一个用途ChatGPT的回复参考 https://tldp.org/LDP/nag/node72.html 这里举了一个例子,说为什么需要dummy类型的接口:就是一个类local loopback的一个接口,当应用需要给另一个本地的应用发送包的…...

java记录-lambda表达式、接口应用、方法引用

基本形式 (str)->{System.out.println(str) };调用作为参数的接口实例的方法 1、用一个类实现接口,然后使用该类实例调用方法 2、匿名内部类 3、在 接口(不能是抽象类) 有且只有一个抽象方法时,可以使用lamda表达式来重写这个…...

AI写作机器人-ai文章生成器在线

使用AI续写生成器,让内容创作事半功倍! 随着人工智能技术的不断进步和应用,AI续写生成器的出现为内容创作带来了全新的革命。这种技术可以让你的写作事半功倍,让你轻松生成高质量的文章和内容。在这篇文章中,我们将介绍…...

HarmonyOS原子化服务卡片整改、下架、升级失败部分原因及处理办法

随着HarmonyOS应用体系相关规则、团队的不断发展和完善,早期上架运营的HarmonyOS原子化服务卡片,很多都收到了整改、下架的通知,主要集中在用户协议、隐私声明、服务卡片的设计规范性等细节方面的问题;需要进行优化调整升级才行。…...

博客系统测试报告【可上线】

目录 1、测试概述 1.1、项目名称 1.2、测试时间 1.3、编写目的 1.4、测试范围 2、测试计划 2.1、测试用例 2.1.1、注册/登录模块 2.1.2、个人中心模块 2.1.3、找回密码模块 2.1.4、博客主列表模块 2.1.5、个人博客列表模块 2.1.6、个人草稿列表模块 2.1.7、博客详…...

shell中的for循环和if判断

一.编写脚本for1.sh,使用for循环创建20账户,账户名前缀由用户从键盘输入,账户初始密码由用户输入,例如: test1、test2、test3、.....、 test10 1.创建脚本for1.sh [rootserver ~]# vim for1.sh 2.编写脚本for1.sh 3.执行脚本for1.sh [roo…...

【Unity入门】16.脚本引用组件

【Unity入门】脚本引用组件 大家好,我是Lampard~~ 欢迎来到Unity入门系列博客,所学知识来自B站阿发老师~感谢 (一)脚本引用普通组件 (1)点击控制音频播放 还记得我们的车载音乐AudioSource吗?…...

无线蓝牙耳机哪款音质好?目前音质最好的无线蓝牙耳机推荐

现如今,蓝牙耳机已经是一个非常实用且常见的数码产品了,不少人喜欢戴着蓝牙耳机听歌,玩游戏。一款音质好的蓝牙耳机不止能听个响,还能给人极致的听觉享受。在此,我来给大家分享几款目前音质最好的无线蓝牙耳机&#xf…...

【云原生进阶之容器】第六章容器网络6.6.1--Cilium网络方案概述

《云原生进阶之容器》专题索引: 第一章Docker核心技术1.1节——Docker综述第一章Docker核心技术1.2节——Linux容器LXC第一章Docker核心技术1.3节——命名空间Namespace第一章Docker核心技术1.4节——chroot技术第一章Docker核心技术1.5.1节——cgroup综述...

集中式版本控制工具 —— SVN

一、简介 1️⃣ SVN 是什么? 代码版本管理工具他能记住每次的修改查看所有的修改记录恢复到任何历史版本恢复已经删除的文件 2️⃣ SVN 与 Git 相比有什么优势? 使用简单、上手快目录级权限控制,企业安全必备子目录 Checkout,…...

【Dom获取属性操作】JavaScript 全栈体系(十)

Web APIs 第四章 操作元素属性 一、操作元素常用属性 还可以通过 JS 设置/修改标签元素属性&#xff0c;比如通过 src更换 图片最常见的属性比如&#xff1a; href、title、src 等语法&#xff1a; 对象.属性 值 <!DOCTYPE html> <html lang"en">&…...

gwadd:轻量级Git仓库组管理工具,提升多项目开发效率

1. 项目概述&#xff1a;一个被低估的Git仓库管理利器如果你和我一样&#xff0c;日常工作中需要频繁地在多个Git仓库之间穿梭&#xff0c;处理各种依赖、子模块&#xff0c;或者仅仅是同步一堆相关的项目代码&#xff0c;那么你一定对那种重复、繁琐的切换和操作感到头疼。今天…...

AI智能体操作安卓设备:基于agent-droid-bridge的自动化实践

1. 项目概述&#xff1a;连接AI与安卓设备的桥梁 最近在折腾AI智能体&#xff08;Agent&#xff09;和自动化流程时&#xff0c;遇到了一个挺有意思的需求&#xff1a;如何让运行在服务器上的AI程序&#xff0c;直接去操作一台真实的安卓手机或模拟器&#xff0c;完成一些复杂的…...

Windows Terminal 预览版:从安装到深度配置,打造现代化命令行工作流

1. 项目概述&#xff1a;为什么我们需要一个现代化的Windows终端&#xff1f;如果你和我一样&#xff0c;在Windows上敲了十几年命令行&#xff0c;从古老的cmd.exe到后来的PowerShell&#xff0c;一个绕不开的痛点就是&#xff1a;这终端工具&#xff0c;用起来总感觉差点意思…...

基于二维码的文件分片传输:原理、实现与安全应用

1. 项目概述&#xff1a;一个基于二维码的智能文件分发系统 最近在折腾一个挺有意思的小项目&#xff0c;源于一个很实际的需求&#xff1a;如何在不同的设备之间&#xff0c;安全、便捷地传输一些敏感或临时的文件&#xff0c;而不依赖任何第三方云存储或即时通讯工具。你可能…...

嵌入式开发革命:LuatOS云编译实战指南与效率提升

1. 项目概述&#xff1a;为什么我们需要云编译&#xff1f;作为一名在嵌入式领域摸爬滚打了十多年的老鸟&#xff0c;我太懂那种“买板一时爽&#xff0c;环境火葬场”的痛了。尤其是这几年&#xff0c;合宙、乐鑫、兆易这些厂商的产品线越来越丰富&#xff0c;Air780E、ESP32-…...

多脉冲重复频率解速度模糊:原理、仿真与MATLAB实现

1. 脉冲雷达的速度模糊问题 雷达测速的基本原理大家都懂&#xff0c;就是通过多普勒效应计算目标速度。但实际操作中会遇到一个头疼的问题——速度模糊。这就像用卷尺量身高&#xff0c;如果身高超过卷尺长度&#xff0c;就得把几段卷尺接起来量&#xff0c;但接缝处容易出错。…...

CANoe VN1640A的隐藏技能:CH5 I/O口实战应用,从采集电压到模拟传感器信号

CANoe VN1640A的CH5 I/O接口深度实战&#xff1a;从电压采集到传感器信号模拟 1. 揭开CH5接口的神秘面纱 在汽车电子测试领域&#xff0c;Vector的VN1640A接口模块以其稳定性和多功能性著称。大多数工程师熟悉其CAN/LIN通道的使用&#xff0c;却常常忽略了一个隐藏的宝藏——…...

SHA-3:从海绵构造到KECCAK-p,深入解析新一代哈希函数核心

1. 为什么我们需要SHA-3&#xff1f; 记得我第一次接触哈希函数时&#xff0c;用的还是SHA-1。那时候做文件校验&#xff0c;用SHA-1生成个摘要&#xff0c;感觉既方便又安全。直到后来看到新闻说SHA-1被破解了&#xff0c;我才意识到密码学世界的变化有多快。这就是SHA-3诞生的…...

别再傻傻做27次实验了!用SPSSAU三分钟搞定正交试验设计(附保姆级极差分析教程)

正交试验设计实战指南&#xff1a;从理论到SPSSAU高效操作 在科研与工程实践中&#xff0c;我们常常面临多因素多水平实验设计的挑战。传统全面试验方法虽然理论严谨&#xff0c;但当因素和水平数量增加时&#xff0c;实验次数呈指数级增长&#xff0c;导致资源浪费和时间成本飙…...

3个核心优势:Open-Meteo如何用开源技术重构天气API的经济学模型

3个核心优势&#xff1a;Open-Meteo如何用开源技术重构天气API的经济学模型 【免费下载链接】open-meteo Free Weather Forecast API for non-commercial use 项目地址: https://gitcode.com/GitHub_Trending/op/open-meteo 在传统天气数据服务领域&#xff0c;开发者往…...