快速点位排查问题的方法
一、核心思路:缩小问题范围
1. 分治法(Divide and Conquer)
- 原理:将复杂系统拆分为独立模块,逐层验证。
- 示例:
-
- 网络问题:检查客户端 → 本地网络 → 服务器 → 数据库。
- 代码问题:注释代码块 → 逐步启用,定位异常代码段。
2. 排除法(Elimination)
- 原理:通过禁用/替换组件,确认问题源。
- 示例:
-
- 服务器负载高:停用非核心服务,观察负载变化。
- 依赖冲突:移除可疑依赖库,验证功能恢复。
二、快速定位工具
1. 日志分析
关键命令:
# 实时追踪日志
tail -f /var/log/nginx/error.log# 按时间过滤(如最近5分钟)
grep "$(date -d '5 minutes ago' '+%Y-%m-%d %H:%M')" app.log# 按错误级别过滤
awk '/ERROR/ || /WARN/' system.log#按类名过滤和错误级别
awk '/ERROR/ || /FinFreightReceivableItemServiceImpl/' fin.log > fin20.log
2. 监控工具
- 系统级:
-
top/htop:实时进程资源占用。iotop:磁盘 I/O 监控。nethogs:网络流量追踪。
- 服务级:
-
- Prometheus + Grafana:指标可视化。
- APM 工具(如 SkyWalking、New Relic):代码级性能分析。
3. 网络诊断
连通性:
traceroute 8.8.8.8 # 路由追踪
mtr 8.8.8.8 # 持续网络质量监测
端口与服务:
netstat -tuln | grep 3306 # 检查端口监听状态
telnet mysql_server 3306 # 测试端口可达性
三、高频问题检查点
1. 资源瓶颈
- CPU:
us(用户进程)高 → 代码逻辑问题;sy(系统调用)高 → 内核或 I/O 瓶颈。 - 内存:
free -h观察available,警惕 OOM Killer 日志。 - 磁盘:
df -h检查容量,iostat -x 1看%util(使用率)和await(响应时间)。
2. 配置错误
- 常见陷阱:
-
- 防火墙规则(
iptables/firewalld)。 - 文件权限(
ls -l检查用户/组)。 - 配置文件格式(如 YAML 缩进、JSON 括号匹配)。
- 防火墙规则(
3. 依赖服务
- 检查链:
-
- 数据库连接池是否耗尽(
SHOW PROCESSLIST)。 - 缓存服务(Redis/Memcached)是否超时或内存不足。
- 第三方 API 的限流或认证失败(抓包工具
tcpdump/ Wireshark)。
- 数据库连接池是否耗尽(
四、高级技巧
1. 最小化复现
步骤:
- 剥离生产环境数据,构造测试用例。
- 在简化环境中复现问题(如 Docker 容器)。
# 快速启动一个干净的测试环境
docker run -it --rm alpine:latest sh
2. 时间轴比对
- 方法:
- 对比故障前后系统变更(如
git diff、rpm -qa --last)。 - 检查定时任务(
crontab -l)或日志轮转配置。
- 对比故障前后系统变更(如
3. 假设驱动法
- 流程:
- 列出所有可能原因(如磁盘满、内存泄漏、代码 Bug)。
- 按概率排序,逐一验证或反证。
五、自动化辅助
1. 脚本化检查
# 快速检查系统健康状态
check_health() {echo "CPU Load: $(uptime)"echo "Memory: $(free -h | awk '/Mem/{print $4}') free"echo "Disk: $(df -h / | awk 'NR==2{print $5}') used"
}
check_health
2. 故障注入(Chaos Engineering)
- 工具:Chaos Monkey、kube-monkey。
- 场景:模拟网络延迟、服务宕机,验证系统容错能力。
六、经典问题速查表
| 现象 | 优先检查点 |
| 服务无响应 | 端口监听、进程存活、防火墙 |
| 请求超时 | 网络延迟、DNS、后端依赖服务 |
| 磁盘空间不足 | 日志文件、临时文件、Core Dump |
| 内存泄漏 |
JVM Heap |
| 性能骤降 | 慢查询、锁竞争、GC 停顿 |
通过以上方法,可在 5~15 分钟内定位 80% 的常见问题,剩余复杂问题再结合日志和工具深入分析。
相关文章:
快速点位排查问题的方法
一、核心思路:缩小问题范围 1. 分治法(Divide and Conquer) 原理:将复杂系统拆分为独立模块,逐层验证。示例: 网络问题:检查客户端 → 本地网络 → 服务器 → 数据库。代码问题:注…...
【前端】Vue组件库之Element: 一个现代化的 UI 组件库
文章目录 前言一、官网1、官网主页2、设计原则3、导航4、组件 二、核心功能:开箱即用的组件生态1、丰富的组件体系2、特色功能亮点 三、快速上手:三步开启组件化开发1、安装(使用Vue 3)2、全局引入3、按需导入(推荐&am…...
一文搞懂Android应用元素查看器(Appium+Appium-inspector)——定位微信布局元素
Appium和Appium Inspector是怎么协作的呢?Appium 与 Appium Inspector 的版本匹配Appium安装启动appium服务安装Appium inspector客户端查看安卓真机指定app布局元素(这里以微信为例,需要保持与模拟器或真机一直连接)【QA】解决顶部工具栏上Refresh Source & Screensho…...
matlab质子磁力仪传感器线圈参数绘图
1、内容简介 matlab134-质子磁力仪传感器线圈参数绘图 可以交流、咨询、答疑 2、内容说明 略 线圈是质子磁力仪传感器的核心,其品质直接影响着仪器的测量精度 。 结合反向串联圆柱体线圈模型,对约束设计 的因素进行分析; 建立约束参数与设计参数之间…...
WPF快速创建DeepSeek本地自己的客户端-基础思路版本
开发工具:VS 2015 开发环境:.Net 4.0 使用技术:WPF 本篇文章内容: 本地部署DeepSeek以后一般使用网页工具(如Chatbox)或者DOS窗口与其对话。本篇文章使用WPF创建一个基础版的对话工具。 一、搭建本地DeepS…...
FreeRTOS第12篇:系统的“绿色通道”——中断管理与临界区
文/指尖动听知识库-星愿 文章为付费内容,商业行为,禁止私自转载及抄袭,违者必究!!! 文章专栏:深入FreeRTOS内核:从原理到实战的嵌入式开发指南 引言:嵌入式系统的“紧急电话” 想象你正在主持一场重要会议:大部分时间按议程推进(任务执行),但偶尔会有紧急来电(硬…...
SpringBoot+Vue+数据可视化的动漫妆造服务平台(程序+论文+讲解+安装+调试+售后等)
感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,我会一一回复,希望帮助更多的人。 系统介绍 在当今数字化高速发展的时代,动漫产业迎来了前所未有的繁荣,动漫…...
CentOS 7超详细安装教程(含镜像)
1. 安装前准备 1.1 CentOS简介 CentOS(Community Enterprise Operating System,中文意思是:社区企业操作系统)是一种基于 Red Hat Enterprise Linux(RHEL)源代码构建的免费开源操作系统。它在稳定性、安全…...
一种棋牌网游的玩法
起因 俺是个记性不好的人,经常记不住牌,所以很少能赢。于是俺就写了个程序来记录出过的牌。 开始 因为是网游,所以就开始监听网络包。因为不需要改网络包,所以俺就选择了cap_ip。cap_ip是一个通过设置网卡混乱模式来监听网络包…...
9.综合调试|输入不能存在空格|desc存在None|输出权值和ID|函数重名|修改文件名|权值和实际关键词出现次数(C++)
输入不能存在空格 目前输入的关键词时每隔一空格内容分别进行搜索,大部分时候我们都是将一串包含空格的内容直接进行搜索,需要将代码改进。 将cin换为fgets #include "searcher.hpp" #include <iostream> #include <cstdio> #in…...
使用SHOW PROCESSLIST和SHOW ENGINE INNODB STATUS排查mysql锁等待问题
现象: mysql 查某表一直不能结束,查别的表没有问题。已知之前刚刚alter此表想把它的一个字段长度增长,但是这个操作一直没有结束。现在应该怎么办? 方案: 使用 SHOW PROCESSLIST; 查看当前所有活动的SQL线程,找出是否有长时间…...
ElasticSearch映射分词
目录 弃用Type why 映射 查询 mapping of index 创建 index with mapping 添加 field with mapping 数据迁移 1.新建 一个 index with correct mapping 2.数据迁移 reindex data into that index 分词 POST _analyze 自定义词库 ik分词器 circuit_breaking_excep…...
JVM——堆的回收:引用计数发和可达性分析法、五种对象引用
目录 引用计数法和可达性分析法 引用计数法: 可达性分析算法: 五种对象引用 软引用: 弱引用: 引用计数法和可达性分析法 引用计数法: 引用计数法会为每个对象维护一个引用计数器,当对象被引用时加1&…...
PosgreSQL比MySQL更优秀吗?
一日,一群开发者对PosgreSQL是不是比MySQL更优秀进行了激烈的辩论,双方吵的都要打起来了 正方有以下理由: PostgreSQL严格遵循SQL标准规范,相较MySQL在语法兼容性和功能完整性方面展现出更强的体系化设计,尤其在事务处…...
冒险岛079 V8 整合版源码搭建教程+IDEA启动
今天教大家来部署下一款超级怀旧游戏冒险岛,冒险岛源码是开源的,但是开源的代码会有各种,本人进行了加工整合,并且用idea进行了启动测试,经过修改后没有任何问题。 启动截图 后端控制台 前端游戏界面 声明 冒险岛源码…...
基于Python的Flask微博话题舆情分析可视化系统
2024数据 ✅️标价源码 远程部署加 20 ✅️爬虫可用 有六月数据 ✅️修复bug不会突然打不开网页 系统稳定 系统的功能如下: 1.数据的爬取 2.用户的登录注册 3.热词统计,舆情统计 4.文章统计分析 5.发布地址统计 6.评论统计 7.情感分类统计 编程语言:py…...
ms-swift3 序列分类训练
目录 引言 一、数据集准备 二、训练/推理代码 2.1 训练 2.2 推理 三、性能验证 引言 swift 3.x支持了序列分类Command Line Parameters — swift 3.2.0.dev0 documentation 想尝试一下用多模态(图像)的序列分类与普通的图像分类任务有啥区别 一、…...
VSCode 实用快捷键
前文 VSCode 作为文本编辑神器, 熟练使用其快捷键更是效率翻倍, 本文介绍 VSCode 常用的实用的快捷键 实用快捷键 涉及到文本操作, 搜索定位, 多光标, 面板打开等快捷键 功能快捷键复制光标当前行 (不需要鼠标选中) Ctrl C 剪切光标当前行 (不需要鼠标选中) Ctrl X 当前行下…...
MVC模式和MVVM模式
目录 一、MVC模式和MVVM模式 1. MVC模式 2. MVVM 模式 3.在Qt中的应用示例 4.总结 二、MVC与MVVM模式的共同点和区别 1.共同点 2.区别 3.交互流程 4.总结 MVC(Model-View-Controller)和MVVM(Model-View-ViewModel)是两种…...
CSS伪类选择器全解析:让你的样式更加灵活和智能
目录 前言 一、什么是伪类选择器? 二、常见的伪类选择器详解 1. :hover —— 悬停状态 2. :active —— 活动状态 3. :focus —— 焦点状态 综合案例 4. :first-child —— 第一个子元素 5. :last-child —— 最后一个子元素 6. :nth-child(n) —— 按顺序选…...
SpringBoot-17-MyBatis动态SQL标签之常用标签
文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...
大话软工笔记—需求分析概述
需求分析,就是要对需求调研收集到的资料信息逐个地进行拆分、研究,从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。 需求分析的作用非常重要,后续设计的依据主要来自于需求分析的成果,包括: 项目的目的…...
如何在看板中体现优先级变化
在看板中有效体现优先级变化的关键措施包括:采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中,设置任务排序规则尤其重要,因为它让看板视觉上直观地体…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...
uniapp微信小程序视频实时流+pc端预览方案
方案类型技术实现是否免费优点缺点适用场景延迟范围开发复杂度WebSocket图片帧定时拍照Base64传输✅ 完全免费无需服务器 纯前端实现高延迟高流量 帧率极低个人demo测试 超低频监控500ms-2s⭐⭐RTMP推流TRTC/即构SDK推流❌ 付费方案 (部分有免费额度&#x…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序
一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...
CMake控制VS2022项目文件分组
我们可以通过 CMake 控制源文件的组织结构,使它们在 VS 解决方案资源管理器中以“组”(Filter)的形式进行分类展示。 🎯 目标 通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总(共4种) 方法描述是否推荐…...
GitFlow 工作模式(详解)
今天再学项目的过程中遇到使用gitflow模式管理代码,因此进行学习并且发布关于gitflow的一些思考 Git与GitFlow模式 我们在写代码的时候通常会进行网上保存,无论是github还是gittee,都是一种基于git去保存代码的形式,这样保存代码…...
快刀集(1): 一刀斩断视频片头广告
一刀流:用一个简单脚本,秒杀视频片头广告,还你清爽观影体验。 1. 引子 作为一个爱生活、爱学习、爱收藏高清资源的老码农,平时写代码之余看看电影、补补片,是再正常不过的事。 电影嘛,要沉浸,…...
