当前位置: 首页 > article >正文

别再只会用df -h了!CentOS 7/8硬盘监控,这8个命令让你成为运维老手

从基础到实战CentOS硬盘监控的8个高阶命令组合技当服务器磁盘空间告警邮件突然弹出时大多数运维工程师的第一反应是执行df -h查看磁盘使用率。但真正的问题往往隐藏在表象之下——可能是某个失控的日志文件正在吞噬空间或是磁盘I/O性能骤降导致服务延迟甚至是一块即将物理损坏的硬盘在发出最后的求救信号。本文将带你超越基础命令的简单罗列通过8个关键命令的组合应用构建一套完整的硬盘健康监控与故障排查工作流。1. 从空间告警到问题定位三层排查法收到磁盘空间不足告警时新手往往直接删除文件腾出空间而资深运维会遵循空间分布定位→大文件追踪→进程关联分析的排查逻辑。1.1 第一层宏观空间分布分析df -h确实是查看磁盘使用率的起点但加入-T参数可以额外显示文件系统类型这对排查特定类型的存储问题至关重要df -hT典型输出示例Filesystem Type Size Used Avail Use% Mounted on /dev/nvme0n1p2 xfs 50G 45G 5.5G 90% / /dev/sdb1 ext4 2.0T 1.8T 200G 90% /data关键观察点**Use%超过90%**的挂载点需要立即关注xfs/ext4类型差异可能导致后续处理方式不同Avail绝对值比Use%更重要5.5G可能不够日志滚动1.2 第二层微观目录空间钻取使用du命令时结合--max-depth和sort可以快速定位空间消耗热点du -h --max-depth1 / | sort -h进阶技巧添加--time显示最后修改时间找出近期暴增的目录使用ncdu工具需安装进行交互式分析1.3 第三层文件与进程关联分析通过lsof找出正在占用已删除文件空间的进程lsof L1 | grep deleted处理方案示例# 找到占用进程后选择处理方式 kill -9 [PID] # 强制终止进程 systemctl restart [service] # 优雅重启服务 /var/log/[file].log # 清空日志文件2. 磁盘I/O性能瓶颈诊断实战当服务响应变慢而CPU、内存指标正常时磁盘I/O往往成为瓶颈。以下是系统化的诊断方法2.1 实时I/O负载观测iostat的-x参数提供丰富的细节指标iostat -dx 1 5关键指标解读指标健康阈值异常表现可能原因%util60%持续80%存储设备过载await10ms50ms设备响应慢或队列饱和svctm5ms大幅高于正常值物理磁盘性能下降w_await/r_await-读写差异显著读写负载不均衡2.2 进程级I/O监控iotop需安装可实时显示进程的I/O开销iotop -o -P -b -n 5典型应用场景识别异常的高IOPS进程确认备份任务是否影响生产负载发现日志打印过于频繁的应用2.3 文件系统缓存分析free -m观察内存使用情况时特别关注buff/cachewatch -n 1 free -m; echo; df -h缓存策略优化建议对写入敏感的服务调整vm.dirty_ratio(默认20%)对读取敏感的服务增加vfs_cache_pressure(默认100)3. 硬盘健康预测与故障预防机械硬盘的平均无故障时间(MTTF)约50万小时但实际寿命受工作环境影响巨大。通过SMART监控可以提前预警。3.1 SMART基础检测安装smartmontools后检查基本健康状态smartctl -H /dev/sda健康状态输出解读PASSED检测通过FAILED已检测到故障UNKNOWN设备不支持该检测3.2 详细属性分析查看所有SMART属性及其阈值smartctl -A /dev/sda关键属性预警表ID属性名正常范围危险信号5Reallocated_Sector00表示有坏块被替换197Current_Pending00表示有待处理坏块198Offline_Uncorrectable00表示无法修复的坏块187Reported_Uncorrect00表示已报告的错误194Temperature_Celsius50℃持续高温加速老化3.3 长期趋势监控设置定期SMART自检并记录历史数据# 短期自检2分钟 smartctl -t short /dev/sda # 长期自检可能持续数小时 smartctl -t long /dev/sda # 查看日志 smartctl -l selftest /dev/sda建议将关键指标纳入监控系统如Zabbix、Prometheus设置以下告警规则Reallocated_Sector_Count周增长5Temperature持续55℃达30分钟Read_Error_Rate日增幅超过100%4. 高级运维场景命令组合4.1 磁盘替换预检流程当需要更换硬盘时完整的检查清单# 1. 确认设备路径 lsblk -o NAME,SIZE,MODEL,MOUNTPOINT # 2. 检查分区表 parted /dev/sda print # 3. 验证文件系统完整性 xfs_repair -n /dev/sda1 # XFS fsck -n /dev/sda1 # EXT4 # 4. 最后一次SMART全面检测 smartctl -t long /dev/sda4.2 性能基准测试在新磁盘投入使用前建议进行基准测试# 顺序读写测试1GB文件 dd if/dev/zero of./testfile bs1G count1 oflagdirect dd if./testfile of/dev/null bs1G iflagdirect # 随机IOPS测试使用fio工具 fio --namerandread --ioenginelibaio --rwrandread --bs4k \ --numjobs4 --size1G --runtime60 --time_based --group_reporting4.3 LVM环境特殊监控对于使用LVM的环境需要额外关注# 物理卷状态 pvs # 卷组剩余空间 vgs # 逻辑卷使用细节 lvs -o devices关键告警点物理卷的PE使用率超过90%卷组的free PE少于5%逻辑卷的snapshot空间超过70%

相关文章:

别再只会用df -h了!CentOS 7/8硬盘监控,这8个命令让你成为运维老手

从基础到实战:CentOS硬盘监控的8个高阶命令组合技 当服务器磁盘空间告警邮件突然弹出时,大多数运维工程师的第一反应是执行df -h查看磁盘使用率。但真正的问题往往隐藏在表象之下——可能是某个失控的日志文件正在吞噬空间,或是磁盘I/O性能骤…...

Java 中的 String、StringBuffer 与 StringBuilder:区别、联系与实战选型

String、StringBuffer、StringBuilder 是 Java 中处理字符串的核心类,三者都用于字符串操作,但在可变性、线程安全、性能上差异显著。本文从「核心特性→底层原理→性能对比→实战选型」全维度拆解,帮你精准掌握三者的使用场景。一、核心特性…...

万界星空奶油制造工厂MES系统完整解决方案

——覆盖原材料、全链路追溯、不合格品闭环、成本能效与智能合规的一体化乳品智造平台 一、行业背景与挑战奶油(稀奶油、黄油、无水奶油等)作为高敏感度乳制品,具有原料易变质、工艺复杂、保质期短(2–30天)、微生物风…...

Ubuntu 22.04上安装Isaac Gym避坑全记录:从Vulkan报错到Segmentation Fault解决

Ubuntu 22.04上安装Isaac Gym避坑全记录:从Vulkan报错到Segmentation Fault解决 Isaac Gym作为NVIDIA推出的物理仿真平台,在机器人强化学习领域展现出强大的性能优势。然而在Ubuntu 22.04系统上的安装过程却可能成为开发者的"噩梦"——从Vulka…...

2024最新版:Java集成微信支付APIV3保姆级教程(含完整代码)

2024年Java集成微信支付APIV3全流程实战指南 微信支付作为国内移动支付领域的核心基础设施,其APIV3版本在安全性、易用性和功能性上都实现了显著提升。本文将带您从零开始,全面掌握Java环境下微信支付APIV3的集成方法,包含最新技术要点和实战…...

OpenClaw极简部署:Qwen3.5-9B镜像10分钟快速体验指南

OpenClaw极简部署:Qwen3.5-9B镜像10分钟快速体验指南 1. 为什么选择云端快速体验? 作为长期关注AI自动化工具的技术从业者,我一直在寻找既能快速验证想法又无需复杂环境配置的方案。OpenClaw的本地部署虽然强大,但对于只是想初步…...

300W 24V转24V 隔离防水DC-DC电源在铁路轨道交通中的应用方案

随着铁路轨道交通、城市轨道列车和高铁系统的智能化发展,车载电子设备数量不断增加,对电源系统的稳定性、安全性、抗干扰能力和环境适应性提出了更高要求。列车控制管理系统(TCMS)、乘客信息系统(PIS)、车载…...

立知模型性能优化指南:GPU加速与批量处理技巧

立知模型性能优化指南:GPU加速与批量处理技巧 1. 这不是调参,是让模型真正跑起来 你刚部署好 lychee-rerank-mm,输入一张图加几句话,等了七八秒才出分——这感觉熟悉吗?别急着怀疑模型能力,问题大概率不在…...

Lingbot-Depth-Pretrain-Vit-VitL-14模型部署避坑指南:常见错误403 Forbidden等排查

Lingbot-Depth-Pretrain-Vit-VitL-14模型部署避坑指南:常见错误403 Forbidden等排查 最近在帮几个朋友部署Lingbot-Depth-Pretrain-VitL-14这个深度估计模型时,发现大家踩的坑都差不多。尤其是那个让人头疼的“403 Forbidden”错误,还有各种…...

微信更新后记录没了?试试这几个方法

引言:数据丢失的焦虑你是否经历过这样的场景:微信更新后,打开聊天记录发现重要的对话信息莫名其妙消失了?工作文件、珍贵回忆、重要信息...这些数据一旦丢失,可能会带来巨大的麻烦和焦虑。据统计,2025年手机…...

绕过DVWA文件上传限制的5种骚操作(含BurpSuite截断技巧)

DVWA文件上传漏洞的5种高阶绕过手法实战解析 在渗透测试的实战环境中,文件上传漏洞往往是最具破坏力的攻击入口之一。DVWA(Damn Vulnerable Web Application)作为经典的漏洞演练平台,其文件上传模块设置了从低到高的安全级别&…...

AudioLDM-S小白教程:从部署到生成,完整流程打造你的第一个AI音效

AudioLDM-S小白教程:从部署到生成,完整流程打造你的第一个AI音效 1. 引言:AI音效生成新体验 你是否遇到过这样的场景:制作短视频时找不到合适的背景音效,游戏开发时需要大量环境声效资源,或者想为播客添加…...

AI浪潮下,HTML开发者该筑牢哪些核心知识壁垒?

一、前言:AI不是替代者,而是「放大镜」 随着ChatGPT、Copilot、Cursor等AI工具的普及,很多HTML开发者产生了焦虑:「AI能一键生成HTML代码,我们还需要深耕基础吗?」 答案是肯定的。AI确实能高效产出基础代码…...

Tao-8k处理时序数据实战:LSTM模型原理与融合应用

Tao-8k处理时序数据实战:LSTM模型原理与融合应用 最近在做一个销量预测的项目,团队里的小伙伴们一直在争论:到底是直接用传统的时序模型,还是试试现在流行的语言大模型?其实,这两者并不矛盾。传统的LSTM&a…...

Faiss GPU版安装避坑指南:解决CUBLAS_STATUS_SUCCESS报错(附CUDA版本选择)

Faiss GPU版实战指南:从CUDA版本匹配到性能调优全解析 遇到CUBLAS_STATUS_SUCCESS报错时,很多开发者第一反应是检查代码逻辑,但问题往往出在更基础的环节——环境配置。Faiss作为Meta开源的向量相似度搜索库,其GPU版本对CUDA环境有…...

SRIO的port_initialized和link_initialized

一、link说明 1.port_initialized port_initial信号已置高,表明物理层端口; 如果port_initial拉不高,就要检查时钟和复位信号了; 看看时钟频率是否是对的,复位是否满足复位时序。2.link_initialized link_initialized信号拉高&…...

ACSL-7210-06RE,双通道(双向)高速CMOS光耦合器

型号介绍今天我要向大家介绍的是 Broadcom 的耦合器——ACSL-7210-06RE。它的每个通道都包含一个 CMOS LED 驱动器和一个高速 LED,以及一个 CMOS 检测器。这种构造使得它的反应极其迅速,传播延迟时间最快可达 27 纳秒左右,最大不超过 40 纳秒…...

玩转含风光储并网的IEEE33节点配电系统Simulink模型

含风光储并网的IEEE33节点配电系统simulink模型,当风光容量较多时将呢能量储存,风光容量不足负载供电时储能放电,风光储能另配备简单的电流保护,在系统发生故障时可切除并网部分。在当今追求清洁能源的时代,含风光储并…...

凡是能被摄像机捕捉的,AI就能学会生成;凡是能被屏幕呈现的,就难以避免被复制

引言:一句话的重量 “凡是能被摄像机捕捉的,AI就能学会生成;凡是能被屏幕呈现的,就难以避免被复制。” 这句话初读像是一个关于技术能力的陈述,但细想之下,它触碰的远不止技术边界。它在说:人类…...

零基础玩转Qwen2.5-7B-Instruct:5分钟搞定vLLM离线推理与前端调用

零基础玩转Qwen2.5-7B-Instruct:5分钟搞定vLLM离线推理与前端调用 1. 快速了解Qwen2.5-7B-Instruct Qwen2.5-7B-Instruct是通义千问团队最新推出的70亿参数指令微调语言模型。相比前代产品,它在多个方面有显著提升: 知识量大幅增加&#x…...

AI头像生成器与Stable Diffusion搭配使用:完整头像制作流程

AI头像生成器与Stable Diffusion搭配使用:完整头像制作流程 1. 为什么需要AI头像生成器? 在数字时代,头像已经成为我们在线身份的重要组成部分。无论是社交媒体、专业平台还是游戏社区,一张独特且能代表个人风格的头像都能让你在…...

拒绝手动对齐!用Clang-format在VSCode实现C++代码完美排版(附自定义宏处理方案)

拒绝手动对齐!用Clang-format在VSCode实现C代码完美排版(附自定义宏处理方案) 在C开发中,代码排版一直是个让人又爱又恨的话题。整洁的代码排版能显著提升可读性,但手动调整对齐却是个耗时耗力的苦差事。特别是当项目规…...

【数据结构与算法】LIS专项练习

LIS 专项练习题目编号说明【模板】最长上升子序列B3637纯LIS模板&#xff0c;n≤10⁵&#xff0c;用二分导弹拦截P1020LIS 贪心&#xff0c;经典题合唱队形P1091LIS LDS 组合友好城市P2782排序后转LIS1.#include<iostream> #include<vector> using namespace std…...

mPLUG-Owl3-2B与C++:高性能计算集成

mPLUG-Owl3-2B与C&#xff1a;高性能计算集成 1. 项目背景与价值 在当今AI应用快速发展的环境下&#xff0c;如何将强大的多模态模型高效集成到现有系统中&#xff0c;成为了很多开发者面临的实际问题。mPLUG-Owl3-2B作为一个支持图文对话的先进模型&#xff0c;在多个场景下…...

穿越机 vs 航拍机:陀螺仪低通滤波参数α到底怎么选?一份基于场景的调参指南

穿越机与航拍机的陀螺仪滤波调参实战&#xff1a;从噪声抑制到飞行风格适配 当你在Betaflight调参界面第一次看到"陀螺仪低通滤波系数α"这个参数时&#xff0c;是否感到困惑&#xff1f;这个看似简单的数值背后&#xff0c;隐藏着飞行器控制的核心矛盾——噪声抑制与…...

PyTorch实战:用PINN求解一维Poisson方程(附完整代码)

PyTorch实战&#xff1a;用PINN求解一维Poisson方程&#xff08;附完整代码&#xff09; 在科学计算领域&#xff0c;微分方程求解一直是核心挑战之一。传统数值方法如有限差分法&#xff08;FDM&#xff09;和有限元法&#xff08;FEM&#xff09;虽然成熟&#xff0c;但面对复…...

OpenClaw+Qwen3-VL:30B:飞书智能客服自动化实战

OpenClawQwen3-VL:30B&#xff1a;飞书智能客服自动化实战 1. 为什么选择这个组合&#xff1f; 去年我在一个小型电商团队负责客服工作&#xff0c;每天要处理上百条用户咨询。最头疼的是遇到"图片文字"的混合问题——比如用户发来商品截图问"这个有没有现货&…...

基于深度学习的面部表情识别:从图片到视频的探索

基于深度学习的面部表情识别 含图片和视频的面部表情识别&#xff0c;含详细的代码运行说明文档。在当今数字化时代&#xff0c;面部表情识别作为人工智能领域的一个重要研究方向&#xff0c;具有广泛的应用前景&#xff0c;如人机交互、情感分析、安防监控等。今天&#xff0c…...

GEE不只是地图工具:用VSCode和Geemap玩转遥感数据可视化(Python实战)

GEE不只是地图工具&#xff1a;用VSCode和Geemap玩转遥感数据可视化&#xff08;Python实战&#xff09; 当大多数人提起Google Earth Engine&#xff08;GEE&#xff09;时&#xff0c;第一反应往往是一个在线地图工具。但如果你真正深入使用过这个平台&#xff0c;就会明白它…...

低配置linux服务器基础优化

以2核1.5G&#xff0c;60G系统盘40G数据盘为例。发现虚拟内存只有1Groothlvps:~# free -htotal used free shared buff/cache available Mem: 1.3Gi 298Mi 1.1Gi 3.5Mi 92Mi 1.0Gi Swap: 974Mi …...