当前位置: 首页 > article >正文

Linux系统排障必备:dmesg命令的7个实战技巧(附真实案例)

Linux系统排障利器dmesg命令的7个高阶应用场景凌晨三点服务器突然告警CPU负载飙升硬盘IO异常而系统日志却看不出明显问题。这种场景下大多数运维工程师的第一反应是打开终端输入那个熟悉又强大的命令——dmesg。作为Linux内核的黑匣子dmesg记录着从系统启动到运行过程中所有的内核级事件是排查硬件故障、驱动问题的第一手资料。不同于普通的系统日志工具dmesg直接访问内核环形缓冲区这意味着它能捕捉到那些还未写入系统日志的关键信息。对于需要快速定位生产环境问题的系统管理员来说掌握dmesg的高效用法往往能在关键时刻节省数小时的排查时间。本文将分享7个经过实战验证的dmesg技巧每个技巧都配有真实案例说明帮助你在复杂的运维场景中快速找到问题根源。1. 理解dmesg的核心机制dmesg命令的全称是display message它直接读取内核环形缓冲区中的消息。这个缓冲区大小有限通常为16KB-1MB采用循环写入的方式新消息会覆盖旧消息。理解这一点对有效使用dmesg至关重要——重要日志可能会被后续消息覆盖特别是在高负载系统中。内核消息的优先级分为多个等级从调试信息(debug)到紧急错误(emerg)。通过以下命令可以查看当前系统的日志级别设置cat /proc/sys/kernel/printk输出通常是四个数字例如4 4 1 7这四个数字分别代表当前控制台日志级别默认消息日志级别最低控制台日志级别默认控制台日志级别在大多数生产环境中我们会调整这些参数以捕获更多关键信息# 临时设置更详细的日志级别 echo 6 4 1 7 /proc/sys/kernel/printk关键点dmesg显示的是实时内存中的日志不会持久化到磁盘。要长期保存这些日志需要定期导出或配置系统日志服务(如rsyslog)来捕获它们。2. 实战技巧实时监控关键硬件事件在部署新硬件或排查硬件故障时实时监控dmesg输出能第一时间发现问题。以下是几种高效的实时监控方法2.1 彩色输出区分日志级别dmesg -L --levelerr,warn这个命令会以彩色显示错误(err)和警告(warn)级别的消息红色表示错误黄色表示警告让关键问题一目了然。真实案例某次服务器频繁死机通过彩色输出立即发现大量内存ECC错误红色高亮最终确认是内存条故障。2.2 特定设备监控watch -n 1 dmesg | grep -i usb\|sata\|nvme | tail -n 20这个命令会每秒刷新一次显示与存储设备相关的最新20条消息非常适合排查外接设备或磁盘问题。2.3 时间戳追踪dmesg -T --follow-T参数将内核时间戳转换为易读的本地时间--follow则持续输出新消息。组合使用可以精确追踪问题发生的时间点。实用表格常见硬件问题在dmesg中的关键字对照问题类型关键词示例典型日志片段内存错误ECC, memory, correctable[Hardware Error]: Corrected error磁盘故障I/O error, sector, remapBuffer I/O error on dev sda网络问题link down, timeout, reseteth0: link downCPU异常thermal, throttle, MCECPU0: Core temperature above thresholdUSB设备异常reset, disconnect, enumerationusb 3-2: device descriptor read/64, error -1103. 高级过滤精准定位问题日志当系统运行一段时间后dmesg缓冲区可能包含数千条消息。如何快速找到关键信息以下过滤技巧能大幅提高效率3.1 按日志级别过滤dmesg --levelerr,crit,alert,emerg只显示错误及以上级别的消息过滤掉普通信息。3.2 组合grep进行二次过滤dmesg -T | grep -E error|fail|warn|bug --coloralways使用正则表达式匹配多种错误关键词并保持彩色高亮。3.3 时间范围过滤# 显示过去5分钟内的日志 dmesg -T | awk -v d1$(date --date5 minutes ago %a %b %d %H:%M:%S %Y) -v d2$(date %a %b %d %H:%M:%S %Y) $0 d1 $0 d2 || $0 ~ d2这个复杂的awk命令可以过滤出特定时间范围内的日志在确定问题发生时间后非常有用。真实案例某次数据库突然崩溃通过时间过滤锁定在崩溃前2分钟出现了一条关键的内核OOM(内存不足)消息从而快速定位到内存泄漏问题。4. 持久化与归档关键日志的保存策略由于dmesg缓冲区是循环覆盖的重要日志可能会丢失。以下是几种可靠的保存方法4.1 启动时自动保存编辑/etc/rc.local文件在退出前添加dmesg /var/log/dmesg.boot4.2 定期快照创建cron任务每小时保存一次0 * * * * root /bin/dmesg /var/log/dmesg_$(date \%Y\%m\%d\%H).log4.3 系统日志集成配置rsyslog捕获内核消息在/etc/rsyslog.conf中添加kern.* /var/log/kern.log然后重启rsyslog服务。重要提示在生产环境中建议至少采用两种以上的保存方式并定期归档到长期存储中。我曾遇到过服务器连续运行数月后出现硬件问题但因为保留了完整的启动日志能够追溯到最初的硬件异常征兆。5. 性能调优解读内核参数与性能指标dmesg不仅是故障排查工具还能提供丰富的性能调优信息5.1 中断统计dmesg | grep -i irq可以查看各硬件设备的中断分布情况平衡IRQ有助于提高性能。5.2 内存管理dmesg | grep -i memory输出中包含内存初始化、NUMA配置、大页分配等信息对数据库调优特别重要。5.3 调度器信息dmesg | grep -i scheduler显示I/O调度器选择等信息帮助优化磁盘IO性能。性能分析示例 某高负载Web服务器响应变慢通过以下命令发现磁盘IO瓶颈dmesg | grep -A 5 IO scheduler输出显示大量合并请求超时最终通过调整调度器参数解决了问题。6. 安全审计发现异常内核活动dmesg可以帮助发现潜在的安全问题6.1 检测未授权模块加载dmesg | grep -i module监控是否有异常内核模块被加载。6.2 硬件篡改检测dmesg | grep -i firmware\|microcode检查固件是否被修改。6.3 内存保护机制dmesg | grep -i NX\|SMEP\|KASLR验证内核安全特性是否启用。安全最佳实践将关键的安全相关dmesg监控集成到SIEM系统中实现实时告警。例如以下命令可以检测可疑的DMA活动watch -n 60 dmesg | grep -i DMA\|IOMMU7. 自动化监控将dmesg集成到运维系统对于大规模部署手动检查dmesg不现实。以下是几种自动化方案7.1 使用systemd-journald现代Linux系统通常使用journald来管理系统日志可以通过以下命令访问内核消息journalctl -k7.2 Prometheus监控使用node_exporter的textfile收集器定期导出dmesg指标dmesg -l err | wc -l /var/lib/node_exporter/dmesg_errors.prom7.3 ELK集成配置Filebeat收集/var/log/kern.log在Kibana中创建专门的dmesg监控看板。架构示例dmesg - rsyslog - Logstash - Elasticsearch - 实时告警在实施自动化监控时特别注意过滤掉频繁出现的良性错误避免告警疲劳。一个实用的技巧是建立已知良性错误的指纹库在收集阶段就进行过滤。

相关文章:

Linux系统排障必备:dmesg命令的7个实战技巧(附真实案例)

Linux系统排障利器:dmesg命令的7个高阶应用场景 凌晨三点,服务器突然告警,CPU负载飙升,硬盘IO异常,而系统日志却看不出明显问题。这种场景下,大多数运维工程师的第一反应是打开终端,输入那个熟悉…...

电机控制中ADC采样时序的优化策略与实践

1. 电机控制中ADC采样的核心挑战 在电机控制系统中,ADC采样就像给电机装上了"听诊器"。无论是BLDC还是FOC控制方案,电流、电压信号的采集质量直接决定了控制算法的"诊断"准确性。我调试过不少电机项目,发现ADC时序配置不…...

DeepSeek总结的Claude 谈数据的未来

原文:https://motherduck.com/blog/consulting-the-oracle-claude-on-the-future-of-data/ 咨询神谕:Claude 谈数据的未来 乔丹蒂加尼 | 2026/04/03 - “曾经,人们将自己的思考交给机器,希望这能让他们获得自由。但这只允许其他…...

64—存款收益最大化计算器:从算法优化到理财实战

1. 为什么你需要一个存款收益最大化计算器? 每次去银行存钱,柜员都会给你一堆选择:1年期、3年期、5年期,还有各种利率组合。你是不是也纠结过到底怎么存才能让20年后的收益最大化?我曾经用Excel表格手动计算各种组合&a…...

2026届学术党必备的五大降AI率方案实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 就那些有着降低文本重复率需求的用户来讲,去挑选适宜的降重网站极为关键。这般类…...

【Next.js 入门指南】01-核心概念与项目初始化

1. Next.js 是什么? 如果你正在寻找一个能帮你快速构建现代化 React 应用的框架,Next.js 绝对值得一试。简单来说,Next.js 是基于 React 的一个全栈框架,它最大的特点就是**服务端渲染(SSR)和静态生成&…...

UE5全景图导出实战:从配置到优化的完整指南

1. UE5全景图导出基础配置 第一次用UE5导出全景图时,我对着满屏参数直接懵圈。后来发现只要搞定三个核心配置,就能解决80%的基础问题。先打开项目设置里的Rendering→Panoramic Capture,这里藏着全景导出的所有秘密武器。 输出目录是最容易踩…...

树莓派4B上跑YOLOv8-Pose姿态识别,从PyTorch到ONNX的转换与部署避坑指南

树莓派4B部署YOLOv8-Pose:从模型转换到边缘计算的完整实践指南 在边缘计算设备上实现实时姿态识别一直是计算机视觉领域的挑战。本文将带您深入探索如何在树莓派4B上高效部署YOLOv8-Pose模型,从PyTorch到ONNX的转换技巧到实际性能优化,提供一…...

从K-mer频率直方图到发表级图表:手把手教你用R语言美化GenomeScope分析结果

从K-mer频率直方图到发表级图表:R语言进阶可视化实战指南 当你完成基因组survey分析的流程后,如何将原始的K-mer频率直方图转化为具有发表质量的图表?这往往是许多研究人员容易忽视却至关重要的环节。本文将带你深入R语言ggplot2的细节&#…...

Spring AI ETL进阶:利用text-embedding-v4与Milvus构建可解释性RAG数据管道

1. 为什么需要可解释性RAG数据管道? 如果你用过传统的RAG(检索增强生成)系统,一定遇到过这样的困扰:系统返回的文档片段看起来和问题相关,但又不完全匹配。更让人头疼的是,你很难快速判断这些结…...

如何完整破解Cursor Pro限制:一键激活与无限使用的终极指南

如何完整破解Cursor Pro限制:一键激活与无限使用的终极指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached you…...

PowerDMIS清除报告数据

可在所有评价尺寸命令前程序任何位置插入清除数据命令,执行清除数据命令后会清空查看报告“记录模式”下的历史数据,实现只输出当前产品检测数据,避免上一次的检测报告出现在新报告上。设置前报告记录模式下报告会累积叠加:每次执…...

从V1到V3+:手把手带你复现Deeplab系列语义分割模型(PaddlePaddle 2.2.1版)

从V1到V3:手把手带你复现Deeplab系列语义分割模型(PaddlePaddle 2.2.1版) 语义分割作为计算机视觉领域的核心任务之一,正在自动驾驶、医疗影像分析等领域发挥越来越重要的作用。而Deeplab系列模型作为该领域的标杆性工作&#xff…...

Flutter GetX实战:5分钟搞定BottomSheet主题切换功能(附完整代码)

Flutter GetX实战:5分钟实现动态主题切换的BottomSheet 在移动应用开发中,底部弹窗(BottomSheet)是一种常见的交互模式,用于展示次级操作或临时内容。而主题切换功能则是提升用户体验的重要元素。本文将带你使用Flutter的GetX库,快…...

Iconify图标:现代Web开发中的高效图标解决方案

1. Iconify图标:现代Web开发的图标革命 第一次接触Iconify是在一个紧急项目里,客户要求在48小时内完成包含200图标的仪表盘开发。当我发现只需要几行代码就能调用数千个专业图标时,那种感觉就像发现了新大陆。与传统图标方案相比,…...

Antd Table固定列踩坑实录:从‘有缝’到‘无缝’的完整调试心路与CSS终极覆盖指南

Antd Table固定列调试手记:从像素级对齐到CSS层叠的艺术 周五下午4点23分,距离管理后台系统上线还有不到3小时。当我第17次刷新页面时,那个顽固的白色缝隙依然刺眼地横亘在固定列和滚动区域之间——就像开发 deadline 前最后的嘲讽。这个 ant…...

西南交大计算机复试机试C语言通关指南:从LeetCode经典题到上机实战避坑

西南交大计算机复试C语言机试深度攻略:从LeetCode到考场实战 作为西南交通大学计算机专业复试的关键环节,上机考试虽然仅占20%的权重,却因"60分及格线"的硬性规定成为众多考生的"隐形杀手"。去年就有初试400的高分考生因…...

Visual Studio项目实战:如何用vcpkg清单模式管理C++依赖项(附常见错误解决)

Visual Studio项目实战:用vcpkg清单模式构建高效C开发环境 在C项目开发中,依赖管理一直是个令人头疼的问题。不同项目可能需要不同版本的库,全局安装的依赖项经常导致版本冲突,而手动管理第三方库的编译和链接又极其繁琐。微软推出…...

3分钟学会:免费下载B站大会员4K视频的完整教程

3分钟学会:免费下载B站大会员4K视频的完整教程 【免费下载链接】bilibili-downloader B站视频下载,支持下载大会员清晰度4K,持续更新中 项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 还在为B站视频无法离线观看…...

Langfuse汉化实战:解决Docker卷挂载失效,让Next.js应用实时更新代码

Langfuse汉化实战:破解Docker卷挂载失效的Next.js热更新困局 当你在深夜的显示器前反复刷新浏览器,却发现修改过的前端代码像被施了魔法一样毫无变化——这种挫败感,每个使用Docker部署Next.js应用的开发者都深有体会。本文将以Langfuse汉化过…...

Windows和Office激活难题的终极解决方案:KMS_VL_ALL_AIO深度解析

Windows和Office激活难题的终极解决方案:KMS_VL_ALL_AIO深度解析 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活问题而烦恼吗?面对Office软件的激…...

GIS数据流转实战:从SHP到Excel、CAD到GDB的格式互转与批量处理技巧

1. GIS数据格式转换的核心场景与痛点 在土地管理、城乡规划、自然资源调查等实际工作中,GIS数据流转就像不同语言国家之间的外交官会谈——需要专业"翻译官"完成格式转换。我处理过某省国土三调项目,就遇到过县级单位提交的SHP文件需要批量转成…...

如何高效实现视频对比分析:专业开源工具video-compare的完整指南

如何高效实现视频对比分析:专业开源工具video-compare的完整指南 【免费下载链接】video-compare Split screen video comparison tool using FFmpeg and SDL2 项目地址: https://gitcode.com/gh_mirrors/vi/video-compare 在视频编码优化、质量评估和算法验…...

2025届必备的降AI率助手推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 将维普系统针对 AI 生成内容的识别机制考虑进来,要降低 AI 检测率就得从文本特征…...

HCPL-257K,双通道密封高速晶体管输出光耦合器

简介今天我要向大家介绍的是 Broadcom 的光耦合器——HCPL-257K。它是一款双通道、采用气密性密封设计的晶体管输出光耦合器,专为模拟和数字应用设计。通过为光电二极管偏置和输出晶体管集电极提供独立连接,有效减小了基极-集电极电容,使其速…...

15MW海上风机开源仿真模型:从理论到工程实践的技术革新

15MW海上风机开源仿真模型:从理论到工程实践的技术革新 【免费下载链接】IEA-15-240-RWT 15MW reference wind turbine repository developed in conjunction with IEA Wind 项目地址: https://gitcode.com/gh_mirrors/ie/IEA-15-240-RWT 你是否曾面临这样的…...

HCPL-2533-000E,双通道高速逻辑接口光耦合器

简介今天我要向大家介绍的是 Broadcom 的光耦合器——HCPL-2533-000E。它是一款双通道、专为 LSTTL-to-LSTTL 和 TTL-to-LSTTL 逻辑接口设计的高速光耦器件。该器件内部包含一对发光二极管和集成光子探测器,输入与输出之间具备 3000Vdc 的耐压测试标准。通过为光电二…...

5分钟精通Waifu2x-Extension-GUI:便携版与安装版部署全攻略

5分钟精通Waifu2x-Extension-GUI:便携版与安装版部署全攻略 【免费下载链接】Waifu2x-Extension-GUI Video, Image and GIF upscale/enlarge(Super-Resolution) and Video frame interpolation. Achieved with Waifu2x, Real-ESRGAN, Real-CUGAN, RTX Video Super R…...

BCI Competition IV 2a数据集深度解析:除了读取.gdf,你更该关注这些实验设计与数据细节

BCI Competition IV 2a数据集深度解析:实验设计、数据质量与预处理实战指南 当你第一次打开BCI Competition IV 2a数据集的.gdf文件时,可能会被25个通道、数千个采样点和复杂的事件标记弄得晕头转向。这个数据集远不止是22个EEG通道加上3个EOG通道那么简…...

Substance Painter高效快捷键指南

1. Substance Painter快捷键入门指南 第一次打开Substance Painter时,面对密密麻麻的工具栏和复杂的操作界面,很多新手都会感到无从下手。其实这个强大的纹理绘制软件隐藏着许多高效操作的秘密武器——快捷键。掌握这些快捷键就像获得了一把打开效率之门…...