Linux系统crash后定位方法-PCIE举例
crash解释
在Linux操作系统中,"crash"通常是指一种用于分析系统崩溃(crash)的工具或方法。当系统发生崩溃时,可能会产生一些关键信息,如错误日志、内存转储文件等。使用crash工具可以分析这些信息,以便了解崩溃的原因和上下文。
crash工具是一个基于命令行的工具,它可以加载系统转储文件,然后提供一系列命令来查看和分析系统状态。例如,可以使用crash工具来查看进程列表、线程列表、内存映射、堆栈跟踪、寄存器值等信息。crash还支持多种操作系统架构和文件系统类型。
通过使用crash工具,开发人员和系统管理员可以更快地诊断和解决系统崩溃问题,从而提高系统的可靠性和稳定性。
crash生成文件
出现crash后会在指定路径生成文件

"vmcore"通常是指在Linux操作系统中,当系统发生崩溃(crash)时自动生成的内核转储文件。该文件包含了操作系统崩溃时的系统状态、进程信息、内存映射、寄存器值等重要信息,以便开发人员和系统管理员进行故障诊断和分析。
vmcore文件通常很大,它记录了整个系统在崩溃前的状态和各种信息,包括内核代码、驱动程序、应用程序和库等。管理员可以使用一些工具来分析vmcore文件,如crash、gdb等。这些工具可以从vmcore文件中提取出关键信息,帮助管理员找出系统崩溃的原因。
vmcore文件的生成通常由内核中的某些机制触发,例如内核崩溃、紧急情况下的系统抓取(Panic Timeout)、kdump等。其中,kdump是一种在Linux系统中用于生成vmcore文件的机制,它通过在系统崩溃时启动一个较小的内核(称为crash内核),将当前系统的内存转储到磁盘上,并生成一个vmcore文件。这样,管理员就可以在不影响当前系统运行的情况下,对vmcore文件进行分析和处理。
总之,vmcore文件是Linux系统在发生崩溃时自动生成的内核转储文件,它包含了有关系统崩溃时的状态和信息,可以用于故障诊断和分析。
分析方法
mcelog
安装
mcelog是一个Linux命令行工具,用于分析机器检查异常(MCE)日志,并将其转换为可读的ASCII格式。要使用mcelog --ascii命令,请按照以下步骤操作:
-
打开终端或控制台窗口。
-
运行以下命令来安装mcelog:
sudo apt-get install mcelog -
运行以下命令以查看机器检查异常日志的ASCII格式输出:
sudo mcelog --ascii -
如果您只想查看最近的MCE日志,请运行以下命令:
sudo mcelog --ascii --last -
如果您只想查看特定CPU上的MCE日志,请运行以下命令,其中“X”表示CPU编号:
sudo mcelog --ascii --cpu X -
您还可以将输出保存到文件中以进行进一步分析。例如,要将输出保存到名为“mce.log”的文件中,请使用以下命令:
sudo mcelog --ascii > mce.log
以上命令的输出将包括每个错误的时间戳、处理器和内存地址、错误类型、错误代码等详细信息,这有助于确定硬件故障的原因。
使用
使用的前提是要先安装运行
mcelog --daemonRun mcelog in daemon mode, waiting for errors from the kernel.
若要使用mcelog命令来分析crash日志,可以按照以下步骤:
-
打开终端或控制台窗口。
-
安装mcelog软件包。如果您的系统上已经安装了该软件包,请跳过此步骤。在Debian/Ubuntu系统上,您可以使用以下命令安装:
sudo apt-get install mcelog -
运行以下命令以查看机器检查异常日志的ASCII格式输出:
sudo mcelog --ascii > mce.log此命令将把mcelog的输出保存到名为“mce.log”的文件中。
-
使用文本编辑器(例如nano、vi或gedit)打开生成的日志文件:
nano mce.log您也可以使用cat命令查看整个日志文件:
cat mce.log -
在日志文件中查找有关发生crash的时间戳和CPU编号等信息。这些信息可以帮助您确定与错误相关的硬件设备。
-
通过分析日志中的其他详细信息,例如错误类型、错误代码和处理器状态等,来进一步诊断问题。
mcelog只能分析硬件错误并提供有关错误类型、地址和处理器状态等信息。对于其他类型的错误(例如软件错误),mcelog可能无法提供任何有用的信息。因此,在分析crash日志时,您可能需要使用其他工具和技术来确定问题的根本原因。
crash
使用crash来分析Linux系统崩溃通常需要以下步骤:
-
安装crash工具:在大多数Linux发行版中,crash工具已经包含在内核调试工具集中。如果没有安装,则可以通过操作系统的包管理器进行安装。
-
收集vmcore文件:如果是使用kdump机制生成的vmcore文件,则需要将其复制到本地系统中,以便进行分析。如果没有vmcore文件,则可以尝试手动导出系统转储(如sysrq-t)或其他方法来收集有关崩溃的信息。
-
启动crash工具:在终端中输入crash命令,然后指定要分析的vmcore文件路径。
crash <options> <path-to-vmcore>
-
使用crash命令:一旦进入crash环境,就可以使用一系列命令来查看和分析系统状态。例如,"bt"命令用于显示当前进程或线程的堆栈跟踪信息,"ps"命令用于列出当前运行的进程列表,"mem"命令用于查看内存映射等。
-
分析结果:根据crash命令输出的信息,可以识别出造成系统崩溃的原因和上下文。例如,可以查看系统日志、内存映射、堆栈跟踪等信息,以了解哪个进程或驱动程序引起了崩溃。
需要注意的是,crash工具的使用需要一定的Linux系统知识和调试技能。在进行分析之前,建议先阅读相关文档或参考教程,以便更好地理解和应用crash工具。
举例分析
执行crash 可以看到有符号镜像文件


查看crash

解释
这是一个内核崩溃的信息,以下是每一行的含义:- WARNING: kernel relocated [672MB]: patching 94975 gdb minimal_symbol values:警告内核已重定位,并正在对gdb最小符号值进行修补。
- KERNEL: /usr/lib/debug/lib/modules/4.18.0-193.el8.x86_64/vmlinux:指出内核文件所在的路径。
- DUMPFILE: vmcore [PARTIAL DUMP]:指出转储文件的名称和类型(部分转储)。
- CPUS: 48:指出系统的CPU数量。
- DATE: Sat May 13 11:03:35 2023:指出崩溃发生的日期和时间。
- UPTIME: 01:48:49:指出系统的运行时间。
- LOAD AVERAGE: 0.21, 0.06, 0.02:指出过去1、5、15分钟的平均负载。
- TASKS: 1063:指出系统当前正在运行的任务数。
- NODENAME: localhost.localdomain:指出主机名。
- RELEASE: 4.18.0-193.e18.x8664:指出内核版本。
- VERSION: #1 SMP Fri May 8 10:59:10 UTC 2020:指出内核编译时使用的版本信息。
- MACHINE: x86_64 (2100Mhz):指出CPU架构和频率。
- MEMORY: 31.7 GB:指出系统的总内存量。
- PANIC: "Kernel panic not syncing: Fatal machine check":指出内核崩溃的原因。
- PID: 0:指出正在运行的进程ID。
- COMMAND: "swapper/23":指出正在运行的进程名称。
- TASK: ff4cef3183ba8000 (10f48) [THREAD INFO: ff4cef3183ba8000] CPU: 23 STATE: TASK RUNNING (PANIC):指出正在运行的线程的信息,包括线程ID、CPU编号、状态等。
- #0 [fffffe00003e7c60] machine_kexec at ffffffffab05982e:指出当前堆栈帧的编号、函数名称和地址。
- #1 [fffffe00003e7cb8] crash_kexec at ffffffffab158d8d:指出上一级堆栈帧的信息。
- #2 [fffffe00003e7d80] panic at ffffffffab01498:指出更高一级堆栈帧的信息。
- #3 [fffffe00003e7e48] do_machine_check at ffffffffab03981a:指出更高一级堆栈帧的信息。
- #4 [fffffe00003e7f50] machine_check at ffffffffaba0l26b [exception RIP: mwait_idle+127]:指出更高一级堆栈帧的信息,并显示引起异常的指令地址(RIP)和标志寄存器(RFLAGS)。
- RIP: ffffffffab89458f RSP: ff7ed162c345beb0 RFLAGS: 00000246 RAX: 0000000000000000 RBX: 0000000000000017 RCX: 0000000000000000 RDX: 0000000000000000 RSI: 0000000000000017 RDI: ff4cef38df6dd5c0 RBP: 0000000000000017 R8: 0000000000000000 R9: 0000000000029480 R10: 000a527e953cc2e5 R11: 0000000000000000 R12: 0000000000000000 R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000 ORIG_RAX: ffffffffffffffff CS: 0010 SS: 0018:显示了引起异常的指令的寄存器状态。
- <MCE exception stack>:指出崩溃时发生的机器检查(Machine Check Exception)异常的堆栈信息。
- #5 [ff7edl62c345bebo] mwait_idle at ffffffffab89458f:指出更高一级堆栈帧的信息。
- #6 [ff7ed162c345bedo] do_idle at ffffffffab0e67al:指出更高一级堆栈帧的信息。
- #7 [ff7ed162c345bf10] cpu_startup_entry at ffffffffab0e6aof:指出更高一级堆栈帧的信息。
- #8 [ff7ed162c345bf30] start_secondary at ffffffffab04eal7:指出更高一级堆栈帧的信息。
- #9 [ff7ed162c345bf50] secondary_startup_64 at ffffffffab0000e7:指出更高一级堆栈帧的信息。
- crash>:提示用户可以在命令行中输入命令来分析崩溃信息。
定位
查看RP的扩展空间

AERC
协议

相关文章:
Linux系统crash后定位方法-PCIE举例
crash解释 在Linux操作系统中,"crash"通常是指一种用于分析系统崩溃(crash)的工具或方法。当系统发生崩溃时,可能会产生一些关键信息,如错误日志、内存转储文件等。使用crash工具可以分析这些信息ÿ…...
瑞吉外卖 - 启用与禁用员工账号功能(8)
某马瑞吉外卖单体架构项目完整开发文档,基于 Spring Boot 2.7.11 JDK 11。预计 5 月 20 日前更新完成,有需要的胖友记得一键三连,关注主页 “瑞吉外卖” 专栏获取最新文章。 相关资料:https://pan.baidu.com/s/1rO1Vytcp67mcw-PD…...
【MySQL】索引
记录MySQL学习笔记,大部分图片来自黑马程序员MySQL教程。 文章目录 概述索引结构BTree为什么InnoDB使用BTree索引结构? 索引分类索引语法SQL性能分析1、查看执行频次2、慢查询日志3、profile详情4、explain执行计划 索引使用最左前缀法则索引失效情况1、…...
JavaScript全解析——express
express 的基本使用 ●express 是什么? ○是一个 node 的第三方开发框架 ■把启动服务器包括操作的一系列内容进行的完整的封装 ■在使用之前, 需要下载第三方 ■指令: npm install express 1.基本搭建 // 0. 下载: npm install express// 0. 导入 const express express()…...
【JavaScript数据结构与算法】字符串类(计算二进制子串)
个人简介 👀个人主页: 前端杂货铺 🙋♂️学习方向: 主攻前端方向,也会涉及到服务端(Node.js) 📃个人状态: 在校大学生一枚,已拿多个前端 offer(…...
TCP连接不释放,应用产生大量CLOSE_WAIT状态TCP
一、起源 23年元旦期间,大家都沉浸在一片祥和的过节气氛当中。 “滴滴滴”,这头同事的电话响起,具体说些什么我也没太在意,但见同事接完电话之后展现出了一副懊恼夹杂着些许不耐烦的表情。 我不解问道:“怎么了&…...
Spring基础核心概念理解(常见面试题:什么是IoC?什么是DI?什么是Spring?)
目录 IoC 和 SpringIoC DI Spring IoC 和 SpringIoC IoC是控制反转的意思,它意味着控制权(依赖对象)的反转,将控制权进行反转,它是一种思想. 举个例子,理解一下什么是控制反转 现在有三个对象A,B,C. A的创建依赖于B,B的创建依赖于C,当我们想要创建A的时候创建B,同理也要…...
牛客小白月赛 D.遗迹探险 - DP
题目描述 小Z是一名探险家。有一天,小Z误入了一个魔法遗迹。以下是该遗迹的具体组成: 1. 在 x 轴和 y 轴构成的平面上,满足在 1≤x≤n,1≤y≤m 的区域中(坐标(x,y)表示平面上的第x行的第y列),每个整数坐标 (x,y) 都有…...
前端架构师-week6-require源码解析
require 源码解析——彻底搞懂 npm 模块加载原理 require 的使用场景 加载模块类型 加载内置模块:require(fs)加载 node_modules 模块:require(ejs)加载本地模块:require(./utils)支持文件类型 加载 .js 文件加载 .mjs 文件加载 .json 文件…...
作为 IT 行业的过来人,你有什么话想对后辈说的?
作为 IT 行业的过来人,我想对后辈们说,要不断学习和探索新技术,但同时也要注意保持专注和耐心。在这个快速变化的时代,技术更新换代太快,可能会让人感到焦虑和无助,但只要有耐心并专注于自己所做的事情&…...
表数据编辑(数据库)
目录 一、插入数据 1.插入单个元组: INSERT…VALUES语句 2.插入子查询的结果: INSERT…SELECT语句 3.使用SELECT…INTO语句进行数据插入 二、修改数据 1、数据修改语句:UPDATE 2、修改给定表的所有行 3、基于给定表修改某…...
考虑多能负荷不确定性的区域综合能源系统鲁棒规划(Python代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...
RocketMQ整理
RocketMQ在阿里云上的商业版本,集成了阿里内部一些更深层次的功能及运维定制。开源版本,功能上略有缺失,但大体上是一样的。 使用Java开发,便于深度定制。最早叫MetaQ。消息吞吐量虽然依然不如Kafka,但是却比RabbitMQ高很多。在阿里内部,RocketMQ集群每天处理的请求数超过…...
Springboot +Flowable,会签、或签简单使用(二)
一.简介 **会签:**在一个流程中的某一个 Task 上,这个 Task 需要多个用户审批,当多个用户全部审批通过,或者多个用户中的某几个用户审批通过,就算通过。 例如:之前的请假流程,假设这个请假流程…...
将核心交换机配置为NTP服务器
AR配置外源NTP 1.配置ntp <XQ-R1220>sys [XQ-R1220]ntp-service unicast-server 120.25.115.20 #阿里云ntp [XQ-R1220]ntp-service unicast-server 203.107.6.88 #阿里云ntp 2.查看ntp状态 <XQ-R1220>display ntp status clock sta…...
application.properties文件注释
这是一个常用的Spring Boot配置文件 在这里,我们可以配置应用程序的各种属性 服务器端口号 server.port8080 数据库配置 spring.datasource.urljdbc:mysql://localhost:3306/test spring.datasource.usernameroot spring.datasource.password123456 spring.datasou…...
MySql查询报错this is incompatible with sql_mode=only_full_group_by
错误示例 Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘yiliaohaocai_new.a.id’ which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_modeonly_full_group_by 原因 SQL …...
VMware Workstation 网络备忘 + 集群规模
概述 在虚拟机中部署服务,进行IP规划,进行相关的前期准备 3 张网卡 2个不同的网段 1个NAT 概述截图 NAT 截图 VMnet0 截图 VMnet1 截图 总结: 网卡(网络适配器)名称IP网段备注NATens33192.168.139.0VMnet0ens34VMne…...
被裁现状,给找工作的同学一些建议
2022 到 2023 国内知名互联网公司腾讯、阿里、百度、快手、滴滴、京东、阿里、爱奇艺、知乎、字节跳动、小米等公司均有裁员,其中有不少公司,在过去年的一整年,进行了多轮裁员,以下是网传的一张 “2022 年裁员企业名单”。 这些裁…...
编程到底难在哪里?
编程是一门非常有挑战性的技术,能够让人们使用计算机来完成各种任务。它不仅需要掌握各种计算机语言和框架,还需要在实际应用中充分发挥自己的专业知识和创造力。 然而,对于初学者来说,在编程过程中遇到的难点可能是多方面的。以…...
LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明
LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造,完美适配AGV和无人叉车。同时,集成以太网与语音合成技术,为各类高级系统(如MES、调度系统、库位管理、立库等)提供高效便捷的语音交互体验。 L…...
【Axure高保真原型】引导弹窗
今天和大家中分享引导弹窗的原型模板,载入页面后,会显示引导弹窗,适用于引导用户使用页面,点击完成后,会显示下一个引导弹窗,直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...
设计模式和设计原则回顾
设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...
java_网络服务相关_gateway_nacos_feign区别联系
1. spring-cloud-starter-gateway 作用:作为微服务架构的网关,统一入口,处理所有外部请求。 核心能力: 路由转发(基于路径、服务名等)过滤器(鉴权、限流、日志、Header 处理)支持负…...
基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容
基于 UniApp + WebSocket实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...
【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)
服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...
蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练
前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...
零基础设计模式——行为型模式 - 责任链模式
第四部分:行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习!行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想:使多个对象都有机会处…...
06 Deep learning神经网络编程基础 激活函数 --吴恩达
深度学习激活函数详解 一、核心作用 引入非线性:使神经网络可学习复杂模式控制输出范围:如Sigmoid将输出限制在(0,1)梯度传递:影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...
【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...
