当前位置: 首页 > article >正文

linux 故障处置通用流程-36计+1计

  1. 通用标准处置快速索引

编号

通 用 标 准 处 置

索 引

001

Linux操作系统标准关闭

002

Linux操作系统标准重启

003

Linux操作系统强行关闭

004

Linux操作系统强行重启

005

检查Linux操作系统CPU负载

006

查询占用CPU资源最多的进程

007

检查Linux操作系统内存使用率

008

查询占用内存资源最多的进程

009

判断是否有僵尸进程

010

检查Linux操作系统磁盘I/O负载

011

查询消耗I/O资源最多的进程

012

文件系统信息

013

物理卷、卷组和逻辑卷

014

查看系统主要日志

015

主机通讯是否有延迟

016

主机通讯延迟或丢包

017

主机路由设置是否正确

018

到相连业务系统的通讯是否正常

019

网卡驱动是否正常加载

020

网卡配置信息检测

021

网卡配置参数

022

查看双机状态

023

重启群集服务

024

群及服务切换到备机

025

关闭主机群集服务

026

手工恢复群集服务

027

搜集系统信息

028

进入单用户模式

029

进入紧急救援模式

030

查看服务器端口是否正常开启

031

网络连接数统计

032

交换区使用情况检查

033

文件句柄数调整

034

主机启动时fstab中有错误配置

035

bond主备网卡切换

036

查看内核slab内存占用

037

清理系统内存中的cache和buffer

001:Linux操作系统标准关闭
  1. 通过堡垒机以root用户登录;
  2. 根据需求首先关闭应用程序/数据库(该步骤可选,需要的系统请明示步骤)
  3. 执行shutdown -h now

002:Linux操作系统标准重启

shutdown -r now

003:Linux操作系统强行关闭

  1. 通过堡垒机以root用户登录;
  2. 执行 poweoff

虚拟化平台(VM和华为云):

登录VM Vcenter-通过搜索查询到所需操作的虚拟机-右键虚拟机-启动-关闭电源

登录华为云 ManagerOne-左侧服务列表-弹性云服务器-更多-实例状态-关机

物理机带外:通过带外IP登录网页-电源-关机

004:Linux操作系统强行重启

  1. 通过堡垒机以root用户登录;
  2. 执行echo b > /proc/sysrq-trigger 或者执行 reboot -nf

虚拟化平台(VM和华为云):

登录VM Vcenter-通过搜索查询到所需操作的虚拟机-右键虚拟机-启动-重新启动客户机操作系统

登录华为云 ManagerOne-左侧服务列表-弹性云服务器-更多-实例状态-重启

物理机带外:通过带外IP登录网页-电源-重启

005:检查Linux操作系统CPU负载

  1. 通过堡垒机以root或普通权限用户登录
  2. 执行top命令;

  1. 执行sar -u 2 30命令; 2秒采样一次 采样30次
  2. 执行 sar -u -f /var/log/sa/sa+日期
  3. 执行vmstat 2 30命令;
  4. 执行mpstat 2 30命令;

006:定位占用CPU资源最多的进程

  1. 执行top命令;
  2. 在top命令执行窗口,使用热键“P”,按照CPU使用率对进程进行排序。

007:检查Linux操作系统内存使用率

  1. 执行命令:top;
  2. 执行命令:free;
  3. 执行命令:cat /proc/meminfo
  4. top--在程序界面中,查看MEM、Swap、Buffer、Cache数值;
  5. free:查看+/-buffers/cache后的内存使用率;
  6. cat /proc/meminfo:查看内存详细使用情况

008:查询占用内存资源最多的进程

  1. 执行top;
  2. 在top界面中按热键“M”,按照内存使用率对进程进行排序。
  3. 验证步骤:根据top命令输出排序结果,定位占用内存资源最多的进程。

​​​​​​​009:判断是否有僵尸进程

  1. 执行top命令;
  2. 执行ps aux|grep defunct命令
  3. 执行top:查看top输出中是否提示有僵尸进程及其数量;

  4. 使用ps命令查找并定位僵尸进程。

​​​​​​​010:检查Linux操作系统磁盘I/O负载

        执行:vmstat 1

        iostat 1

        sar -d命令

  1. vmstat反映了进程的虚拟内存,虚拟内存,磁盘,trap和cpu的活动情况,在多cpu系统中,vmstat在输出结果中平均了cpu数量
  2. iostat:如果想看每个设备的io情况,可使用iostat命令。

​​​​​​​011:查询消耗I/O资源最多的进程

操作步骤:

  1. 运行iotop工具进行系统I/O性能监控
  2. 运行iostat 命令查看 语法:【选项】【间隔时间】【次数】

常用参数:

-c:显示CPU利用率

-d:显示设备利用率

-t:显示时间戳

-x:显示详细磁盘指标

-y:跳过第一条数据

-k:显示单位为KB

-m:显示单位为MB

-p:指定主设备,显示主设备下所有磁盘信息

示例:

iostat -c 1 3 #输出3次 每次间隔一秒

iostat 1 2 #1秒刷新一次 统计2次

验证步骤:根据iotop输出结果验证

常用参数:

-o:只显示有io操作的进程

-b:批量显示,无交互,主要用作记录到文件。

-n NUM:显示NUM次,主要用于非交互式模式。

-d SEC:间隔SEC秒显示一次。

-p PID:监控的进程pid。

-u USER:监控的进程用户。

示例

iotop

​​​​​​​

​​​​​​​012:文件系统信息

  1. 执行以下命令查看文件系统挂载情况:

#df -h 查看文件系统使用率

#df -i 查看文件系统inode使用率

#mount 查看文件系统mount属性

#cat /etc/fstab 确认是否有未挂载文件系统

  1. 查看日志中是否有关于文件系统的报错信息

#tail -2000 /var/log/messages

        验证步骤:

  1. 文件系统正常挂载,读/写属性正常,日志无报错;
  2. 可手工创建临时文件,以验证文件系统的可读/写性。

​​​​​​​013:物理卷、卷组和逻辑卷

  1. 执行以下命令查看PV、VG、LV信息:

#pvs ;#pvdisplay 查看物理卷信息

#vgs ;#vgdisplay 查看卷组信息

#lvs ;#lvdisplay 查看逻辑卷信息

  1. 查看日志中是否有关于文件系统的报错信息

#tail -2000 /var/log/messages

#cat /var/log/messages |grep -i fs

验证步骤:

  1. 物理卷、卷组、逻辑卷状态正常,读/写属性正常,日志无报错;
  2. 如果要查看PV、VG和LV的详细扫描信息,可以使用命令pvdisplay、vgdisplay、lvdisplay并搭配 “-vvvv”参数使用。

相关文章:

linux 故障处置通用流程-36计+1计

通用标准处置快速索引 编号 通 用 标 准 处 置 索 引 001 Linux操作系统标准关闭 002 Linux操作系统标准重启 003 Linux操作系统强行关闭 004 Linux操作系统强行重启 005 检查Linux操作系统CPU负载 006 查询占用CPU资源最多的进程 007 检查Linux操…...

​BEV和OCC学习-3:mmdet3d 坐标系

目录 坐标系 转向角 (yaw) 的定义 框尺寸的定义 与支持的数据集的原始坐标系的关系 KITTI Waymo NuScenes Lyft ScanNet SUN RGB-D S3DIS 坐标系 坐标系 — MMDetection3D 1.4.0 文档https://mmdetection3d.readthedocs.io/zh-cn/latest/user_guides/coord_sys_tuto…...

[蓝桥杯]图形排版

图形排版 题目描述 小明需要在一篇文档中加入 NN 张图片,其中第 ii 张图片的宽度是 WiWi​,高度是 HiHi​。 假设纸张的宽度是 MM,小明使用的文档编辑工具会用以下方式对图片进行自动排版: 1. 该工具会按照图片顺序&#xff0…...

【Linux仓库】冯诺依曼体系结构与操作系统【进程·壹】

🌟 各位看官好,我是! 🌍 Linux Linux is not Unix ! 🚀 今天来学习冯诺依曼体系结构与操作系统。 👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更多人哦&#xff0…...

CloudFront 加速详解:AWS CDN 怎么用?

让全球访问更快速稳定,深入解读 AWS 的内容分发网络 在上一篇中,我们介绍了 Amazon S3 对象存储,它非常适合托管静态资源,比如图片、视频、网页等。但你可能遇到过这样的问题: “我把网站静态文件部署到了 S3&#xf…...

《高级架构师》------- 考后感想

笔者来聊一下架构师考后的感想 复习备考 考前过了很多知识点,只是蜻蜓点水,没有起到复习的作用,即使考出来也不会,下次复习注意这个,复习到了,就记住,或者画出来,或者文件总结&…...

【iOS】YYModel源码解析

YYModel源码解析 文章目录 YYModel源码解析前言YYModel性能优势YYModel简介YYClassInfo解析YYClassIvarInfo && objc_ivarYYClassMethodInfo && objc_methodYYClassPropertyInfo && property_tYYClassInfo && objc_class YYClassInfo的初始化细…...

C++算法训练营 Day6 哈希表(1)

1.有效的字母异位词 LeetCode:242.有效的字母异位词 给定两个字符串s和t ,编写一个函数来判断t是否是s的字母异位词。 示例 1: 输入: s “anagram”, t “nagaram” 输出: true 示例 2: 输入: s “rat”, t “car” 输出: false 解题思路&#xff…...

【C语言编译与链接】--翻译环境和运行环境,预处理,编译,汇编,链接

目录 一.翻译环境和运行环境 二.翻译环境 2.1--预处理(预编译) 2.2--编译 2.2.1--词法分析 2.2.2--语法分析 2.2.3--语义分析 2.3--汇编 2.4--链接 三.运行环境 🔥个人主页:草莓熊Lotso的个人主页 🎬作者简介:C研发…...

【JavaEE】多线程

8.线程状态 根据 Java 的Thread.state包,线程一共有六种状态: NEWRUNNABLEBLOCKEDWAITINGTIMED_WAITINGTERMINATED 二、每种状态的含义 1. NEW(新建) 当使用new 关键字创建一个线程对象,但尚未调用其start() 方法时…...

【项目】在线OJ(负载均衡式)

目录 一、项目目标 二、开发环境 1.技术栈 2.开发环境 三、项目树 目录结构 功能逻辑 编写思路 四、编码 1.complie_server 服务功能 代码蓝图 开发编译功能 日志功能 ​编辑 测试编译模块 开发运行功能 设置运行限制 jsoncpp 编写CR 如何生成唯一文件名 …...

贪心算法应用:在线租赁问题详解

贪心算法应用:在线租赁问题详解 贪心算法是一种在每一步选择中都采取当前状态下最优的选择,从而希望导致结果是全局最优的算法策略。在线租赁问题(Greedy Algorithm for Online Rentals)是一个经典的贪心算法应用场景,下面我将从多个维度全面…...

torch.zeros()用法简介

torch.zeros()是PyTorch中用于创建全零张量的核心函数,其功能和使用方法如下: 1. ‌基本语法‌ torch.zeros(*size, outNone, dtypeNone, layouttorch.strided, deviceNone, requires_gradFalse)参数说明: *size:定义张量形状的…...

Prj10--8088单板机C语言8259测试(1)

1.原理图 2.Deepseek示例代码 #include <dos.h> #include <conio.h> #include <stdio.h>#define PIC1_CMD 0x400 // 命令端口 (A00) #define PIC1_DATA 0x401 // 数据端口 (A01)volatile int int_count 0; // 中断计数器 void interrupt (*old_isr)(…...

3步在小米13手机跑DeepSeek R1

大家好&#xff01;我是羊仔&#xff0c;专注AI工具、智能体、编程。 一、从性能旗舰到AI主机 春节大扫除时&#xff0c;翻出尘封的小米13&#xff0c;这台曾以骁龙8 Gen2著称的性能小钢炮&#xff0c;如今正在执行更科幻的使命——本地运行DeepSeek R1。 想起两年前用它连续肝…...

数智管理学(十六)

二、分布式网络型结构的特点 分布式网络型结构是一种去中心化、扁平化和协作性的组织模式&#xff0c;与传统金字塔型结构形成鲜明对比。它通过赋予团队和个体更大的自主权&#xff0c;提升组织的灵活性和响应能力。 &#xff08;一&#xff09;节点化组织 1.模块化团队构成…...

注销微软账户

因为我的微软开发者账户丢失 Office E5 权限&#xff0c;因此需要注销。 若你需要注销微软账号&#xff0c;请点击下方超链接。 点击此处 注销之后仅剩一个正常的账户使用咯&#xff01;&#xff01;...

Ubuntu 服务器软件更新,以及常用软件安装 —— 一步一步配置 Ubuntu Server 的 NodeJS 服务器详细实录 3

前言 前面&#xff0c;我们已经 安装好了 Ubuntu 服务器系统&#xff0c;并且 配置好了 ssh 免密登录服务器 &#xff0c;现在&#xff0c;我们要来进一步的设置服务器。 那么&#xff0c;本文&#xff0c;就是进行服务器的系统更新&#xff0c;以及常用软件的安装 调整 Ubu…...

Mysql常用知识3:Kafka和数据库优化

文章目录 一、分布式消息系统&#xff08;Kafka相关问题5-10&#xff09;5. Kafka如何保证消息不丢失&#xff1f;6. 项目中Kafka具体怎么使用的&#xff1f;7. 消息异常未发送成功怎么解决&#xff1f;8. 重试具体怎么做的&#xff0c;循环吗&#xff1f;9. 重试多次失败怎么办…...

Milvus单机模式安装和试用

1.安装ollama的package包&#xff1b; # install package pip install -U langchain-ollama2.我们直接使用ChatOllama实例化模型&#xff0c;并通过invoke进行调用&#xff1b; from langchain_ollama import ChatOllamallm ChatOllama(model"deepseek-r1") messa…...

飞牛NAS+Docker技术搭建个人博客站:公网远程部署实战指南

文章目录 前言1. Docker下载源设置2. Docker下载WordPress3. Docker部署Mysql数据库4. WordPress 参数设置5. 飞牛云安装Cpolar工具6. 固定Cpolar公网地址7. 修改WordPress配置文件8. 公网域名访问WordPress总结 前言 在数字化浪潮中&#xff0c;传统网站搭建方式正面临前所未…...

刷leetcode hot100返航必胜版--链表6/3

链表初始知识 链表种类&#xff1a;单链表&#xff0c;双链表&#xff0c;循环链表 链表初始化 struct ListNode{ int val; ListNode* next; ListNode(int x): val&#xff08;x&#xff09;,next(nullptr) {} }; //初始化 ListNode* head new ListNode(5); 删除节点、添加…...

C# 序列化技术全面解析:原理、实现与应用场景

在软件开发中&#xff0c;数据持久化和网络通信是两个至关重要的环节。想象一下&#xff0c;当我们需要将一个复杂的对象保存到文件中&#xff0c;或者通过网络发送到另一台计算机时&#xff0c;如何有效地表示这个对象&#xff1f;这就是序列化技术要解决的问题。序列化&#…...

isp调试 blend模式指什么

isp调试 blend模式指什么 答案摘自豆包&#xff1a; 在图像信号处理&#xff08;ISP&#xff0c;Image Signal Processor&#xff09;调试中&#xff0c;Blend 模式&#xff08;混合模式&#xff09; 是指将不同处理阶段的图像数据或不同来源的图像信息按照特定规则进行叠加或…...

electron定时任务,打印内存占用情况

// 监听更新 function winUpdate(){// 每次执行完后重新设置定时器try {// 获取当前时间并格式化为易读的字符串const now new Date();const timeString now.toLocaleString();console.log(当前时间: ${timeString});// 记录内存使用情况&#xff08;可选&#xff09;const m…...

Gitee Wiki:以知识管理赋能 DevSecOps,推动关键领域软件自主演进

关键领域软件研发中的知识管理困境 传统文档管理模式问题显著 关键领域软件研发领域&#xff0c;传统文档管理模式问题显著&#xff1a;文档存储无系统&#xff0c;查找困难&#xff0c;降低效率&#xff1b;更新不及时&#xff0c;与实际脱节&#xff0c;误导开发&#xff1…...

学习STC51单片机24(芯片为STC89C52RCRC)

每日一言 把 “我不行” 换成 “我试试”&#xff0c;你会发现一片新的天地。 那关于优化 白盒测试 我们之前不是通过这个接线方式可以看到返回到信息嘛因为安信可的特性就是返回Esp8266的反馈&#xff0c;可以看到代码死在哪里了&#xff0c;导致连接不上&#xff0c;因为我们…...

LabVIEW基于 DataSocket从 OPC 服务器读取数据

LabVIEW 中基于 DataSocket 函数从 OPC 服务器读取数据的功能&#xff0c;为工业自动化等场景下的数据交互提供了解决方案。通过特定函数实现 URL 指定、连接建立与管理、数据读取&#xff0c;相比传统 Socket 通信和 RESTful API &#xff0c;在 OPC 服务器数据交互场景有适配…...

阿里云无影云桌面深度测评

阿里云无影桌面深度测评&#xff1a;解锁云端工作“新范式”的“未来之钥”&#xff01; 在数字化浪潮席卷全球的2025年&#xff0c;远程办公与混合办公已不再是权宜之计&#xff0c;而是职场不可逆转的新常态。然而&#xff0c;如何确保员工无论身在何处&#xff0c;都能拥有…...

【208】VS2022 C++ 32位整数和unsigned char数组之间互相转换

一、场景 在实际应用中&#xff0c;特别是在数据传输的时候&#xff0c;需要读取unsigned char数组&#xff0c;再转换成 32 位整数&#xff1b;或者把 32 位整数转换成 unsigned char数组进行写入。比如对接西门子PLC的 snap7 就是这样。32 位整数分成有符号的无符号的&#…...