当前位置: 首页 > article >正文

linux 故障处置通用流程-36计-14-27

014:查看系统主要日志

查看以下日志:

主要查以下关键字 error/NIC/fs /"link down"/Oout of memory"

/var/log/messages

/var/log/dmesg

015:主机通讯是否延迟

执行命令:

#ping 网关_IP

#ping 关联主机_IP

​​​​​​​016:主机通讯是否丢包

执行:

#/sbin/ifconfig

#ping -c 次数 IP地址

​​​​​​​017:主机路由设置是否正确

  1. 执行以下命令:

#route

#cat /proc/net/route

  1. 查看路由是否正确添加;
  2. 当前路由所对应物理网卡是否正确;
  3. 最多只有一条缺省路由。

​​​​​​​018:到相连业务系统的通讯是否正常

  1. 执行命令:

#ping 关联系统_IP网关_IP

#telnet 关联系统_IP PORT_NUMBER

#route

#traceroute 关联系统_IP

#ifconfig

  1. 检测与目标主机的连通性;
  2. 检测路由正确性;
  3. 检测网卡状况是否正常。
019:网卡驱动是否正常加载
  1. 执行命令:

#cat /var/log/mesages | grep -Ei "system boot|Err|Warn| Fatal|fail|Killsingal" 查看日志信息

#ifconfig 查看网卡工作状态

#lspci |grep -i eth(linux7)、

dmesg | grep -i eth(linux6) 查看物理网卡

#ethtool -i 网卡_名称 查看指定网卡所使用的驱动程序

#cat /proc/modules 查看已加载驱动

#lsmod 查看当前网卡驱动是否已经正确加载

#modinfo 驱动_名称 查看驱动信息

  1. 查看messages日志文件中是否有报错;
  2. 根据ifconfig查看网卡工作状态;
  3. 根据lspci判断物理网卡型号;
  4. 使用ethtool查看指定网卡所使用的驱动程序;
  5. 根据/proc/modules、lsmod判断网卡驱动是否已经正常加载;
  6. 使用modinfo查看驱动程序详细信息。
020:网卡配置信息检测

#ping _IP

#ping 关联主机_IP

#ifconfig 查看网卡信息

#tail -2000 /var/log/messages 查看日志信息

#cat /etc/sysconfig/network- scripts/ifcfg-eth?,

查看IP,掩码,网关等设置信息;

修改配置文件后,执行 #service network restart(linux6)、systemctl restart network(linux7) ,重启网络服务。

  1. 检测主机与网及关联主机通讯是否正常;
  2. 主机网卡状态是否正常;
  3. 系统日志中是否有明显报错;
  4. 主机缺省路由是否配置正确;
  5. 网卡配置文件是否正确:如果配置文件中含有MAC地址,应使用dmesg命令,验证MAC地址是否填写正确;
  6. 调整配置并重启网络服务

021:网卡配置参数

执行命令:

#ethtool 网卡_名称

使用ethtool命令,查看网卡配置是否正常,主要关注网卡连接模式(10/100/1000baseT)及工作模式(Half/Full)。

022:查看群集状态及共享资源

执行:clustat(redhat6)

pcs status (redhat7)

  1. 集群资源状态为Online
  2. 集群资源状态为Started
023:重启群集服务

redhat6

#clusvcadm –r test_svc (test_svc 资源组名字)

重新启动test_svc这个服务;

redhat7

pcs resource unmanager <resource_name>

pcs cluster disunmanagerable

pcs cluster enable

pcs resource unmanager <resource_name>

  1. 查看日志:tail -f /var/log/messages
  2. 使用clustat(redhat6)/pcs stauts(redhat7)查看双机节点及服务状态。
  1. 命令执行成功,服务重新运行于当前节点;
  2. 切换过程中,messages日志文件中报错信息;
  3. clustat命令显示双机节点及服务状态正常。

024:群集服务切换到备机
  1. 如果主机服务异常,且通过重启主机服务进程亦无法恢复,那么可以将服务切换到备机:

redhat 6

#clusvcadm –r test_svc -m host2

将服务test_svc切换到主机host2上运行

redhat7

pcs cluster standby node1

将node1上的资源切换到主机node2上运行

pcs cluster unstandby node1

  1. 查看日志:tail -f /var/log/messages
  2. clustat/pcs status命令显示双机节点及服务状态正常。​​​​​​​
  3. 命令执行成功,双机节点正常切换;
  4. 切换过程中,messages日志文件中报错信息;
  5. clustat/pcs status命令显示双机节点及服务状态正常
025:关闭主机群集服务
  1. 如果RHCS集群环境中,主、备机均无法正常提供服务,那么可以手工启动或是冷备机的方式恢复服务,但在这之前需要先关闭集群中的服务进程:

#clusvcadm –s test_svc –m host2

redhat6

在两个节点执行同时进行操作

service rgmanager stop

service clvmd stop

service cman stop

redhat7

pcs cluster disable --all

  1. 执行clustat命令查看服务关闭情况;clustat 命令不存在
  2. 使用df、ping、”ip addr list”命令,确认群集共享资源已释放;
  3. 查看日志:tail -f /var/log/messages;
    1. 群集Service正常关闭;
    2. 群集共享资源已释放;
    3. 系统日志无报错;
    4. 群集各节点Cluster服务关闭;

 

026:手工恢复群集服务
  1. 在停止RHCS服务后,可按照以下步骤手工挂载资源,并启动服务:

网络IP地址:使用ifconfig命令,修改服务地址;

存储空间:

vgscan 扫描可用卷组;

vgdisplay 查看卷组信息;

importvg VG_NAME 导入卷组信息;

vgchange -ay VG_NAME 激活卷组;

lvscan 识别lv;

如果上述操作中,卷组无法在单机激活,则有可能是在/etc/lvm/lvm.conf中配置了volume_list和locking_type限制,只有带有相应TAG标签的卷组才能在相应主机激活,可按如下操作验证并调整:

#vgs -o +vg_tags 查看卷组标签信息

#vgchange -addtag `hostname` 共享_VG_NAME

#vgs -o +vg_tags 验证卷组标签是否已经添加】

文件系统:根据lvscan信息,mount相关文件系统;

配置文件:检查/etc/passwd,/etc/hosts,/etc/services等配置文件是否正常;

检测数据库配置信息完备,尝试启动数据库(其间注意观察数据库日志信息);

应用服务:根据应用服务启动顺序,启动各项应用服务。

  1. 查看日志:tail -f /var/log/messages
    1. 手工添加Service IP;
    2. 卷组可以正常在单机激活;
    3. lv信息正常;
    4. 在单机手工挂载共享存储资源;
    5. 启动数据库及应用。

 

027:群集服务冻结和解冻

redhat6

clusvcadm -Z 资源名字

redhat7

pcs status

pcs cluster standby node1(没有资源的节点)

pcs resource unmanager service (如果两个节点都有资源)

2) 解冻

redhat6

clusvcadm -U 资源名字

应用服务:根据应用服务启动顺序,启动各项应用服务。

  1. 查看日志:tail -f /var/log/messages
    1. 手工添加Service IP;
    2. 卷组可以正常在单机激活;
    3. lv信息正常;
    4. 在单机手工挂载共享存储资源;
    5. 启动数据库及应用。

相关文章:

linux 故障处置通用流程-36计-14-27

014&#xff1a;查看系统主要日志 查看以下日志&#xff1a; 主要查以下关键字 error/NIC/fs /"link down"/Oout of memory" /var/log/messages /var/log/dmesg 015&#xff1a;主机通讯是否延迟 执行命令&#xff1a; #ping 网关_IP #ping 关联主机_IP ​​​​…...

https和http有什么区别-http各个版本有什么区别

http和 https的区别 HTTP&#xff08;超文本传输协议&#xff09;和 HTTPS&#xff08;安全超文本传输协议&#xff09;是两种用于在网络上传输数据的协议&#xff0c;它们的主要区别在于安全性&#xff1a; HTTP&#xff08;Hypertext Transfer Protocol&#xff09;&#x…...

基于回归算法的心理健康预测(EDA + 预测)

心理健康涵盖情感、心理与社会福祉&#xff0c;影响认知、情绪和行为模式&#xff0c;决定压力应对、人际交往及健康决策&#xff0c;且在生命各阶段&#xff08;从童年至成年&#xff09;均至关重要。心理健康与身体健康同为整体健康的核心要素&#xff1a;抑郁会增加糖尿病、…...

React Native开发鸿蒙运动健康类应用的项目实践记录

​​项目名称​​&#xff1a;HarmonyFitness - 基于React Native的鸿蒙运动健康应用 ​​技术栈​​&#xff1a;React Native 0.72.5 TypeScript HarmonyOS API ArkTS原生模块 一、环境搭建与项目初始化 ​​双环境配置​​ ​​React Native环境​​&#xff1a; npx re…...

【新品解读】一板多能,AXRF49 定义新一代 RFSoC FPGA 开发平台

“硬件系统庞杂、调试周期长” “高频模拟前端不稳定&#xff0c;影响采样精度” “接收和发射链路难以同步&#xff0c;难以扩展更多通道” “数据流量大&#xff0c;处理与存储跟不上” 这些是大部分客户在构建多通道、高频宽的射频采样链路时&#xff0c;面临的主要问题。…...

贪心算法应用:线性规划贪心舍入问题详解

贪心算法应用&#xff1a;线性规划贪心舍入问题详解 贪心算法是一种在每一步选择中都采取当前状态下最优的选择&#xff0c;从而希望导致结果是全局最优的算法策略。在线性规划问题中&#xff0c;贪心算法特别是贪心舍入技术有着广泛的应用。下面我将全面详细地讲解这一主题。…...

YOLO在C#中的完整训练、验证与部署方案

YOLO在C#中的完整训练、验证与部署方案 C# 在 YOLO 部署上优势明显&#xff08;高性能、易集成&#xff09;&#xff0c;但训练能力较弱&#xff0c;通常需结合 Python 实现。若项目对开发效率要求高且不依赖 C# 生态&#xff0c;建议全程使用 Python&#xff1b;若需深度集成…...

洛谷题目:P2761 软件补丁问题 (本题简单)

个人介绍: 题目传送门: P2761 软件补丁问题 - 洛谷 (luogu.com.cn) 前言: 这道题是一个典型的状态搜索问题,核心目标就是利用给定d额多个补丁程序,将包含若干错误的软件修复成没有错误的状态,并且要使得修复过程当中的总耗时最少。下面是小亦为大家阐述滴思路: 1、状态…...

智慧园区数字孪生全链交付方案:降本增效30%,多案例实践驱动全周期交付

在智慧园区建设浪潮中&#xff0c;数字孪生技术正成为破解传统园区管理难题的核心引擎。通过构建与物理园区1:1映射的数字模型&#xff0c;实现数据集成、状态同步与智能决策&#xff0c;智慧园区数字孪生全链交付方案已在多个项目中验证其降本增效价值——某物流园区通过该方案…...

【OpenGL学习】(四)统一着色和插值着色

文章目录 【OpenGL学习】&#xff08;四&#xff09;统一着色和插值着色统一着色&#xff08;Flat/Uniform Shading&#xff09;插值着色&#xff08;Interpolated Shading&#xff09; 【OpenGL学习】&#xff08;四&#xff09;统一着色和插值着色 着色器介绍&#xff1a; h…...

42、响应处理-【源码分析】-浏览器与PostMan内容协商完全适配

42、响应处理源码分析浏览器与PostMan内容协商完全适配 要实现浏览器与PostMan在内容协商上的完全适配&#xff0c;需要在Spring Boot应用中自定义内容协商策略&#xff0c;确保服务器能根据浏览器和PostMan的请求头正确返回合适格式的数据。以下是详细的步骤&#xff1a; ### …...

在 CentOS 上安装 Docker 和 Docker Compose 并配置使用国内镜像源

在 CentOS 上安装 Docker 和 Docker Compose 并配置使用国内镜像源&#xff0c;可以加速镜像下载速度。以下是详细的步骤&#xff1a; 一、安装 Docker 移除旧版本的 Docker&#xff08;如果有&#xff09;&#xff1a; sudo yum remove docker \docker-client \docker-client…...

Java Lambda表达式深度解析:从入门到实战

简介 Lambda表达式是Java 8引入的最重要特性之一,它极大地简化了Java代码的编写方式,使函数式编程风格在Java中成为可能。本文将全面介绍Lambda表达式的概念、语法、应用场景以及与相关特性的配合使用,帮助开发者掌握这一强大的编程工具。 一、Lambda表达式基础 1.1 什么…...

Docker慢慢学

1、Docker DeskTop 2、N8N下载 docker run -p 8888:5678 n8nio/n8n 3、Kafka kafka依赖zookeeper,先启动zookeeper docker pull zookeeper docker run -d --name zookeeper -p 2181:2181 -e ALLOW_ANONYMOUS_LOGINyes zookeeper 启动kafka docker pull confluentinc/cp…...

cursor-free-vip使用

一、项目简介 Cursor-Free-VIP 是一个开源项目&#xff0c;旨在帮助用户免费使用 Cursor AI 的高级功能。它通过自动注册 Cursor 账号、重置机器 ID 和完成 Auth 验证等操作&#xff0c;解决 Cursor AI 中常见的限制提示。 二、系统准备 1…cursor需要更新到最新的版本 三、…...

使用SSH tunnel访问内网的MySQL

文章目录 环境背景方法参考 注&#xff1a;本文是使用SSH tunnel做端口转发的一个示例。有关SSH端口转发&#xff0c;可参考我的几篇文档 https://blog.csdn.net/duke_ding2/article/details/106878081https://blog.csdn.net/duke_ding2/article/details/135627263https://blo…...

Redis持久化模式RDB与AOF

RDB持久化 RDB也被叫做Redis数据快照。简单来说就是把内存中的所有数据记录到磁盘中。当Redis实例故障重启后重磁盘中读取快照文件进行数据恢复(快照文件默认保存在当前运行目录)&#xff1b; 演示Redis正常停机自动执行一次RDB操作 配置Redis触发RDB机制 RDB其它配置也可在red…...

【JS进阶】ES5 实现继承的几种方式

ES5 实现继承的几种方式 1. 原型链继承&#xff08;Prototype Chaining&#xff09; function Parent(name) {this.name name || Parent;this.colors [red, blue]; }Parent.prototype.sayName function() {console.log(this.name); };function Child() {}// 关键&#xff…...

【数据结构】树形结构--二叉树(二)

【数据结构】树形结构--二叉树&#xff08;二&#xff09; 一.二叉树的实现1.求二叉树结点的个数2.求二叉树叶子结点的个数3.求二叉树第k层结点的个数4.求二叉树的深度&#xff08;高度&#xff09;5.在二叉树中查找值为x的结点6.判断二叉树是否为完全二叉树7.二叉树的销毁 一.…...

JavaScript性能优化实战:深入探讨JavaScript性能瓶颈与优化技巧

引言:为什么JavaScript性能至关重要 在现代Web开发中,JavaScript已成为构建交互式应用程序的核心技术。随着单页应用(SPA)和复杂前端架构的普及,JavaScript代码的性能直接影响用户体验、转化率甚至搜索引擎排名。研究表明,页面加载时间每增加1秒,转化率可能下降7%,而性能…...

在 CentOS 上将 Ansible 项目推送到 GitHub 的完整指南

1. 安装 Git 在 CentOS 中使用 yum 安装 Git&#xff0c;Git 是管理代码版本控制的工具&#xff1a; sudo yum install git -y 2. 配置 Git 用户信息 设置你的 Git 用户名和邮箱&#xff0c;这些信息会出现在你每次提交的记录中&#xff1a; git config --global user.nam…...

深度学习题目1

梯度下降法的正确步骤是什么&#xff1f; a.计算预测值和真实值之间的误差 b.重复迭代&#xff0c;直至得到网络权重的最佳值 c.把输入传入网络&#xff0c;得到输出值 d.用随机值初始化权重和偏差 e.对每一个产生误差的神经元&#xff0c;调整相应的&#xff08;权重&#xff…...

Spring @Scheduled vs XXL-JOB vs DolphinScheduler vs Airflow:任务调度框架全景对比

引言 从单机定时任务到分布式工作流调度&#xff0c;不同场景需要选择匹配的调度框架。 本文对比 Spring Scheduled、XXL-JOB、DolphinScheduler &#xff08;海豚调度器&#xff09;和 Apache Airflow 的核心差异&#xff0c;助你避免过度设计或功能不足。 一、核心定位与适用…...

【Oracle】锁

个人主页&#xff1a;Guiat 归属专栏&#xff1a;Oracle 文章目录 1. 锁基础概述1.1 锁的概念与作用1.2 锁的工作原理1.3 Oracle锁的分类 2. 行级锁 (Row-Level Locks)2.1 行级锁的基本概念2.1.1 TX锁&#xff08;事务锁&#xff09;2.1.2 行级锁的工作机制 2.2 行级锁的类型2.…...

共识算法Raft系列(1)——什么是Raft?

Raft 算法是一种分布式一致性算法&#xff0c;由 Diego Ongaro 和 John Ousterhout 在 2014 年提出&#xff0c;旨在解决 Paxos 算法复杂且难以理解的问题。Raft 设计目标是易于理解和实现&#xff0c;同时提供强一致性&#xff08;CAP 中的 CP 系统&#xff09;&#xff0c;广…...

JS逆向爬虫教程与实战技巧

想要一个关于爬虫JS逆向的详细教程。这是一个很专业的技术需求&#xff0c;最近有个可能是正在学习爬虫技术的开发者或者数据分析师&#xff0c;遇到了需要破解JavaScript加密的反爬机制的问题&#xff0c;想让我出一期实战教程&#xff0c;话不多说&#xff0c;开干。 以下是我…...

Neovim - LSP 底层原理,难点配置(二)

Neovim LSP 的工作原理 基本概念 LSP(Language Server Protocol)可以理解成是一个"语言助手"。每种编程语言都有自己的"语言助手"(比如 TypeScript 的 tsserver),这些助手能告诉你: 哪写错了(语法错误)哪能跳转(方法定义,引用)哪可以补全(自…...

【Redis】Redis 的常见客户端汇总

目录 一、命令行客户端 二、图形界面的客户端 三、Java 客户端 3.1 SpringDataRedis 3.2 Jedis 3.2.1 连接池的配置 3.3 Lettuce 3.3.1 RedisTemplate 工具类实现 3.3.2 自定义序列化器 3.3.3 StringRedisTemplate 3.3.4 集群配置 3.3.4.1 刷新节点集群拓扑动态感应…...

关于akka官方quickstart示例程序(scala)的记录

参考资料 https://doc.akka.io/libraries/akka-core/current/typed/actors.html#first-example 关于scala语法的注意事项 extends App是个语法糖&#xff0c;等同于直接在伴生对象中编写main 方法对象是通过apply方法创建的&#xff0c;也可以通过对象的名称单独创建&#x…...

2025年渗透测试面试题总结-腾讯[实习]玄武实验室-安全工程师(题目+回答)

安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 腾讯[实习]玄武实验室-安全工程师 1. 自我介绍 2. CSRF原理 3. Web安全入门时间 4. 学习Web安全的原因 …...