当前位置: 首页 > article >正文

1、MySQL故障排查与运维案例

MySQL故障排查与运维案例全集一、连接类故障1. 连接超时现象ERROR 2003 (HY000): Cant connect to MySQL server on host (110 Connection timed out)排查流程# 检查网络连通性nc-zvhost3306mtrhost# 检查防火墙iptables-L-n|grep3306# 验证连接数限制SHOW VARIABLES LIKEmax_connections;SHOW STATUS LIKEThreads_connected;2. 认证失败案例升级后密码策略变更导致应用连接失败解决方案-- 创建传统认证用户CREATEUSERappuser%IDENTIFIEDWITHmysql_native_passwordBYpassword;-- 临时降低密码强度SETGLOBALvalidate_password_policyLOW;二、性能类故障1. CPU 100%问题诊断步骤-- 查找高消耗SQLSELECT*FROMsys.processlistWHERECOMMAND!SleepORDERBYTIMEDESC;-- 使用Performance SchemaSELECT*FROMperformance_schema.threadsWHEREPROCESSLIST_TIME60\G-- 分析慢查询SHOWENGINEINNODBSTATUS;2. 慢查询优化案例场景订单查询超时调优方案-- 添加复合索引ALTERTABLEordersADDINDEXidx_customer_status(customer_id,status);-- 重写查询语句SELECT/* INDEX(idx_customer_status) */*FROMordersWHEREcustomer_id123ANDstatusIN(shipped,completed);三、复制类故障1. 主从数据不一致检测工具# 安装校验工具wgethttps://downloads.percona.com/downloads/percona-toolkit/3.5.0/binary/tarball/percona-toolkit-3.5.0_x86_64.tar.gz# 数据一致性校验pt-table-checksum-hmaster-uuser-ppass--databasesmydb2. 主从延迟优化方案# my.cnf 优化 [mysqld] slave_parallel_workers 8 slave_pending_jobs_size_max 2G innodb_flush_log_at_trx_commit 0 sync_binlog 1000四、数据恢复类1. 误删除恢复步骤# 停止MySQL服务systemctl stop mysqld# 使用mysqlbinlog恢复mysqlbinlog --start-position107/var/log/mysql-bin.000001|mysql-uroot-p# 使用延时从库恢复STOP SLAVE;CHANGE MASTER TO MASTER_DELAY3600;START SLAVE;2. 分区表数据丢失案例DROP PARTITION误操作解决方案-- 从备份恢复单分区ALTERTABLElogsIMPORTPARTITIONp202301FROM/backup/202301_partition.ibd;五、高可用故障1. MHA切换失败诊断流程# 检查SSH互信masterha_check_ssh--conf/etc/mha/app1.cnf# 检查复制健康masterha_check_repl--conf/etc/mha/app1.cnf# 查看管理日志tail-f/var/log/masterha/app1/manager.log2. InnoDB Cluster脑裂修复方案-- 强制重启集群dba.rebootClusterFromCompleteOutage(cluster1);-- 人工重新组集群SELECT*FROMperformance_schema.replication_group_members;六、存储引擎故障1. InnoDB损坏修复修复步骤# 强制恢复模式启动innodb_force_recovery6# 导出数据mysqldump-uroot-p--all-databasesfull_backup.sql# 重建数据库mysql_install_db--usermysql systemctl start mysqld mysql-uroot-pfull_backup.sql七、内存问题1. OOM崩溃优化方案# my.cnf内存优化 [mysqld] innodb_buffer_pool_size64G key_buffer_size0 query_cache_size0 table_open_cache20000八、安全相关1. 入侵检测处理流程-- 查找异常账号SELECT*FROMmysql.userWHEREauthentication_string\G-- 检查数据库文件权限ls-l/var/lib/mysql-- 审计可疑操作mysqlbinlog/var/log/mysql-bin.000007|grep-iALTER\|CREATE\|DROP九、备份恢复1. 大库备份优化# Xtrabackup部分备份xtrabackup--backup--databasesdb1 db2--target-dir/backup/partial# mysqldump分片备份mysqldump-uroot-pdb1|split-b2G - db1_part_十、升级问题1. 5.7升级8.0兼容问题解决方案-- 开启兼容SQL模式SETGLOBALsql_modeNO_ENGINE_SUBSTITUTION;-- 移除废弃功能ALTERTABLEmytable ROW_FORMATDYNAMIC;十一、配置错误1. 参数误设置恢复方法# 安全模式启动高版本中不可用mysqld_safe --skip-grant-tables --skip-networking# 重置配置SET GLOBALmax_connections100;FLUSH PRIVILEGES;十二、工具速查表工具名称使用场景命令示例pt-query-digest慢日志分析pt-query-digest slow.log report.txtmysqladmin进程管理mysqladmin -u root -p processlistPercona Toolkit运维工具包pt-online-schema-changeMylogger实时审计mylogger -u root -p pass -h localhostMySQL ShellInnoDB Cluster管理dba.checkInstanceConfiguration()十三、关键监控指标指标报警阈值获取方式连接使用率 85%Threads_connected/max_connections复制延迟(秒) 60SHOW SLAVE STATUSInnoDB缓冲池命中率 95%(1 - Innodb_pages_read/Innodb_buffer_pool_read_requests)*100临时表磁盘使用 1GCreated_tmp_disk_tables锁等待时间(秒) 5SHOW ENGINE INNODB STATUS十四、灾难恢复流程立即停止服务systemctl stop mysqld保护现场拷贝数据目录和日志文件评估损坏innochecksum-v/var/lib/mysql/ibdata1 mysqlcheck --all-databases选择恢复方案从主备份恢复使用Binlog增量恢复重建数据库结构验证完整性pt-table-checksum灰度恢复服务十五、最佳实践总结备份策略每天全备 Binlog实时同步备份恢复演练每月一次高可用架构半同步复制应用ProxySQLPrimaryReplica1Replica2Secondary参数调优原则buffer_pool_size 系统内存的70-80%max_connections (最大连接数冗余)sync_binlog 1 (数据安全) / 1000 (性能优先)安全基线禁用local-infile删除test数据库启用SSL连接审计插件开启黄金准则任何参数修改前进行SET GLOBAL测试维护窗口操作必须有回滚计划生产环境变更遵循变更三板斧方案评审-灰度实施-结果验证

相关文章:

1、MySQL故障排查与运维案例

MySQL故障排查与运维案例全集 一、连接类故障 1. 连接超时 现象:ERROR 2003 (HY000): Cant connect to MySQL server on host (110 "Connection timed out") 排查流程: # 检查网络连通性 nc -zv host 3306 mtr host# 检查防火墙 iptables -L -…...

Windows Server 2019开启SSH服务踩坑全记录:从PowerShell命令到防火墙规则,一篇搞定

Windows Server 2019 SSH服务部署终极指南:从零构建到企业级安全配置 当我们需要在Windows Server环境中实现安全高效的远程管理时,SSH服务已经成为现代运维体系中不可或缺的一环。不同于传统的RDP远程桌面,SSH提供了更轻量级、更安全的命令行…...

手把手教你用Python玩转CALCE锂电池数据集:从数据清洗到LSTM/Transformer模型实战

手把手教你用Python玩转CALCE锂电池数据集:从数据清洗到LSTM/Transformer模型实战 锂电池作为新能源领域的核心组件,其剩余寿命预测一直是工业界和学术界的研究热点。CALCE数据集作为马里兰大学发布的权威锂电池老化数据,包含了多组电池在不同…...

LVGUI图片资源管理新思路:用NXP GUI Guider一键生成合并bin文件,告别手动算地址

LVGUI图片资源管理新思路:用NXP GUI Guider一键生成&合并bin文件,告别手动算地址 在嵌入式GUI开发中,图片资源管理一直是个让人头疼的问题。特别是当项目需要大量高分辨率图片时,如何高效地将这些资源存储到外部Nor Flash并正…...

PotPlayer字幕翻译神器:打破语言壁垒,畅享全球影音盛宴

PotPlayer字幕翻译神器:打破语言壁垒,畅享全球影音盛宴 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为外…...

告别模糊坐标!自定义你的MATLAB Figure数据提示(DataTip)显示格式

告别模糊坐标!自定义你的MATLAB Figure数据提示(DataTip)显示格式 在科研数据可视化过程中,精确呈现坐标信息往往比我们想象的更重要。想象这样一个场景:你正在分析一组高频采样数据,当鼠标悬停在某个峰值点…...

ArcGIS插件开发实战:用Python打造你的第一个自定义工具(附完整代码)

ArcGIS插件开发实战:用Python打造你的第一个自定义工具(附完整代码) 在GIS领域,ArcGIS作为行业标杆软件,其强大的可扩展性一直备受开发者青睐。想象一下,当你面对重复性操作时,不再需要一遍遍点…...

告别死记硬背:用TensorFlow和tf_geometric实战GraphSAGE,搞定蛋白质网络节点分类

蛋白质网络节点分类实战:用TensorFlow和tf_geometric实现GraphSAGE 在生物信息学领域,蛋白质相互作用网络(PPI)的分析一直是研究热点。传统方法往往需要依赖复杂的特征工程,而图神经网络(GNN)的出现为我们提供了一种端到端的解决方案。本文将…...

Python脚本清理VS重装残留:手把手教你用win32api批量删除注册表垃圾项

Python脚本清理VS重装残留:手把手教你用win32api批量删除注册表垃圾项 开发者在Windows平台上重装Visual Studio时,经常会遇到各种莫名其妙的错误。这些问题的根源往往在于注册表中残留的旧配置项。手动清理不仅效率低下,还容易遗漏关键项。本…...

Exploring Hallucination in Large Language Models: Causes, Detection, and Mitigation Strategies

1. 大语言模型幻觉现象的本质与分类 当你向ChatGPT询问"第一个登月的人是谁",它却回答"1951年的查尔斯林德伯格"——这个明显违背常识的答案就是典型的大语言模型幻觉。这种现象就像AI的"创造性谎言",模型会生成看似合理但…...

FreeRTOS下网卡驱动‘零拷贝’改造初探:解决GD32F470 Ping 17包就超时的性能瓶颈

FreeRTOS下GD32F470网卡驱动零拷贝优化实战:突破Ping 17包超时瓶颈 当GD32F470平台运行FreeRTOSlwIP协议栈时,开发者常会遇到一个诡异现象:连续Ping测试中,每17个数据包就会出现一次超时。这种周期性性能瓶颈往往暴露了传统网卡驱…...

5种方法快速判断你的Linux系统是ARM还是x86(附命令详解)

5种方法快速判断你的Linux系统是ARM还是x86(附命令详解) 在Linux系统管理和开发过程中,了解当前系统的CPU架构至关重要。无论是安装软件、部署服务还是调试程序,不同架构(ARM/x86)的系统可能需要完全不同的…...

fpga 以太网w5500 SPI传输80MHz FPGA verilog TCP客户端驱动源码

fpga 以太网w5500 SPI传输80MHz FPGA verilog TCP客户端驱动源码,8个SOCKET都可用,SPI频率80MHZ,硬件验证以通过 。 w5500 ip 核 w5500 软核,还有TCP服务端和UDP模式,联系联系我要那个,默认发TCP客户端。 这个代码是用…...

DX-BT24蓝牙模块实战:从AT指令到手机透传的完整指南

1. 认识DX-BT24蓝牙模块 第一次拿到DX-BT24蓝牙模块时,我完全被它的小巧震惊了——只有拇指大小的板子,居然能实现完整的蓝牙5.1通信功能。这个由大夏龙雀科技推出的模块,最大的特点就是内置了标准串口协议,让开发者可以像操作普通…...

网络工程-VLAN变种

MUX VLAN 概述 应用典型场景:在企业网络中,1.企业员工和企业客户可以访问企业的服务器。对于企业来说,2.希望企业内部员工之间可以互相交流,而3.企业客户之间是隔离的,不能够互相访问。 普通VLAN技术应用局限&#…...

华为OD机试 - FLASH坏块监测系统 - 并查集(Java 新系统 200分)

华为OD机试 新系统 题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适…...

告别固定邻居!用DeGCN的可变形卷积思想,让GCN在骨架行为识别里‘活’起来

可变形图卷积:让骨架行为识别模型学会"动态思考" 在咖啡厅里,两位工程师正盯着笔记本电脑屏幕上的骨架动作数据争论不休。"你看这个挥手动作,传统GCN对所有关节一视同仁地处理,但明明只有手臂在动啊!&q…...

高通平台Sensor驱动移植避坑指南:从BMI160实战到SEE架构解析

高通平台Sensor驱动移植实战:从BMI160配置到SEE架构深度解析 在移动设备开发领域,传感器驱动移植是BSP工程师的必修课。当拿到一款新传感器,如何快速完成从硬件对接到系统集成的全流程?本文将以BMI160六轴惯性传感器为例&#xff…...

SFUD串行Flash通用驱动库原理与嵌入式移植实战

1. SFUD 串行 Flash 通用驱动库深度解析1.1 库定位与工程价值SFUD(Serial Flash Universal Driver)并非一个简单的 SPI Flash 封装层,而是一个面向嵌入式产品全生命周期的底层固件基础设施。其核心价值在于解耦硬件选型与软件实现——当 Winb…...

从零到一:基于Qwen2.5-VL-7B-Instruct构建专属多目标检测模型

1. 环境准备与模型下载 第一次接触Qwen2.5-VL-7B-Instruct这类大模型时,最让人头疼的就是环境配置。我刚开始搭建环境时,光是版本兼容问题就折腾了大半天。后来发现用清华源安装确实能省不少时间,这里分享下我的完整配置流程。 先确保你的机器…...

用Matlab Robotics Toolbox搞定UR5机械臂建模与仿真:从DH参数到可视化(附完整代码)

用Matlab Robotics Toolbox实现UR5机械臂建模与运动控制全流程实战 在工业自动化和机器人研究领域,UR5协作机械臂因其卓越的灵活性和安全性成为学术界和工业界的宠儿。本文将带您深入探索如何利用Matlab Robotics Toolbox这一强大工具,从零开始构建UR5机…...

FastAPI子应用挂载:别再让root_path坑你一夜闭

Julia(julialang.org)由Stefan Karpinski、Jeff Bezanson等在2009年创建,目标是融合Python的易用性、C的高性能、R的统计能力、Matlab的科学计算生态。 其核心设计哲学是: 高性能:编译型语言(JIT&#xff0…...

用Grad-CAM破解YOLOv8黑箱:为什么你的模型总认错物体?(案例演示)

用Grad-CAM破解YOLOv8黑箱:为什么你的模型总认错物体?(案例演示) 当你的YOLOv8模型将哈士奇误判为狼,或是把路灯识别成行人时,问题的根源往往藏在卷积神经网络那些不可见的注意力分布中。本文将通过三个典型…...

higress 这个中登才是AI时代的心头好捍

核心摘要:这篇文章能帮你 ?? 1. 彻底搞懂条件分支与循环的适用场景,告别选择困难。 ?? 2. 掌握遍历DOM集合修改属性的标准姿势与性能窍门。 ?? 3. 识别流程控制中的常见“坑”,并学会如何优雅地绕过去。 ?? 主要内容脉络 ?? 一…...

为什么你的微调效果总差2个点?——大模型清洗中被低估的语义重复剔除术

第一章:大模型工程化中的数据去重与清洗 2026奇点智能技术大会(https://ml-summit.org) 数据质量是大模型性能的底层基石。未经治理的原始语料库往往包含大量重复样本、低信息熵文本、噪声片段及跨文档镜像内容,直接训练将导致模型收敛缓慢、记忆偏差放…...

HagiCode Soul 平台技术解析:从需求萌发到独立平台的演进之路涣

1 安装与初始化 # 全局安装 OpenSpec npm install -g fission-ai/openspeclatest # 在项目目录下初始化 cd /path/to/your-project openspec init 初始化时,OpenSpec 会提示你选择使用的 AI 工具(Claude Code、Cursor、Trae、Qoder 等)。 3 O…...

大模型水印不是加个logo!揭秘Transformer层粒度嵌入、梯度掩码与语义一致性校验三重防御体系

第一章:大模型工程化中的模型水印技术 2026奇点智能技术大会(https://ml-summit.org) 在大模型规模化部署与商业化落地过程中,模型水印技术已成为保障知识产权、追踪非法复用、防范模型窃取的关键工程能力。不同于传统数字水印嵌入媒体内容&#xff0c…...

LeetCode 删除无效的括号:python 题解恳

这个代码的核心功能是:基于输入词的长度动态选择反义词示例,并调用大模型生成反义词,体现了 “动态少样本提示(Dynamic Few-Shot Prompting)” 与 “上下文长度感知的示例选择” 的能力。 from langchain.prompts impo…...

扁率和椭率详解

扁率和椭率详解 引言 在几何学、地球科学、天文学等领域,扁率和椭率是两个非常重要的概念。它们描述了几何体(尤其是旋转椭球体)的形状特征,对于理解地球形状、天体运动以及各种工程应用都具有重要意义。本文将深入探讨扁率和椭率的概念、定义、数学推导、应用场景以及使…...

告别海量标注!用SG-One的Masked Average Pooling,一个样本就能搞定图像分割

小样本图像分割实战:SG-One的Masked Average Pooling核心解析与PyTorch实现 当标注数据稀缺成为计算机视觉项目的常态时,传统分割方法往往陷入"巧妇难为无米之炊"的困境。SG-One提出的Masked Average Pooling技术,正在改变这一局面…...