当前位置: 首页 > article >正文

当你的服务器卡顿或报‘Too many open files’时,用这5个命令快速定位limits.conf瓶颈

当服务器卡顿或报‘Too many open files’时用这5个命令快速定位limits.conf瓶颈遇到服务器突然响应变慢或者日志中频繁出现Too many open files错误时很多运维人员的第一反应是重启服务。但作为经历过多次类似故障的老兵我想分享一套更精准的排查方法——不需要重启就能快速定位问题根源。上周我们一个核心服务突然出现性能下降就是靠这套方法在3分钟内找到了症结所在。1. 快速诊断确认是否真的遇到文件描述符限制当服务器出现异常时第一步永远是确认问题方向。很多人一看到Too many open files就直奔limits.conf修改配置这其实是个误区。我们需要先验证系统是否真的达到了文件描述符限制。1.1 查看当前会话的资源限制ulimit -n这个命令会显示当前会话允许打开的最大文件数。但要注意这个值可能因用户、会话类型SSH、cron等而不同。更全面的查看方式是ulimit -a重点关注open files (-n)这一行。在我的一个生产环境中曾经出现过默认值只有1024的情况而实际业务需要打开上万个文件。1.2 检查系统级文件描述符使用情况cat /proc/sys/fs/file-nr输出示例1184 0 1610170这三个数字分别表示已分配且正在使用的文件描述符数量已分配但未使用的文件描述符数量现代内核通常为0系统最大允许的文件描述符数量关键判断点当第一个数字接近第三个数字时说明系统整体文件描述符资源即将耗尽。2. 定位问题进程谁在消耗文件描述符确认系统确实面临文件描述符限制后下一步是找出具体的罪魁祸首。2.1 查看各进程打开的文件数排名lsof -n | awk {print $2} | sort | uniq -c | sort -nr | head -10这个命令组合会显示打开文件最多的前10个进程。输出类似9838 488 279 150 96 58第一列是打开的文件数第二列是进程ID。上周我们遇到的案例中一个Java应用竟然打开了近万个文件远超预期。2.2 深入分析特定进程找到可疑进程后进一步检查它打开的具体文件lsof -p PID | head -20这个命令会显示该进程打开的前20个文件。常见问题模式包括大量日志文件未关闭数据库连接泄漏临时文件堆积记得加上head -20限制输出否则可能因为输出太多导致终端卡死。3. 动态调整与临时解决方案在找到根本原因前可以先临时缓解问题。3.1 临时提高进程限制对于已经运行的进程可以动态调整其限制需要root权限prlimit --pid PID --nofile65535:65535这个命令会将指定进程的文件描述符限制提高到65535。但要注意这不会影响已经打开的文件新创建的进程不会继承这个设置3.2 紧急释放已打开的文件如果确定某些文件可以安全关闭可以使用gdb -p PID -batch -ex call close(fd)警告这个方法极其危险可能导致数据损坏或程序崩溃仅应在测试环境或万不得已时使用。4. 永久解决方案合理配置limits.conf临时措施只是权宜之计长期解决方案还是正确配置系统限制。4.1 典型limits.conf配置示例* soft nofile 65535 * hard nofile 65535 root soft nofile 65535 root hard nofile 65535这个配置表示对所有用户(*)设置软硬限制为65535特别为root用户设置相同限制4.2 配置生效的关键细节修改limits.conf后很多人发现设置不生效原因通常是未正确注销登录SSH会话需要完全退出后重新登录服务未重启系统服务需要重新加载配置PAM配置问题检查/etc/pam.d/相关配置是否包含pam_limits.so一个验证配置是否生效的可靠方法su - username -c ulimit -n5. 进阶排查当常规方法失效时有时候问题比表面看起来更复杂需要更深入的排查手段。5.1 检查系统级全局限制sysctl fs.file-max如果这个值太小比如默认的几万在高并发环境下可能成为瓶颈。可以临时调整sysctl -w fs.file-max1000000永久生效需要写入/etc/sysctl.conf。5.2 监控文件描述符使用趋势使用这个命令可以持续观察文件描述符使用情况watch -n 1 cat /proc/sys/fs/file-nr结合业务日志时间点可以精确定位文件描述符激增的具体操作。5.3 内核参数调优建议对于高并发服务这些内核参数也值得关注参数描述推荐值fs.nr_open单个进程最大文件数1048576fs.file-max系统最大文件数根据内存调整net.core.somaxconnTCP连接队列大小65535修改这些参数需要根据服务器实际内存和负载情况谨慎调整。

相关文章:

当你的服务器卡顿或报‘Too many open files’时,用这5个命令快速定位limits.conf瓶颈

当服务器卡顿或报‘Too many open files’时,用这5个命令快速定位limits.conf瓶颈 遇到服务器突然响应变慢,或者日志中频繁出现"Too many open files"错误时,很多运维人员的第一反应是重启服务。但作为经历过多次类似故障的老兵&am…...

Arm Cortex-A75错误记录寄存器架构与RAS机制解析

1. Cortex-A75错误记录寄存器架构解析 在Arm Cortex-A75处理器架构中,错误记录寄存器(Error Record Registers)构成了可靠性、可用性和可维护性(RAS)功能的核心基础设施。这套机制通过专用寄存器组捕获和分类硬件运行时错误,为系统级错误诊断提供硬件支持…...

shell命令和linux命令的区别

shell命令和linux命令的区别:shell是运行在Linux系统上的一个脚本语言,是一个用C语言编写的程序,而linux命令是对linux系统进行管理的命令。shell可以重复或批量地进行一些命令,也可以把重复执行的命令写到脚本里面执行,而linux命…...

技术博客如何避免失效?从硬件设计领域谈内容战略与可持续运营

1. 从“讽刺”到“失效”:一个技术博客的生存启示录朋友给我发了一封邮件,里面是一堆反映生活小讽刺的图片。有些真的很好笑,有些则带点伤感,还有一些会让你在看到那些无意的并置后忍不住倒吸一口凉气——我能想象自己也会干出类似…...

基于MCP协议实现本地ERP与AI助手安全集成:以Subiekt GT为例

1. 项目概述:当波兰ERP遇上AI助手如果你在波兰经营一家中小型企业,或者为这样的企业提供IT服务,那么“Subiekt GT”这个名字对你来说一定不陌生。作为InsERT公司旗下最受欢迎的桌面版ERP系统,它几乎是波兰本土商贸、服务行业财务和…...

SAP BW的一些点/常用命令

这是角色需要,字段不用1.请求号:在单子那里创建请求,请求号,此前单子相关数据需要修改;2.用这个请求号,到PFCG角色维护开发,生成参数文件,包入前面的定制请求传输(返回到…...

containers-from-scratch性能优化:容器启动速度提升的5个关键点

containers-from-scratch性能优化:容器启动速度提升的5个关键点 【免费下载链接】containers-from-scratch Writing a container in a few lines of Go code, as seen at DockerCon 2017 and on OReilly Safari 项目地址: https://gitcode.com/gh_mirrors/co/cont…...

LogCabin数据模型揭秘:Tree结构在分布式存储中的应用

LogCabin数据模型揭秘:Tree结构在分布式存储中的应用 【免费下载链接】logcabin LogCabin is a distributed storage system built on Raft that provides a small amount of highly replicated, consistent storage. It is a reliable place for other distributed…...

WinCC组态没问题,数据就是存不进U盘?手把手教你诊断西门子触摸屏USB接口‘假死’

WinCC组态正确却无法存储数据?深度解析西门子触摸屏USB接口故障排查 最近在工业自动化论坛上,看到不少工程师反馈一个奇怪现象:明明WinCC组态完全正确,数据记录配置也没问题,但就是无法将数据存入U盘。这种"组态正…...

Node Exporter 完整指南:如何快速监控系统指标

Node Exporter 完整指南:如何快速监控系统指标 【免费下载链接】node_exporter Exporter for machine metrics 项目地址: https://gitcode.com/GitHub_Trending/no/node_exporter Node Exporter 是 Prometheus 生态中一款用于收集 *NIX 系统硬件和操作系统指…...

从Flyback到Buck-Boost:换个视角理解反激变换器的CCM建模本质

从Flyback到Buck-Boost:换个视角理解反激变换器的CCM建模本质 在电力电子领域,反激变换器(Flyback Converter)常被视为一种独特的存在——它既承担着隔离式电源设计的重任,又因其特殊的工作模式让许多工程师感到困惑。但如果我们换个视角&…...

跨境网络性能深度解析:基于智能路由的GitHub访问架构优化与延迟降低80%方案

跨境网络性能深度解析:基于智能路由的GitHub访问架构优化与延迟降低80%方案 【免费下载链接】Fast-GitHub 国内Github下载很慢,用上了这个插件后,下载速度嗖嗖嗖的~! 项目地址: https://gitcode.com/gh_mirrors/fa/Fast-GitHub …...

Anse多会话模式详解:单次对话、连续对话与AI绘图实战

Anse多会话模式详解:单次对话、连续对话与AI绘图实战 【免费下载链接】anse Supercharged experience for multiple models such as ChatGPT, DALL-E and Stable Diffusion. 项目地址: https://gitcode.com/gh_mirrors/an/anse Anse是一款强大的AI工具&#…...

P1227 完美的对称【洛谷算法习题】

P1227 完美的对称 网页链接 P1227 完美的对称 题目描述 在峰会期间,必须使用许多保镖保卫参加会议的各国代表。代表们除了由他自己的随身保镖保护外,组委会还指派了一些其他的特工和阻击手保护他们。为了使他们的工作卓有成效,使被保卫的…...

YOLOv11改进 | 特殊场景检测篇 | 适用多种复杂场景的全能图像修复网络AirNet助力yolov11检测(全网独家首发)

开始讲解之前推荐一下我的专栏,本专栏的内容支持(分类、检测、分割、追踪、关键点检测),专栏目前为限时折扣,欢迎大家订阅本专栏,本专栏每周更新3-5篇最新机制,更有包含我所有改进的文件和交流群提供给大家。 一、本文介绍 本文给大家带来的改进机制是一种适用多种复杂场…...

防止静电放电危害的PCB设计技术

本章将讨论静电放电引起的系统问题的硬件解决措施。为了便于对系统硬件解决进行讨论,将系统上的静电放电效应划分成以下三个部分:  1. 静电放电之前静电场的效应  2. 放电产生的电荷注入效应  3. 静电放电电流产生的场效应  尽管印刷线路板&…...

别再被Xilinx GTX官方例程吓到了!手把手带你拆解Support、Frame_Gen和Check模块

从零拆解Xilinx GTX例程:Support、Frame_Gen与Check模块实战指南 第一次打开Xilinx GTX官方例程时,满屏的信号线像一场数字暴雨扑面而来——77到170行全是端口定义,gt0_rxcharisk_out、txusrclk2、SYSTEM_RESET这些名词在眼前跳动。作为FPGA开…...

在i.MX6ULL开发板上手搓DS18B20驱动:从GPIO配置到用户态测试的完整流程

在i.MX6ULL开发板上手搓DS18B20驱动:从GPIO配置到用户态测试的完整流程 温度传感器在工业控制、智能家居等领域有着广泛应用,而DS18B20作为一款经典的单总线数字温度传感器,以其独特的单线接口和较高的精度受到开发者青睐。本文将带你从零开始…...

yolo检测生成的txt转换为labelme可以编辑的json

yolo检测生成的txt转换为labelme可以编辑的json,以及json转txttxt转json代码如下import cv2 import os import json该脚本实现将yolo格式标签转为json格式标签 需要的数据:原始图像 原始yolo格式标签(txt文件) imgs_path "D…...

mdBook集成AI助手:自动化技术文档编写与优化实践

1. 项目概述:当技术文档遇上AI助手最近在折腾一个开源项目,需要写一份像样的技术文档。说实话,写文档这事儿,对很多开发者来说,可能比写代码还头疼。代码逻辑清晰,运行结果立竿见影;文档呢&…...

【INTERCONNECT】CW Laser 和 OPWM 组成的系统

【INTERCONNECT】CW Laser 和 OPWM 组成的系统 引言 正文 Author: JiJi \textrm{Author: JiJi} Author: JiJi Created Time: 2026.05.07 \textrm{Created Time: 2026.05.07} Created Time: 2026.05.07...

【INTERCONNECT】Optical Spectrum Analyzer 组件

【INTERCONNECT】Optical Spectrum Analyzer 组件 引言 正文 General 标签页下的参数 Standard 标签页下的参数 Enhanced 标签页下的参数 Simulation 标签页下的参数 Display 标签页下的参数 Results 标签页下的参数 Author: JiJi \textrm{Author: JiJi} Author: JiJi Created…...

Chrome插件开发实战

目录 一、核心概念与基础 二、开发环境搭建 三、Content Script深度开发 四、Background Script高级技巧 五、数据存储方案选型 六、权限安全最佳实践 七、调试与性能优化 八、实战案例:广告拦截插件 九、发布与更新策略 掌握浏览器扩展开发核心技术&#…...

从VBA到Python:给老牌仿真软件HFSS做个‘现代化改造’

从VBA到Python:HFSS仿真自动化的技术跃迁与实践指南 在电磁仿真领域,HFSS作为行业标杆工具已有数十年历史,而与其相伴的VBA脚本语言正逐渐显露出时代局限性。当Python以每年20%的增速成为工程领域最受欢迎的编程语言时(IEEE Spect…...

国内如何聪明地使用Cursor,汉化、无限制与第三方Key三步走

为何使用Cursor 在AI 编程IDE选择上,Cursor的提示词输入,文件引用,使用交互方面确实是很良好的,如果对工具交互有极致要求的,相对Trae 、VSCode等确实不太完美。 汉化,让你更加快速操作界面 无限制&#x…...

Python代码实现原理深度解析:从基础语法到高级特性

Python代码实现原理深度解析:从基础语法到高级特性 【免费下载链接】code ActiveState Code Recipes 项目地址: https://gitcode.com/gh_mirrors/code1/code 一、Python代码执行的基本流程 Python作为一门解释型语言,其代码实现原理主要围绕解释…...

2025届最火的十大AI学术工具横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 专门用于降低文本被人工智能检测系统识别概率的工具问世,它借助语义重构与句式变…...

tinfoleak地理情报分析:追踪用户位置与移动路线的终极指南

tinfoleak地理情报分析:追踪用户位置与移动路线的终极指南 【免费下载链接】tinfoleak The most complete open-source tool for Twitter intelligence analysis 项目地址: https://gitcode.com/gh_mirrors/ti/tinfoleak tinfoleak是一款功能强大的开源Twitt…...

BoringSSL未来展望:量子安全加密与下一代协议演进

BoringSSL未来展望:量子安全加密与下一代协议演进 【免费下载链接】boringssl Mirror of BoringSSL 项目地址: https://gitcode.com/gh_mirrors/bo/boringssl BoringSSL作为一款由Google开发的加密库,正积极应对量子计算带来的挑战,通…...

为Claude Code配置Taotoken密钥与聚合地址避免封号困扰

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为Claude Code配置Taotoken密钥与聚合地址避免封号困扰 如果你正在使用Claude Code作为编程助手,可能会遇到官方渠道的…...