当前位置: 首页 > news >正文

Linux OOM Killer详解

Linux OOM Killer详解

      • 一、概述
      • 二、OOM Killer的技术原理
        • 1. 内存区域划分
        • 2. 内存耗尽与OOM Killer触发
        • 3. 选择被杀进程的策略
        • 4. 内存回收机制
        • 5. 内存分配策略
      • 三、OOM Killer的工作机制
        • 1. 内存压力监测
        • 2. 触发条件
        • 3. 选择被杀进程
        • 4. 终止进程
      • 四、实际场景举例
        • 场景一:系统内存耗尽时的OOM Killer触发
        • 场景二:LowMem耗尽导致OOM Killer触发
        • 场景三:特定进程优先被杀
        • 场景四:保护关键进程
      • 五、优化和解决方案
        • 1. 升级到64位系统
        • 2. 使用hugemem内核
        • 3. 调整内核参数
        • 4. 关闭OOM Killer(风险较高)
        • 5. 配置内核参数以自动重启系统
      • 六、总结

一、概述

在Linux操作系统中,内存管理至关重要。当系统内存耗尽时,如果不采取措施,会导致系统崩溃。为了解决这个问题,Linux内核引入了一种保护机制——OOM Killer(Out-Of-Memory Killer)。当系统内存耗尽时,OOM Killer会选择并终止一些进程,以释放内存,确保系统继续运行。本博客将详细介绍OOM Killer的技术原理、工作机制,并通过实际场景举例说明其应用。

二、OOM Killer的技术原理

1. 内存区域划分

在32位CPU架构下,Linux内核将物理内存划分为三个区域:

  1. DMA区域:0x00000000 - 0x00999999(0 - 16 MB)
  2. LowMem区域:0x01000000 - 0x037999999(16 - 896 MB)
  3. HighMem区域:0x038000000 - <硬件特定>

LowMem区域(也叫Normal Zone)一共880 MB,是内核直接映射的物理地址范围。这意味着,内核需要直接使用的内存必须分配在LowMem区域内。HighMem区域用于用户空间进程的数据存储,但内核访问这部分内存需要进行额外的地址映射。

在64位系统中,所有物理内存都可以被直接映射,因此LowMem和HighMem的划分问题不再存在。然而,在32位系统中,由于LowMem区域有限,内存密集型应用很容易导致LowMem耗尽,触发OOM Killer。

2. 内存耗尽与OOM Killer触发

当系统内存耗尽时,内核会尝试回收可用内存。如果内存仍然不足,内核将触发OOM Killer来选择并终止进程,以释放内存。OOM Killer的主要目的是确保系统不至于完全崩溃,而是通过释放内存来维持运行。

3. 选择被杀进程的策略

OOM Killer选择被杀进程的策略涉及多个因素,包括:

  • 进程的OOM得分:每个进程都有一个OOM得分(oom_score),表示该进程被杀的优先级。OOM得分越高,进程越有可能被杀。
  • 进程的内存使用量:使用内存越多的进程,更有可能被选中。
  • 进程的优先级调整:可以通过调整进程的oom_adj或oom_score_adj值来改变其OOM得分,从而影响被杀优先级。
4. 内存回收机制

Linux内核通过多种机制进行内存回收,包括:

  • 页面回收:回收不常用的页面,将其写回磁盘或释放。
  • 文件缓存回收:回收文件系统缓存,释放更多内存给应用程序使用。
  • 交换空间:将内存页交换到磁盘上的交换空间(swap),以释放物理内存。
5. 内存分配策略

Linux内核使用多种内存分配策略,包括伙伴系统、slab分配器等,以提高内存分配和回收的效率。当内存不足时,内核会使用这些策略来尽可能满足内存分配请求。

三、OOM Killer的工作机制

1. 内存压力监测

内核会持续监测系统的内存使用情况,特别是LowMem区域。当LowMem区域的可用内存达到一个临界点时,内核会认为系统处于内存压力状态,并开始采取措施。

2. 触发条件

OOM Killer的触发条件主要有两个:

  • LowMem耗尽:当LowMem区域的可用内存不足,无法满足内核的内存分配请求时,OOM Killer会被触发。
  • 系统内存耗尽:当系统整体内存耗尽,无法通过正常的内存回收机制释放足够的内存时,OOM Killer会被触发。
3. 选择被杀进程

当OOM Killer被触发时,内核会计算每个进程的OOM得分,并选择得分最高的进程进行终止。计算OOM得分的因素包括:

  • 内存使用量:使用内存越多的进程,得分越高。
  • 进程优先级:通过oom_adj或oom_score_adj调整的优先级。
  • 进程类型:系统关键进程(如init进程)通常不会被选择。
4. 终止进程

内核会向选择的进程发送SIGKILL信号,强制终止该进程,并释放其占用的内存。被终止的进程及其内存释放信息会记录在系统日志中。

四、实际场景举例

场景一:系统内存耗尽时的OOM Killer触发

假设有一个高负载的服务器,运行多个内存密集型应用。当所有应用同时消耗大量内存时,系统内存耗尽。此时,OOM Killer触发,并在/var/log/messages日志文件中记录如下信息:

Out of Memory: Killed process 1234 (myapp) total-vm:512000kB, anon-rss:256000kB, file-rss:128000kB, shmem-rss:64000kB

此信息表明进程myapp(PID为1234)被OOM Killer终止,以释放512 MB的虚拟内存。

场景二:LowMem耗尽导致OOM Killer触发

在32位系统中,LowMem区域是内核直接访问的内存。如果LowMem耗尽,即使HighMem还有可用内存,OOM Killer也会触发。例如,运行以下命令查看LowMem和HighMem的状态:

egrep 'High|Low' /proc/meminfo

输出结果:

HighTotal: 5111780 kB
HighFree: 1172 kB
LowTotal: 795688 kB
LowFree: 16788 kB

此时,LowMem只有16 MB可用内存,而HighMem还有1.1 GB。若内核需要分配更多LowMem,而没有足够空间,OOM Killer将会触发,终止一些进程以释放LowMem。

场景三:特定进程优先被杀

某些应用程序的内存使用非常高,但不是系统关键进程。在内存紧张时,可以通过调整oom_score_adj值,提高这些进程的OOM得分,使其优先被杀。例如,将一个非关键进程的oom_score_adj值设置为10:

echo 10 > /proc/[pid]/oom_score_adj

当系统内存耗尽时,这个进程将优先被OOM Killer终止。

场景四:保护关键进程

对于一些关键进程,可以通过设置oom_score_adj值为-17,使其在内存紧张时不会被OOM Killer杀死。例如:

echo -17 > /proc/[pid]/oom_score_adj

这样,即使系统内存耗尽,该进程也不会被终止。

五、优化和解决方案

1. 升级到64位系统

最有效的解决方案是升级到64位系统。在64位系统中,所有内存都属于LowMem,可以避免32位系统中LowMem耗尽的问题。如果升级64位系统不可行,可以尝试以下方法:

2. 使用hugemem内核

hugemem内核通过不同的方式划分LowMem和HighMem,并提供更多LowMem到HighMem的映射。安装hugemem内核后,系统会有更多的LowMem可用。

安装hugemem内核:

yum install kernel-hugemem
reboot
3. 调整内核参数

通过调整/proc/sys/vm/lower_zone_protection的值,增加LowMem的保护级别。该参数从2.6.x内核开始可用,可以通过以下方式设置:

echo "250" > /proc/sys/vm/lower_zone_protection

在/etc/sysctl.conf中添加设置,以便启动时生效:

vm.lower_zone_protection = 250
4. 关闭OOM Killer(风险较高)

关闭OOM Killer可以避免进程被自动终止,但可能导致系统挂起,因此需谨慎使用:

echo "0" > /proc/sys/vm/oom-kill

查看当前OOM Killer状态:

cat /proc/sys/vm/oom-kill
5. 配置内核参数以自动重启系统

在/etc/sysctl.conf中添加以下配置,使系统在Out of Memory后自动重启:

vm.panic_on_oom = 1
kernel.panic = 10

执行以下命令应用配置:

sysctl -p
  1. 调整进程的oom_score_adj值

可以通过调整进程的oom_score_adj值来保护关键进程或优先终止非关键进程。例如:

保护关键进程:

echo -17 > /proc/[pid]/oom_score_adj

优先终止非关键进程:

echo 10 > /proc/[pid]/oom_score_adj

六、总结

Linux OOM Killer是一种重要的内存保护机制,在系统内存耗尽时通过终止进程来释放内存,确保系统继续运行。理解OOM Killer的技术原理、工作机制和配置方法,有助于优化系统内存管理,避免内存不足导致的系统崩溃。在实际应用中,可以通过升级64位系统、使用hugemem内核、调整内核参数等方法,优化内存使用,提升系统稳定性。通过合理配置OOM Killer,保护关键进程,优先终止非关键进程,可以有效地管理系统内存,提高系统的可靠性和可用性。

在日常运维和开发过程中,熟悉并掌握OOM Killer的配置和优化技巧,可以帮助我们更好地应对内存紧张的情况,保证系统和应用的稳定运行。

相关文章:

Linux OOM Killer详解

Linux OOM Killer详解 一、概述二、OOM Killer的技术原理1. 内存区域划分2. 内存耗尽与OOM Killer触发3. 选择被杀进程的策略4. 内存回收机制5. 内存分配策略 三、OOM Killer的工作机制1. 内存压力监测2. 触发条件3. 选择被杀进程4. 终止进程 四、实际场景举例场景一&#xff1…...

2024rk(案例二)

试题二(25分) 阅读以下关于数据库缓存的叙述,在答题纸上回答问题1至问题3。 【说明】 某大型电商平台建立了一个在线 B2B 商店系统,并在全国多地建设了货物仓储中心,通过提前备货的方式来提高货物的运送效率。但是在运营过程中,发现会出现很多跨仓储中心调货从而延误货物…...

小红书爆文秘籍:ChatGPT助你从0到1创造热门内容!

在小红书打造爆款文案的策略中&#xff0c;以下是一些调整和同义词替换的建议&#xff0c;以便达到文章去重的要求&#xff1a; 了解目标受众&#xff1a; 在撰写文案前&#xff0c;先深入分析目标读者的属性&#xff0c;如年龄层次、性别、爱好和购买行为。通过ChatGPT, 你能迅…...

django快速实现个人博客(附源码)

文章目录 一、工程目录组织结构二、模型及管理实现1、模型2、admin管理 三、博客展现实现1、视图实现2、模板实现 四、部署及效果五、源代码 Django作为一款成熟的Python Web开发框架提供了丰富的内置功能&#xff0c;如ORM&#xff08;对象关系映射&#xff09;、Admin管理界面…...

K8s部署篇之手动部署二进制高可用集群架构

一、系统环境初始化 一&#xff09;架构设计 所有节点都操作&#xff1a;3个master&#xff08;etcd集群三个节点&#xff09;和2个node 1、K8s服务调用如图 2、各组件说明 1、API Server 供Kubernetes API接口&#xff0c;主要处理 REST操作以及更新ETCD中的对象所有资源增删…...

【Unity/XLua】xlua自带教程示例分析(6)—— lua协程

文章目录 工具准备协程测试 工具准备 首先是工具脚本&#xff0c;一个Coroutine_Runner.cs和一个cs_coroutine.lua 前者定义了一个继承自Monobehavior的脚本组件&#xff0c;后者则使用lua去在Unity中实例化一个挂载该组件的GameObject&#xff0c;并将其设置为DontDestroyOn…...

CV目标检测概述

文章目录 目标检测概述目标检测图像分割目标检测和图像分割的区别 目标检测概述 目标检测和图像分割是计算机视觉中的两个重要任务&#xff0c;它们有着不同的目的和应用。以下是它们的简要介绍和区别&#xff1a; 目标检测 目标检测&#xff08;Object Detection&#xff0…...

如何在notebook中运行nodejs

在 Python 生态系统的推动下&#xff0c;机器学习和人工智能日益流行&#xff0c;这带来了计算笔记本的概念。这些交互式计算平台主要是为以 Python 为中心的数据科学应用而开发的&#xff0c;它们将代码、计算输出、解释性文本和多媒体合并成一个有内聚力的文档。 作为 JavaS…...

Mybatis学习-day19

Mybatis学习-day19 1. resultMap resultMap 是 MyBatis 中最复杂的元素&#xff0c;主要用于解决实体类属性名与数据库表中字段名不一致的情况&#xff0c;可以将查询结果映射成实体对象。 <resultMap id"staffAndDep" type"com.easy.bean.Staff">…...

IDEA构建SpringBoot多模块项目

前言 最近一直在思考一个问题&#xff0c;springboot的多模块项目到底是怎么运行和运作的&#xff1f; 一般我们大部分的springboot项目都是单模块的项目&#xff0c;但是如果后续有要求开发多模块的项目应该怎么处理&#xff1f;于是基于这点进行了研究。 本次文章将会带大…...

【前端】NodeJS:nvm

文章目录 1 介绍2 使用2.1 下载安装2.2 常用命令 1 介绍 nvm全称&#xff1a;Node Version Manager&#xff0c;顾名思义它是用来管理node版本的工具&#xff0c;方便切换不同版本的Node.js。 2 使用 nvm的使用非常的简单&#xff0c;跟npm的使用方法类似。 2.1 下载安装 …...

Docker网络模式及通信

一、Docker默认的网络通信 1.1 Docker安装后默认的网络设置 Docker服务器安装完成之后&#xff0c;默认在每个宿主机会生成一个名称为docker0的网卡&#xff0c;其IP地址都是172.17.0.1/16 [rootubuntu1804 ~]#apt -y install bridge-utils [rootubuntu1804 ~]#brctl show 另…...

类模板实现实现Qt click/hover自定义操作

一、场景 常常会需要实现点击/hover时修改图片&#xff0c;可能是一个QPushButton、QLabel、QToolButton…… 由于Qt bug&#xff0c;QIcon/QSS只能实现常规态、按下态的图标切换&#xff0c;hover态的图片设置无效。 解决思路无非是安装事件过滤器、自定义类并重实现事件。 …...

Arco Design:引领未来的Vue 3创意先锋,一键开启高效与美感并重的Web开发之旅!

Arco Design 是一个基于 Vue 3 的 UI 框架&#xff0c;它提供了丰富的组件和样式&#xff0c;可以帮助开发者快速构建高质量的 Web 应用程序。以下是 Arco Design 的一些详细特点&#xff1a; 完整的设计系统&#xff1a;Arco Design 提供了一套完整的设计系统&#xff0c;包括…...

【MySQL】Linux下用C/C++链接MySQL数据库

文章目录 一、准备工作二、验证库和接口的使用三、链接数据库四、对数据库进行增删查改增删改查 五、结尾 一、准备工作 要使用C链接数据库, 首先要去MySQL官网下载官网提供的库, MySQL 社区下载. 如图所示: 接着选择: 按需选择版本: 如果用的是云服务器, 那么在安装mysql时…...

Python金融量化专栏简介

量化分析实战 - 专栏大纲 👉👉👉 《玩转Python金融量化专栏》👈👈👈 订阅本专栏的可以下载对应的代码和数据集 专栏目标 本专栏旨在帮助读者全面掌握使用Python进行金融技术指标的计算与应用,从基础到高级,涵盖各种技术指标的实现、策略开发与回测等内容。通过…...

出行365:依托分布式数据库,让出行无忧 | OceanBase案例

*本文首发自“新华社环球”杂志&#xff0c;作者张海鑫 每年的暑期旅游旺季&#xff0c;都会触发一轮轮的文旅消费的热潮&#xff0c;对于互联网出行服务行业而言&#xff0c;这既是一场盛大的狂欢&#xff0c;也是对其综合实力的严峻考验。 然而&#xff0c;自去年暑假起&…...

【C语言】位段详解

&#x1f984;个人主页:小米里的大麦-CSDN博客 &#x1f38f;所属专栏:https://blog.csdn.net/huangcancan666/category_12718530.html &#x1f381;代码托管:黄灿灿 (huang-cancan-xbc) - Gitee.com ⚙️操作环境:Visual Studio 2022 目录 一、什么是位段&#xff1f; 二、…...

LVS集群实验

NAT模式 本质是多目标IP的DNAT&#xff0c;通过将请求报文中的目标地址和目标端口修改为某挑出的RS的RIP和PORT实现转发RIP和DIP应在同一个IP网络&#xff0c;且应使用私网地址:RS的网关要指向DIP请求报文和响应报文都必须经由Direclor转发&#xff0c;Direclor易于成为系统瓶…...

在 Spring Boot 中使用适配器模式实现支付网关的统一接口

引言 在许多电子商务系统中&#xff0c;集成多个支付网关是常见的需求。不同的支付网关有着不同的接口和实现细节。适配器模式可以帮助我们以一种灵活的方式实现这些不同的支付网关接口。 适配器模式简介 适配器模式将一个类的接口转换为客户期望的另一个接口。适配器模式使…...

【书生·浦语大模型实战营】第三期 入门岛作业

入门岛作业 Linux闯关任务&#xff1a;完成 SSH 连接与端口映射并运行 hello_world.py。配置vscode作业内容 可选任务1&#xff1a;将Linux基础命令在开发机上完成一遍作业内容 可选任务 2&#xff1a;使用 VSCODE 远程连接开发机并创建一个conda环境作业内容 可选任务 3&#…...

Redis的String类型常用命令总结

1. set 设置一个键的值。 set key value示例&#xff1a; set username "alice"2. get 获取一个键的值。 get key示例&#xff1a; get username3. getset 设置键的值&#xff0c;并返回键的旧值。 getset key value示例&#xff1a; getset username "…...

河南萌新联赛2024第(四)场:河南理工大学

A 思路&#xff1a; B 思路&#xff1a;有一种贪心的写法&#xff0c;将整个数组排序以后比较两个相邻数的同或值&#xff0c;取 m a x max max&#xff0c;不会证明 int th(int x, int y, int z) {int res 0;for (int i z - 1; i > 0; i --) {int dx (x >> i &…...

Linux中临时使用账号提权进行业务操作

普通账号提权 su&#xff1a;永久提权 Switching users with su sudo&#xff1a;临时提权 Running commands as root with sudo 1&#xff09;su切换账号 需要对方的密码 示例&#xff1a;切换到超级管理员 su - root 建议用-这个 su root 普通用户需要执行特殊指令&…...

lwip 3. 网线拔掉后 lwip_recvfrom不能返回

当网线被拔掉后&#xff0c;‌LWIP的lwip_recvfrom函数无法返回&#xff0c;‌这通常意味着网络连接已经断开&#xff0c;‌而LWIP没有自动检测到这种断开并进行相应的处理。具体卡在这个地方&#xff1a; ret xQueueReceive(mbox->mbx, &(*msg), portMAX_DELAY); //具…...

Linux环境安装Docker Engine

Docker是一个开源的应用容器引擎&#xff0c;由Go语言开发&#xff0c;基于Linux内核技术。Docker通过将应用及其依赖打包到可移植的容器中&#xff0c;实现了应用的快速部署和高效管理。Docker容器具有轻量级、快速启动、可移植性强等特点&#xff0c;能够显著提升资源利用率和…...

大厂面试题分享

大厂面试题分享 Redis持久化方式AOF优缺点RDB优缺点 如何保证Redis和Myql的一致性索引下推输入url到浏览器发生了什么ReentranLock底层原理SpringBoot 的启动流程 Redis持久化方式 Redis提供了两种主要的持久化机制&#xff0c;分别是AOF&#xff08;Append-Only File&#xf…...

FPGA面试问题整理

1. 逻辑设计中竞争与冒险概念&#xff0c;如何识别和消除&#xff1f; 竞争&#xff1a;在组合逻辑电路中&#xff0c;信号经过多条路径到达输出端&#xff0c;每条路径经过的逻辑门不同存在时差&#xff0c;在信号变化的瞬间存在先后顺序。这种现象叫竞争。 冒险&#xff1a;由…...

3Done学习笔记

一、基本操作 1、旋转视角 使用左下角立方体选择&#xff1b; 右键可以拖动视角&#xff1b; 中间滑轮按住拖动整个舞台界面。 2、平移和旋转 右键选择移动&#xff0c;有两种方式。 第一种选择起始点&#xff0c;按照起始点位置移动到终止点&#xff08;边、角、中心点…...

AI学习指南深度学习篇-卷积层详解

AI学习指南深度学习篇-卷积层详解 一、引言 随着人工智能技术的不断发展&#xff0c;深度学习作为人工智能领域的热门分支之一&#xff0c;正在逐渐成为各个领域的核心技术。而在深度学习中&#xff0c;卷积神经网络&#xff08;Convolutional Neural Network&#xff0c;CNN…...