Android13 针对low memory killer内存调优
引入概念
在旧版本的安卓系统中,当触发lmk(low memory killer)的时候一般认为就是内存不足导致,但是随着安卓版本的增加lmk的判断标准已经不仅仅是内存剩余大小,io,cpu同样会做评判,从而保证设备性能。这里引入的概念就是psi(Pressure Stall Information)压力失速信息,用来检测内存压力,这样能够更全面的保证我们的内存性能,提高设备反应速度。
Android 10 及更高版本支持新的 lmkd
模式,它使用内核压力失速信息 (PSI) 监视器来检测内存压力。上游内核中的 PSI 补丁程序集(已向后移植到 4.9 和 4.14 内核)可测量由于内存不足导致任务延迟的时间。由于这些延迟会直接影响用户体验,因此它们代表了确定内存压力严重性的便捷指标。上游内核还包括 PSI 监视器,这类监视器允许特权用户空间进程(例如 lmkd
)指定这些延迟的阈值,并在突破阈值时从内核订阅事件。
PSI 监视器与 vmpressure 信号
由于 vmpressure
信号(由内核生成,用于检测内存压力并由 lmkd
使用)通常包含大量误报,因此 lmkd
必须执行过滤以确定是否真的存在内存压力。这会导致不必要的 lmkd
唤醒并使用额外的计算资源。使用 PSI 监视器可以实现更精确的内存压力检测,并最大限度地减少过滤开销。
使用 PSI 监视器
如需使用 PSI 监视器(而不是 vmpressure
事件),请配置 ro.lmk.use_psi
属性。默认值为 true
,这会以 PSI 监视器作为 lmkd
内存压力检测的默认机制。由于 PSI 监视器需要内核支持,因此内核必须包含 PSI 向后移植补丁程序,并在启用 PSI 支持 (CONFIG_PSI=y
) 的情况下进行编译。
为何舍弃原始内核LMK策略
内核中 LMK 驱动程序的缺点
由于存在大量问题,Android 弃用了 LMK 驱动程序,问题包括:
- 对于低内存设备,必须主动进行调整,即便如此,在处理涉及支持大文件的活跃页面缓存的工作负载时,其性能也较差。性能不良会导致出现抖动,但不会终止。
- LMK 内核驱动程序依赖于可用内存限制,不会根据内存压力进行扩缩。
- 由于设计的严格性,合作伙伴通常会自定义该驱动程序,使其可以在自己的设备上使用。
- LMK 驱动程序已挂接到 Slab Shrinker API,该 API 并非为了执行繁重操作(例如搜索并终止目标)而设计,这类操作会导致
vmscan
进程变慢。
用户空间 lmkd
用户空间 lmkd
可实现与内核中的驱动程序相同的功能,但它使用现有的内核机制检测和评估内存压力。这些机制包括使用内核生成的 vmpressure
事件或压力失速信息 (PSI) 监视器来获取关于内存压力水平的通知,以及使用内存 cgroup 功能限制根据进程的重要性分配给每个进程的内存资源。
在 Android 10 中使用用户空间 lmkd
在 Android 9 及更高版本中,用户空间 lmkd
会在未检测到内核中的 LMK 驱动程序时激活。由于用户空间 lmkd
要求内核支持内存 cgroup,因此必须使用以下配置设置编译内核:
CONFIG_ANDROID_LOW_MEMORY_KILLER=n
CONFIG_MEMCG=y
CONFIG_MEMCG_SWAP=y
终止策略
用户空间 lmkd
支持基于以下各项的终止策略:vmpressure
事件或 PSI 监视器、其严重性以及交换利用率等其他提示。低内存设备和高性能设备的终止策略有所不同:
- 对于内存不足的设备,一般情况下,系统会选择承受较大的内存压力。
- 对于高性能设备,如果出现内存压力,则会视为异常情况,应及时修复,以免影响整体性能。
您可以使用 ro.config.low_ram
属性配置终止策略。如需了解详情,请参阅低 RAM 配置。
用户空间 lmkd
还支持一种旧模式,在该模式下,它使用与内核中的 LMK 驱动程序相同的策略(即可用内存和文件缓存阈值)做出终止决策。要启用旧模式,请将 ro.lmk.use_minfree_levels
属性设置为 true
。
配置 lmkd
使用以下属性为特定设备配置 lmkd
。
属性 | 使用 | 默认 |
---|---|---|
ro.config.low_ram | 指定设备是低内存设备还是高性能设备。 | false |
ro.lmk.use_psi | 使用 PSI 监视器(而不是 vmpressure 事件)。 | true |
ro.lmk.use_minfree_levels | 使用可用内存和文件缓存阈值来做出进程终止决策(即与内核中的 LMK 驱动程序的功能一致)。 | false |
ro.lmk.low | 在低 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。 | 1001 (停用) |
ro.lmk.medium | 在中等 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。 | 800 (已缓存或非必要服务) |
ro.lmk.critical | 在临界 vmpressure 水平下可被终止的进程的最低 oom_adj 得分。 | 0 (任何进程) |
ro.lmk.critical_upgrade | 支持升级到临界水平。 | false |
ro.lmk.upgrade_pressure | 由于系统交换次数过多,将在该水平执行水平升级的 mem_pressure 上限。 | 100 (停用) |
ro.lmk.downgrade_pressure | 由于仍有足够的可用内存,将在该水平忽略 vmpressure 事件的 mem_pressure 下限。 | 100 (停用) |
ro.lmk.kill_heaviest_task | 终止符合条件的最繁重任务(最佳决策)与终止符合条件的任何任务(快速决策)。 | true |
ro.lmk.kill_timeout_ms | 从某次终止后到其他终止完成之前的持续时间(以毫秒为单位)。 | 0 (停用) |
ro.lmk.debug | 启用 lmkd 调试日志。 | false |
注意:mem_pressure
= 内存使用量/RAM_and_swap 使用量(以百分比的形式表示)。
设备配置示例:
PRODUCT_PROPERTY_OVERRIDES += \ro.lmk.low=1001 \ro.lmk.medium=800 \ro.lmk.critical=0 \ro.lmk.critical_upgrade=false \ro.lmk.upgrade_pressure=100 \ro.lmk.downgrade_pressure=100 \ro.lmk.kill_heaviest_task=true
Android 11 中的用户空间 lmkd
Android 11 通过引入新的终止策略改进了 lmkd
。该终止策略使用 PSI 机制来执行 Android 10 中引入的内存压力检测。Android 11 中的 lmkd
会根据内存资源使用情况和抖动来防止出现内存不足和性能下降。这一终止策略取代了以前的策略,可同时用于高性能设备和低内存 (Android Go) 设备。
内核要求
对于 Android 11 设备,lmkd
需要以下内核功能:
- 添加 PSI 补丁程序并启用 PSI(Android 通用内核 4.9、4.14 和 4.19 中提供向后移植)。
- 添加 PIDFD 支持补丁程序(Android 通用内核 4.9、4.14 和 4.19 中提供向后移植)。
- 对于低内存设备,添加内存 cgroup。
必须使用以下配置设置编译内核:
CONFIG_PSI=y
在 Android 11 中配置 lmkd
Android 11 中的内存终止策略支持下面列出的调节旋钮和默认值。这些功能在高性能设备和低内存设备上都可使用。
属性 | 使用 | 默认 | |
---|---|---|---|
高性能 | 低内存 | ||
ro.lmk.psi_partial_stall_ms | 部分 PSI 失速阈值(以毫秒为单位),用于触发内存不足通知。如果设备收到内存压力通知的时间太晚,可以降低此值以在较早的时间触发通知。如果在不必要的情况下触发了内存压力通知,请提高此值以降低设备对噪声的敏感度。 | 70 | 200 |
ro.lmk.psi_complete_stall_ms | 完全 PSI 失速阈值(以毫秒为单位),用于触发关键内存通知。如果设备收到关键内存压力通知的时间太晚,可以降低该值以在较早的时间触发通知。如果在不必要的情况下触发了关键内存压力通知,可以提高该值以降低设备对噪声的敏感度。 | 700 | |
ro.lmk.thrashing_limit | 工作集 refault 数量的上限,以占具有文件支持的页面缓存总大小的百分比表示。如果工作集 refault 的数量超过该值,则视为系统对其页面缓存造成抖动。如果设备性能在内存压力期间受到影响,请降低该值以限制抖动。如果因抖动原因而导致设备性能不必要地降低,请提高该值以允许更多抖动。 | 100 | 30 |
ro.lmk.thrashing_limit_decay | 抖动阈值衰减,以占在系统无法恢复时(甚至是终止后)用于降低阈值的原始阈值的百分比表示。如果持续抖动导致不必要的终止,请降低该值。如果终止后对持续抖动的响应速度过慢,请提高该值。 | 10 | 50 |
ro.lmk.swap_util_max | 最大交换内存量,以占可交换内存总量的百分比表示。如果交换的内存量超过此上限,则表示系统在交换了其大部分可交换内存后仍然存在压力。 当内存压力是由不可交换内存的分配导致时,就可能会发生这种情况,原因在于大部分可交换内存已经交换,所以无法通过交换来缓解这一压力。默认值为 100,这实际上会停用此检查。如果设备的性能在交换利用率较高且可用交换水平未降至 ro.lmk.swap_free_low_percentage 的内存压力期间受到影响,请降低该值以限制交换利用率。 | 100 | 100 |
以下旧的调节旋钮也可用于新的终止策略。
属性 | 使用 | 默认 | |
---|---|---|---|
高性能 | 低内存 | ||
ro.lmk.swap_free_low_percentage | 可用交换水平,以占总交换空间的百分比表示。“lmkd”使用该值作为阈值来判断何时将系统视为交换空间不足。如果“lmkd”因交换空间过多而终止,请降低该百分比。如果“lmkd”终止得太晚,从而导致 OOM 终止,请提高该百分比。 | 20 | 10 |
ro.lmk.debug | 这会启用“lmkd”调试日志。在调节时启用调试。 | false |
问题实例
客户做重启压测,发现重启过程中概率出现应用被杀情况。本次被杀应用为launcher,对应log如下:
02-04 11:02:19.762 D/lowmemorykiller( 440): critical pressure event triggered
02-04 11:02:19.763 D/lowmemorykiller( 440): nr_free_pages: 39252 nr_inactive_file: 216786 nr_active_file: 84889 workingset_refault: 0 pgscan_kswapd: 199494 pgscan_direct: 0 pgscan_direct_throttle: 0 init_pgscan_direct: 0 init_pgscan_kswapd: 0 base_file_lru: 0 init_ws_refault: 0 free_swap: 393151 total_swap: 393215 swap_free_percentage: 99%
02-04 11:02:19.763 D/lowmemorykiller( 440): pgskip deltas: DMA: -1DMA32: 0 Normal: 0 High: -1 Movable: 0
02-04 11:02:19.763 D/lowmemorykiller( 440): reclaim: 1 in_compaction : 0
02-04 11:02:19.763 E/lowmemorykiller( 440): zoneinfo_parse_node per-node stats not found in zone DMA32; moving to next zone
02-04 11:02:19.763 E/lowmemorykiller( 440): calc_zone_watermarks pgskip_deltas_val: 0 pgskip_deltas[PGSKIP_IDX(i++)]: 0
02-04 11:02:19.763 D/lowmemorykiller( 440): Zone: 0 nr_free_pages: 38701 min: 18432 low: 25249 high: 32066 present: 778880 nr_cma_free: 207 max_protection: 0
02-04 11:02:19.763 D/lowmemorykiller( 440): Zone: 1 nr_free_pages: 0 min: 0 low: 0 high: 0 present: 0 nr_cma_free: 0 max_protection: 0
02-04 11:02:19.763 D/lowmemorykiller( 440): Aggregate wmarks: min: 18432 low: 100996 high: 128264 (nr_free - nr_cma_free): 38494 wbf_effective: 4
02-04 11:02:19.763 D/lowmemorykiller( 440): smallest wmark breached: high free_pages: 38494 cached_pages_considered_free: 0 breached_wm_level: 128264
02-04 11:02:19.763 D/lowmemorykiller( 440): nr_free_pages: 38701 Cached: 301751 Unevictable: 1712 Shmem: 985 mlocked: 1711 SwapCached: 0 active_anon: 522 inactive_anon: 141235cma_free: 207
02-04 11:02:19.765 E/ThermalEngine( 2896): parse_cooling_devices: Added cooling device: pause-cpu7 with cdev id:13
02-04 11:02:19.766 I/lowmemorykiller( 440): Kill 'com.android.launcher3' (2671), uid 10091, oom_score_adj 100 to free 102928kB rss, 0kB swap; reason: critical pressure and device is low on memory
02-04 11:02:19.766 E/ThermalEngine( 2896): parse_cooling_devices: Added cooling device: ufs with cdev id:1
02-04 11:02:19.766 I/killinfo( 440): [2671,10091,100,50,102928,1,2726892,154804,1207004,0,9144,3940,6848,6844,1572860,1572604,2088,564940,339556,867144,87576,174144,26928,57000,0,0,828,0,23977,0,0,0,66404,0,0,0.180000,0.180000,6.140000,2.280000,23.650000]
通过log来看触发的是critical pressure event。
通过lmk源码排查如下:
system\memory\lmkd\lmkd.cpp
通过注释可以知道,这是因为内存回收太慢导致。这里控制是通过监听kernel里的epoll事件,然后做相关判断进行进程的kill,这里代表了内存失速,由于我们3g内存其实也并不是很宽裕,需要经常回收内存,通过killinfo我们可以看到psi最后一项达到了23.650000证明cpu压力很大,证明系统回收内存压力较大,我们通过修改
ro.lmk.psi_scrit_complete_stall_ms来延长反应时间增大到400ms,从而解决此问题,下一篇文章将会详细分解lmk相关代码。
相关文章:

Android13 针对low memory killer内存调优
引入概念 在旧版本的安卓系统中,当触发lmk(low memory killer)的时候一般认为就是内存不足导致,但是随着安卓版本的增加lmk的判断标准已经不仅仅是内存剩余大小,io,cpu同样会做评判,从而保证设备…...

【深入理解设计模式】 工厂设计模式
工厂设计模式 工厂设计模式是一种创建型设计模式,它提供了一种在不指定具体类的情况下创建对象的接口。在工厂设计模式中,我们定义一个创建对象的接口,让子类决定实例化哪一个类。工厂方法使一个类的实例化延迟到其子类。 工厂设计模式的目…...

Windows下搭建EFK实例
资源下载 elasticSearch :下载最新版本的就行 kibana filebeat:注意选择压缩包下载 更新elasticsearch.yml,默认端口9200: # Elasticsearch Configuration # # NOTE: Elasticsearch comes with reasonable defaults for most …...

工厂方法模式Factory Method
1.模式定义 定义一个用于创建对象的接口,让子类决定实例化哪一个类。Factory Method 使得一个类的实例化延迟到子类 2.使用场景 1.当你不知道改使用对象的确切类型的时候 2.当你希望为库或框架提供扩展其内部组件的方法时 主要优点: 1.将具体产品和创建…...

Vue的个人笔记
Vue学习小tips ctrl s ----> 运行 alt b <scrip> 链接 <script src"https://cdn.jsdelivr.net/npm/vue2.7.16/dist/vue.js"></script> 插值表达式 指令...

linux platform架构下I2C接口驱动开发
目录 概述 1 认识I2C协议 1.1 初识I2C 1.2 I2C物理层 1.3 I2C协议分析 1.3.1 Start、Stop、ACK 信号 1.3.2 I2C协议的操作流程 1.3.3 操作I2C注意的问题 2 linux platform驱动开发 2.1 更新设备树 2.1.1 添加驱动节点 2.1.2 编译.dts 2.1.3 更新板卡中的.dtb 2.2 …...

基于机器学习的青藏高原高寒沼泽湿地蒸散发插补研究_王秀英_2022
基于机器学习的青藏高原高寒沼泽湿地蒸散发插补研究_王秀英_2022 摘要关键词 1 材料和方法1.1 研究区概况与数据来源1.2 研究方法 2 结果和分析2.1 蒸散发通量观测数据缺省状况2.2 蒸散发与气象因子的相关性分析2.3 不同气象因子输入组合下各模型算法精度对比2.4 随机森林回归模…...

Failed at the node-sass@4.14.1 postinstall script.
问题描述 安装sass # "node-sass": "^4.9.0" npm i node-sass报错如下 npm ERR! code ELIFECYCLE npm ERR! errno 1 npm ERR! node-sass4.14.1 postinstall: node scripts/build.js npm ERR! Exit status 1 npm ERR! npm ERR! Failed at the node-sass4…...

【鸿蒙系统学习笔记】网络请求
一、介绍 资料来自官网:文档中心 网络管理模块主要提供以下功能: HTTP数据请求:通过HTTP发起一个数据请求。WebSocket连接:使用WebSocket建立服务器与客户端的双向连接。Socket连接:通过Socket进行数据传输。 日常…...

LabVIEW风力机智能叶片控制系统
LabVIEW风力机智能叶片控制系统 介绍了一种风力机智能叶片控制系统的开发。通过利用LabVIEW软件与CDS技术,该系统能够实时监测并调整风力机叶片的角度,优化风能转换效率。此项技术不仅提高了风力发电的稳定性和效率,而且为风力机的智能化管…...

HarmonyOS Stage模型 权限申请
配置声明权限 在module.json5配置文件中声明权限。不论是system_grant还是user_grant类型都需要声明权限,否则应用将无法获得授权。 {"module" : {// ..."requestPermissions":[{"name": "ohos.permission.DISCOVER_BLUETOOTH…...

标题:从预编译到链接:探索C/C++程序的翻译环境全貌
引言 在软件开发的世界里,我们通常会遇到两种不同的环境——翻译环境与运行环境。今天,我们将聚焦于前者,深入剖析C/C程序生命周期中至关重要的“翻译环境”,即从源代码到可执行文件这一过程中涉及的四个关键阶段:预编…...

深入理解单端模拟多路复用器DG406DW-E3 应用于高速数据采集、ATE系统和航空电子设备解决方案
DG406DW-E3是一款16通道单端模拟多路复用器设计用于将16个输入中的一个连接到公共端口由4位二进制地址确定的输出。应用包括高速数据采集、音频信号切换和路由、ATE系统和航空电子设备。高性能低功耗损耗使其成为电池供电和电池供电的理想选择远程仪器应用。采用44V硅栅CMOS工艺…...

Redis篇----第六篇
系列文章目录 文章目录 系列文章目录前言一、Redis 的持久化机制是什么?各自的优缺点?二、Redis 常见性能问题和解决方案:三、redis 过期键的删除策略?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章…...

【LeetCode】509. 斐波那契数(简单)——代码随想录算法训练营Day38
题目链接:509. 斐波那契数 题目描述 斐波那契数 (通常用 F(n) 表示)形成的序列称为 斐波那契数列 。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) 0,F(1) 1 F(n) F(n -…...

[OpenGL教程05 ] glAccum() 函数对累积缓存设置
Accumulation Buffer:累积缓存 一、说明 openGL编程之所以困难,是因为它是三维图表示;简简单单加入一个Z轴,却使得几何遮挡、光线过度、运动随影等搞得尤其复杂。它的核心处理环节是像素缓存,本篇的积累缓存就是其一个…...

BeautifulSoup的使用与入门
1. 介绍 BeautifulSoup是用来从HTML、XML文档中提取数据的一个python库,安装如下: pip install beautifulsoup4 它支持多种解析器,包括python标准库、lxml HTML解析器、lxml XML解析器、html5lib等。结合稳定性和速度,这里推荐使用lxml HT…...

LLM之RAG实战(二十七)| 如何评估RAG系统
有没有想过今天的一些应用程序是如何看起来几乎神奇地智能的?这种魔力很大一部分来自于一种叫做RAG和LLM的东西。把RAG(Retrieval Augmented Generation)想象成人工智能世界里聪明的书呆子,它会挖掘大量信息,准确地找到…...

Linux Docker 关闭开机启动
说说自己为什么需要关闭自启动:Linux中安装Docker后,自启动会占用80和443端口,然后使用自己的SSL认证,导致自己Nginx配置的SSL认证失效,网站通过https打开显示不安全。 Docker是一个容器化平台,它可以让开…...

处理器管理补充——线程
传送门:操作系统——处理器管理http://t.csdnimg.cn/avaDO 1.1 线程的概念 回忆:[未引入线程前] 进程有两个基本属性:拥有资源的独立单位、处理器调度和分配的基本单位。 引入线程以后,线程将作为处理器调度和运行的基本单位&…...

RESTful 风格是指什么
RESTful(Representational State Transfer)是一种基于 HTTP 协议的软件架构风格,用于设计网络应用程序的接口。它的设计理念是利用 HTTP 协议中的方法(如 GET、POST、PUT、DELETE 等)来对资源进行 CRUD,使得…...

Python 二维矩阵加一个变量运算该如何避免 for 循环
Python 二维矩阵加一个变量运算该如何避免 for 循环 引言正文方法1------使用 for 循环方法2------不使用 for 循环引言 今天写代码的时候遇到了一个问题,比如我们需要做一个二维矩阵运算,其中一个矩阵是 2x2 的,另一个是 2x1 的。在这个二维矩阵中,其中各个参数会随着一个…...

Nginx 配置详解
官网:http://www.nginx.org/ 序言 Nginx是lgor Sysoev为俄罗斯访问量第二的rambler.ru站点设计开发的。从2004年发布至今,凭借开源的力量,已经接近成熟与完善。 Nginx功能丰富,可作为HTTP服务器,也可作为反向代理服务…...

python读写文件操作的三大基本步骤
目录 基本步骤 常用函数 open()函数 close()函数 read()函数 readlines()函数 readline()函数 write()函数 writelines()函数 with语句 读写操作的应用: 拷贝文件 with 语句的嵌套 逐行拷贝 基本步骤 1. 打开文件:open(filepath, mode, en…...

《Go 简易速速上手小册》第3章:数据结构(2024 最新版)
文章目录 3.1 数组与切片:Go 语言的动态队伍3.1.1 基础知识讲解3.1.2 重点案例:动态成绩单功能描述实现代码扩展功能 3.1.3 拓展案例 1:数据分析功能描述实现代码扩展功能 3.1.4 拓展案例 2:日志过滤器功能描述实现代码扩展功能 3…...

雷达模拟触摸屏,支持tuio\鼠标\Touch
案例展示: 雷达精度测试 星秒雷达互动软件测试 功能说明: 雷达互动系统支持各种品牌雷达,支持4-256点校准(校准点越大精度越高 ,而市场上基本都是4点校准 ,碰到大面积范围无法保证精准度)&…...

一文了解大数据生态
大数据一词最早指的是传统数据处理应用软件无法处理的过于庞大或过于复杂的数据集。 现在,对“大数据”一词的使用倾向于使用预测分析、用户行为分析或者其他一些从大数据中提取价值的高级数据分析方法,很少用于表示特定规模的数据集。 定义 大数据是…...

Linux篇:指令
一 基本常识: 1. 文件文件内容文件的属性 2. 文件的操作对文件内容的操作对文件属性的操作 3. 文件的类型: d:目录文件 -:普通文件 4. 指令是可执行程序,指令的代码文件在系统的某一个位置存在的。/u…...

Linux eject命令教程:如何控制可移动介质的弹出和收回(附案例详解和注意事项)
Linux eject命令介绍 eject命令在Linux中用于弹出可移动介质,通常是CD-ROM、软盘、磁带或JAZ或ZIP磁盘。您还可以使用此命令来控制一些多盘CD-ROM切换器,一些设备支持的自动弹出功能,以及关闭一些CD-ROM驱动器的光盘托盘。 Linux eject命令…...

【已解决】PPT无法复制内容怎么办?
想要复制PPT文件里的内容,却发现复制不了,怎么办? 这种情况,一般是PPT文件被设置了以“只读方式”打开,“只读方式”下的PPT无法进行编辑更改,也无法进行复制粘贴的操作。 想要解决这个问题,我…...