性能分析与调优: Linux 内存观测工具
目录
一、实验
1.环境
2.vmstat
3.PSI
4.swapon
5.sar
6.slabtop
7.numstat
8.ps
9.top
10.pmap
11.perf
12.bpftrace
二、问题
1.接口读写报错
2.slabtop如何安装
3.numactl如何安装
4.numad启动服务与关闭NUMA
5. perf如何安装
6. kernel-lt-doc与kernel-lt-tools-libs-devel如何安装
7.bpftrace如何安装
8. drsnoop如何使用
一、实验
1.环境
(1)主机
表1-1 主机
| 主机 | 架构 | 组件 | IP | 备注 |
| prometheus | 监测 系统 | prometheus、node_exporter | 192.168.204.18 | |
| grafana | 监测GUI | grafana | 192.168.204.19 | |
| agent | 监测 主机 | node_exporter | 192.168.204.20 |
(2)内存观测工具
表1-2 内存观测工具
| 序号 | 工具 | 描述 |
| 1 | vmstat | 虚拟内存和物理内存统计信息 |
| 2 | PSI | 内存压力滞留信息 |
| 3 | swapon | 交换设备使用率 |
| 4 | sar | 历史统计信息 |
| 5 | slabtop | 内核slab分配器统计信息 |
| 6 | numastat | NUMA分析 |
| 7 | ps | 进程状态 |
| 8 | top | 监测每个进程的内存使用率 |
| 9 | pmap | 进程地址空间统计信息 |
| 10 | perf | 内存PMC和跟踪点分析 |
| 11 | bpftrace | 用于内存分析的跟踪程序 |
2.vmstat
(1) 每秒1次,共5次输出
[root@agent ~]# vmstat 1 5

(2)-S 选项将输出单位修改为MB(m表示1 000 000, M表示 1 048 576)
[root@agent ~]# vmstat -Sm 1 5

[root@agent ~]# vmstat -SM 1 5

(3) -a 选项可以输出非活动inactive和活动页active缓存的明细
[root@agent ~]# vmstat -a 1 5

3.PSI
(1) 显示是否有内存压力,和过去5分钟内的变化情况
cat /proc/pressure/memory
some开头的一行显示了一些任务(线程)受到影响的时间,full开头的一行显示了所有可运行任务受到影响的时间
4.swapon
(1) 显示配置的交换设备以及使用率
[root@agent ~]# swapon

5.sar
(1) -B 换页统计信息
每秒1次,共5次
[root@agent ~]# sar -B 1 5

(2)-H 巨型页统计信息
每秒1次,共5次
[root@agent ~]# sar -H 1 5

(3)-r 内存使用率
每秒1次,共5次
[root@agent ~]# sar -r 1 5

(4)-S 交换空间统计信息
每秒1次,共5次
[root@agent ~]# sar -S 1 5

(5)-W 交换统计信息
[root@agent ~]# sar -W 1 5

6.slabtop
(1) 输出内核slab缓存使用情况
每5s显示一次
[root@agent ~]# slabtop -d 5

7.numstat
(1)查询CPU插槽系数
为非统一内存访问(NUMA)系统提供统计数据
[root@agent ~]# numastat

8.ps
(1) 列出包括内存使用同统计信息在内的所有进程细节
[root@agent ~]# ps aux

(2)数据列用SVR4 方式的-o选择
[root@agent ~]# ps -eo pid,pmem,vsz,rss,comm

9.top
(1) 显示内存使用统计信息
[root@agent ~]# top -o %MEM

10.pmap
(1) 列出一个进程的内存映射,显示其大小、权限和映射对象
[root@agent ~]# pmap -x 755

(2)-X 显示更多的细节
[root@agent ~]# pmap -X $(pgrep mysqld) | head -2

(3)-XX 显示内核提供的“一切”
[root@agent ~]# pmap -XX $(pgrep mysqld) | head -2

11.perf
(1) 采样整个系统的缺页(RSS增长)机器栈踪迹,按下CTRL+C组合键结束
[root@agent ~]# perf record -e page-faults -a -g


(2)记录pid为755的进程在60秒内发生的所有却也及其栈踪迹
[root@agent ~]# perf record -e page-faults -c 1 -p 755 -g -- sleep 60


(3)通过brk记录栈的增长,按下CTRL+C组合键结束
[root@agent ~]# perf record -e syscalls:sys_enter_brk -a -g


(4)记录NUMA系统上的页迁移情况
[root@agent ~]# perf record -e migrate:mm_migrate_pages -a


(5)使用栈踪迹来跟踪kswapd唤醒时间,按下CTRL+C组合键结束
[root@agent ~]# perf record -e vmscan:mm_vmscan_wakeup_kswapd -ag


12.bpftrace
(1)按代码路径对进程堆扩张情况(brk)计数
[root@agent ~]# bpftrace -e 'tracepoint:syscalls:sys_enter_brk { @[ustack,comm] = count(); }'

(2)按跟踪点对vmscan操作数量计数
[root@agent ~]# bpftrace -e 'tracepoint:vmscan:* { @[probe] = count(); }'

(3)按进程对swapins操作数量计数
[root@agent ~]# bpftrace -e 'kprobe:swap_readpage { @[comm,pid] = count(); }'

(4) 对页迁移数量计数
[root@agent ~]# bpftrace -e 'tracepoint:migrate:mm_migrate_pages { @ = count(); }'
(5)跟踪内存压缩事件
[root@agent ~]# bpftrace -e 't:compaction:mm_compaction_begin { time(); }'

(6)列出内核kmem的跟踪点
[root@agent ~]# bpftrace -l 't:mm_*'

(7)列出所有内存子系统(mm)的跟踪点
[root@agent ~]# bpftrace -l 't:mm_*'
二、问题
1.接口读写报错
(1)报错
提示“不支持的操作”或 "Operation not supported"

(2)原因分析
查看当前内核版本

5.4 版本的内核在 "psi_proc_init" 函数中没有进行 "psi_enable" 的判断,就直接创建了 "/proc" 下的这些文件,导致可以看到而不能使用。
(3)解决方法
此问题已在 5.6 版本里修复了,如下面的commit。
sched/psi: create /proc/pressure and /proc/pressure/{io|memory|cpu} o… · torvalds/linux@3d81768 · GitHub
2.slabtop如何安装
(1)安装
yum install procps-ng
(2)使用
slabtop -d 5 #每5s显示一次
(3)参数
| 选项 | 说明 |
|---|---|
| -d n / --delay=n | 设置显示的时间间隔 |
| -s S / --sort=S | 设置排序规则。a,以活动对象数目排序;b,以每个slab对象数目排序;c,以缓存大小排序;l,以slab数量排序;v,以多动的slab排序;n,以名字排序;o,以对象数目排序;p,以每slab的页数排序;u,以缓存利用率排序 |
| -o /--once | 只显示一次,之后退出 |
| -V / --version | 显示版本信息,并且退出 |
| --help | 显示帮助信息,并且退出 |
设置排序规则
[root@agent ~]# slabtop -s S

只显示一次,之后退出

显示版本信息
[root@agent ~]# slabtop -V

显示帮助信息
[root@agent ~]# slabtop --help

3.numactl如何安装
(1)安装
yum -y install numactl

(2) 使用
numactl -H #查看当前服务器的NUMA配置。

(3)参数
--show:可以查看当前的numa策略,-H:可以显示各Node中内存使用情况--membind:只从某节点分配内存,当某节点内存不足,则会分配失败,格式:numactl --membind=nodes program(nodes写你要分配的节点0或1或者其它节点数,后面是程序,可以写绝对路径,也可写服务启动脚本)--numactl:把进程绑定到某节点上,用法如下:numactl --cpunodebind=nodes program(nodes为Cpu节点,后面跟程序,)--physcpubind:把进程绑定到某核心上,如果程序运行,用法如下(参数太长就简写了,其它简写参数自己Man):numactl -C 1,3 httpd--localalloc:指令永远在当前节点分配内存,用法:numactl -l httpd--preferred:如果指定的内存无法分配足够的空间,可以指定去某一个节点的内存分配,格式如下:numactl --preferred=0 http
4.numad启动服务与关闭NUMA
(1)numad
numad是一个自动numa亲和度管理进程。监控NUMA拓扑和资源使用,来动态提高NUMA资源分配和管理。
(2)启动命令
service numad start
(3)关闭NUMA
方法一:通过bios关闭
BIOS:interleave = Disable / Enable
方法二:通过OS关闭
①编辑 /etc/default/grub 文件,加上:numa=off
GRUB_CMDLINE_LINUX="crashkernel=auto numa=off rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet"
②重新生成 /etc/grub2.cfg 配置文件
grub2-mkconfig -o /etc/grub2.cfg
③ 重启操作系统
reboot
④ 确认
# dmesg | grep -i numa# cat /proc/cmdline
5. perf如何安装
(1)查看当前可用的内核发行版本
yum --disablerepo="*" --enablerepo="elrepo-kernel" list available
(2)安装
yum --enablerepo=elrepo-kernel install perf

6. kernel-lt-doc与kernel-lt-tools-libs-devel如何安装
(1)查看当前可用的内核发行版本
yum --disablerepo="*" --enablerepo="elrepo-kernel" list available

(2) 安装依赖包
yum --enablerepo=elrepo-kernel install kernel-lt-doc \
kernel-lt-tools-libs-devel

7.bpftrace如何安装
(1)查询
rpm -qa | grep bcc-static
rpm -qa | grep bcc-tools
rpm -qa | grep bpftrace
rpm -qa | grep bpftrace-tools
rpm -qa | grep bpftrace-doc


(2)添加repo
curl https://repos.baslab.org/rhel/7/bpftools/bpftools.repo --output /etc/yum.repos.d/bpftools.repo
(2)安装
yum install bpftrace bpftrace-tools bpftrace-doc bcc-static -y

8. drsnoop如何使用
(1) 跟踪通过直接回收释放内存的方法,显示受影响的进程和延时
drsnoop -T
相关文章:
性能分析与调优: Linux 内存观测工具
目录 一、实验 1.环境 2.vmstat 3.PSI 4.swapon 5.sar 6.slabtop 7.numstat 8.ps 9.top 10.pmap 11.perf 12.bpftrace 二、问题 1.接口读写报错 2.slabtop如何安装 3.numactl如何安装 4.numad启动服务与关闭NUMA 5. perf如何安装 6. kernel-lt-doc与kern…...
【ARM 嵌入式 编译系列 3.4 -- 查看所依赖库文件的路径 详细介绍】
文章目录 问题背景库文件路径查看库文件路径信息打印显示连接标准库不使用标准库 libgcc.a问题背景 在自己构建的 Makefle系统中对 cortex-m33 代码编译时,在链接阶段总是报出下面问题 ... arm-none-eabi-ld: cannot find libgcc.a: No such file or directory arm-none-eab…...
分布式锁3: zk实现分布式锁3 使用临时顺序节点+watch监听实现阻塞锁
一 zk实现分布式锁 1.1 使用临时顺序节点 的问题 接上一篇文章,每个请求要想正常的执行完成,最终都是要创建节点,如果能够避免争抢必然可以提高性能。这里借助于zk的临时序列化节点,实现分布式锁 1. 主要修改了构造方法和lock方…...
google drive api
1.创建oauth2 json 文件 https://developers.google.com/drive/api/quickstart/pythoncchttps://developers.google.com/drive/api/quickstart/python这里要注意quickstart的code会经常更新,有可能之前的版本不能用了 比方说下面这个包 from google.oauth2.crede…...
3_代理模式(动态代理JDK原生和CGLib)
一.代理模式 1.概念 代理模式(Proxy Pattern )是指为其他对象提供一种代理,以控制对这个对象的访问,属于结构型模式。 在某些情况下,一个对象不适合或者不能直接引用另一个对象,而代理对象可以在客户端和目标对象之间起到中介的…...
Linux的权限(1)
目录 操作系统的"外壳"程序 外壳程序是什么? 为什么存在外壳程序? 外壳程序怎么运行操作? 权限 什么是权限? 权限的本质? Linux中的(人)用户权限? su和su -的区别…...
数据安全保障的具体措施有哪些
随着信息化时代的到来,数据已经成为企业和社会发展的重要资产。然而,数据安全问题也日益突出,如何保障数据的安全性、完整性和可用性成为了亟待解决的问题。以下将详细探讨数据安全保障的各个方面,以期为企业和社会提供更好的数据…...
浅谈标签及应用场景
一、标签的定义 标签是根据业务场景的需求,通过对目标对象(包含静态、动态特性),运用抽象、归纳、推理等算法得到的高度精炼的特征标识,用于差异化管理与决策。标签由标签名称和标签值组成,打在目标对象上…...
Linux动态分配IP与正向解析DNS
目录 一、DHCP分配 1. 动态分配 1.1 服务端服务安装 1.2 修改服务端dhcp配置 1.3 修改客户端dhcp,重启查询网卡信息 2. 根据mac固定分配 2.1 修改服务器端dhcp服务配置 2.2 客户端自动获取,查看网卡信息 二、时间同步 1. 手动同步 2. 自动同…...
pyspark 使用udf 进行预测,发现只起了一个计算节点
PySpark UDF 只使用一个计算节点的问题 原因分析 默认的并行度设置 PySpark在执行UDF(用户定义函数)时,默认可能不会利用所有可用的计算节点。这是因为UDF通常在单个节点上执行,并且如果没有正确设置分区,可能会导致数…...
mysql触发器的简单使用
mysql触发器 触发器是一个特殊的存储过程,在事件delete、insert、update发生时自动执行一条或多条SQL语句(执行多条SQL语句需要用begin、end 包裹起来) 创建触发器 创建触发器的四大必要条件 唯一的触发器名称触发器关联的表触发器响应的…...
全志T113开发板Qt远程调试
1引言 通常情况下工程师在调试Qt程序时,需要频繁制作镜像烧录到核心板来测试Qt程序是否完善,这样的操作既费时又费力。这时我们可以通过QtCreator设备功能,定义设备后,在x86_64虚拟机上交叉编译qt程序,将程序远程部署到…...
学习使用php、js脚本关闭当前页面窗口的方法
学习使用php、js脚本关闭当前页面窗口的方法 前言方法一:使用JavaScript代码方法二:通过http头文件来实现方法三:使用服务器端脚本来实现 前言 在开发web应用程序时,我们通常需要在不同的网页之间进行导航。通常情况下࿰…...
python 人脸检测与人脸识别
安装库文件: pip install dlib face_recognition import dlib import face_recognition import cv2 from PIL import Image, ImageDraw# 判断运行环境 cpu or gpu def check_env():print(dlib.DLIB_USE_CUDA)print(dlib.cuda.get_num_devices())# 判断人脸在图片当中的位置 def…...
RT-Thread: ulog 日志 讲解和使用
说明:记录 RT-Thread: ulog 日志功能和使用流程。 官网资料链接: https://docs.rt-thread.org/#/rt-thread-version/rt-thread-standard/programming-manual/ulog/ulog 1.ulog 简介 日志的定义:日志是将软件运行的状态、过程等信息&#x…...
git ssh key 配置
一、Profile Settings-->SSH Keys 我们点击这里会有详情的文档介绍生成sshkey。 ssh-keygen -t rsa -b 2048 -C "邮箱" --回车... 将生成的id_rsa.pub粘贴到如下保存 git config --global user.name "用户名" git config --global user.email "邮…...
MongoDB聚合:$documents
$documents阶段可以根据输入值返回字面意义的文档。 语法 { $documents: <表达式> }$documents接受可解析为对象数组的任何有效表达式,包括: 系统变量,如 $$NOW 或 $$SEARCH_META $let 表达式 $lookup 表达式作用域中的变量 没有…...
程序员英语 - 英文会议常用句型
相信大部分程序员都会有如下经历: 产品经理(BA)们在和外系统聊集成方案时或者给用户解决某个问题时发现搞不定了,这个时候就会拉上程序员一起上会参与讨论或者排查问题,但程序员们英文又不好,上了会又听不懂…...
UV贴图和展开初学者指南
在线工具推荐: 3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 介绍 这正是本文的主题——UV贴图——登上舞台的时候。大多数 3D 建…...
解密Path环境变量
解密Path环境变量 大家好,我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天,让我们一起深入探讨程序开发中不可或缺的一项关键技术——“path环境变量”。无论…...
Vue记事本应用实现教程
文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展:显示创建时间8. 功能扩展:记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...
R语言AI模型部署方案:精准离线运行详解
R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...
python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken:OpenAI开发的专业"分词器" torch:Facebook开发的强力计算引擎,相当于超级计算器 理解词嵌入:给词语画"…...
拉力测试cuda pytorch 把 4070显卡拉满
import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小,增大可提高计算复杂度duration: 测试持续时间(秒&…...
CRMEB 框架中 PHP 上传扩展开发:涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云
目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展 扩展入口文件 文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...
【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的“no matching...“系列算法协商失败问题
【SSH疑难排查】轻松解决新版OpenSSH连接旧服务器的"no matching..."系列算法协商失败问题 摘要: 近期,在使用较新版本的OpenSSH客户端连接老旧SSH服务器时,会遇到 "no matching key exchange method found", "n…...
C++课设:简易日历程序(支持传统节假日 + 二十四节气 + 个人纪念日管理)
名人说:路漫漫其修远兮,吾将上下而求索。—— 屈原《离骚》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 专栏介绍:《编程项目实战》 目录 一、为什么要开发一个日历程序?1. 深入理解时间算法2. 练习面向对象设计3. 学习数据结构应用二、核心算法深度解析…...
Webpack性能优化:构建速度与体积优化策略
一、构建速度优化 1、升级Webpack和Node.js 优化效果:Webpack 4比Webpack 3构建时间降低60%-98%。原因: V8引擎优化(for of替代forEach、Map/Set替代Object)。默认使用更快的md4哈希算法。AST直接从Loa…...
Bean 作用域有哪些?如何答出技术深度?
导语: Spring 面试绕不开 Bean 的作用域问题,这是面试官考察候选人对 Spring 框架理解深度的常见方式。本文将围绕“Spring 中的 Bean 作用域”展开,结合典型面试题及实战场景,帮你厘清重点,打破模板式回答,…...




