perf工具使用指导
linux perf工具使用指导
perf 是 Linux 内核自带的性能分析工具,主要用于分析系统性能瓶颈和程序的性能问题。通过合理使用 perf 工具,可以有效地分析和优化系统性能。
安装 perf
在大多数 Linux 发行版中,perf 工具通常随内核源代码包一起提供。可以通过以下命令安装:
Ubuntu/Debian:
sudo apt-get install linux-tools-$(uname -r)
CentOS/RHEL:
sudo yum install perf
基本用法
perf帮助文档:
]# perf --help用法: perf [--version] [--help] [OPTIONS] COMMAND [ARGS]最常用的 perf 命令有:annotate 读取 perf.data(由 perf record 创建)并显示带注释的代码archive 创建包含在 perf.data 文件中找到的带有 build-id 的目标文件的归档文件bench 基准测试套件的一般框架buildid-cache 管理 build-id 缓存buildid-list 列出 perf.data 文件中的 build-idc2c 共享数据 C2C/HITM 分析器config 获取和设置配置文件中的变量data 数据文件相关处理diff 读取 perf.data 文件并显示差异分析evlist 列出 perf.data 文件中的事件名称ftrace 内核 ftrace 功能的简单封装inject 过滤器,用于在事件流中添加附加信息kallsyms 在正在运行的内核中搜索符号kmem 追踪/测量内核内存属性的工具kvm 追踪/测量 KVM 客户操作系统的工具list 列出所有符号事件类型lock 分析锁事件mem 内存访问分析record 运行一个命令并将其性能数据记录到 perf.data 文件中report 读取 perf.data(由 perf record 创建)并显示分析报告sched 追踪/测量调度器属性(延迟)的工具script 读取 perf.data(由 perf record 创建)并显示跟踪输出stat 运行一个命令并收集性能计数器统计数据test 运行完整性测试timechart 可视化工作负载期间系统总体行为的工具top 系统性能分析工具version 显示 perf 二进制文件的版本probe 定义新的动态跟踪点trace 类似 strace 的工具参见 'perf help COMMAND' 以获取有关特定命令的更多信息。
perf 提供了多种子命令,以下是一些常用的命令:
- 查看 CPU 性能计数器:
perf stat <command>
该命令会运行指定的命令并显示其 CPU 性能统计信息。
- 记录性能数据:
perf record -a
该命令会在系统上收集性能事件,-a 选项表示全局记录(包括所有 CPU)。该命令会在当前路径下生成perf.data
- 分析性能数据:
perf report
该命令会显示 perf record 收集到的数据的分析报告。读取当前路径下的perf.data文件。
- 跟踪特定进程:
perf trace -p <pid>
该命令会实时跟踪指定进程的系统调用。
实际应用场景
- 识别性能瓶颈:
使用 perf stat 监控程序的性能,以识别潜在的瓶颈,如 CPU 使用率、缓存命中率等。
- 函数级别性能分析:
使用 perf record 和 perf report,分析函数执行的耗时,帮助定位慢函数。
- 系统调用跟踪:
使用 perf trace 跟踪特定进程的系统调用,以分析 I/O 性能和系统调用的开销。
示例
- 统计命令执行的性能:
]# perf stat ls
anaconda-ks.cfg keys notation
ca.crt kubeconfig perf.data.old
cirros-0.5.2-x86_64-disk.img kubeconfig.kubemark perf-tests.tar.gz
cosign kubectl-ko pki
create_project_harbor.sh kubesphere pull-image-ceph.sh
download-etcd.sh kubesphere1-conf push-image-ceph.sh
go kubesphere2-1-conf registry2.7.tar
go1.22.4.linux-amd64.tar.gz kubesphere-argoproj.tar rook-ceph
harbor kuboard-spray-resource.tar sockperf-3.8.tar.gz
helm minio test-del.tar
ip_add.txt MrDoc trivy
iperf3-3.1.7-3.el7_9.x86_64.rpm myproject trivy_0.53.0_Linux-64bit.rpm
iperf3-tools.sh netperf-2.7.0.tar.gz trivy-db.tar.gz
k8s1.23.15-kubesphere3.4.1 nginx-ingress-controller.tag.gzPerformance counter stats for 'ls':1.92 msec task-clock # 0.808 CPUs utilized 0 context-switches # 0.000 K/sec 1 cpu-migrations # 0.521 K/sec 261 page-faults # 0.136 M/sec <not supported> cycles <not supported> instructions <not supported> branches <not supported> branch-misses 0.002374917 seconds time elapsed0.000000000 seconds user0.002503000 seconds sys
- 记录整个系统的性能数据:
]# perf record -a -g -- sleep 10
[ perf record: Woken up 26 times to write data ]
[ perf record: Captured and wrote 7.078 MB perf.data (59077 samples) ]
- 分析记录的数据:
[root@harbor ~]# perf reportSamples: 59K of event 'cpu-clock', Event count (approx.): 14769250000 Children Self Command Shared Object Symbol
+ 96.81% 0.00% swapper [kernel.kallsyms] [k] start_cpu
+ 96.81% 0.01% swapper [kernel.kallsyms] [k] cpu_startup_entry
+ 96.65% 0.01% swapper [kernel.kallsyms] [k] arch_cpu_idle
+ 96.64% 0.01% swapper [kernel.kallsyms] [k] default_idle
+ 96.25% 96.25% swapper [kernel.kallsyms] [k] native_safe_halt
+ 69.10% 0.00% swapper [kernel.kallsyms] [k] start_secondary
+ 27.71% 0.00% swapper [kernel.kallsyms] [k] x86_64_start_kernel
+ 27.71% 0.00% swapper [kernel.kallsyms] [k] x86_64_start_reservations
+ 27.71% 0.00% swapper [kernel.kallsyms] [k] start_kernel
+ 27.71% 0.00% swapper [kernel.kallsyms] [k] rest_init0.39% 0.00% swapper [kernel.kallsyms] [k] irq_exit0.39% 0.00% swapper [kernel.kallsyms] [k] do_softirq0.39% 0.00% swapper [kernel.kallsyms] [k] call_softirq0.38% 0.07% swapper [kernel.kallsyms] [k] __do_softirq0.32% 0.00% swapper [kernel.kallsyms] [k] apic_timer_interrupt0.32% 0.00% swapper [kernel.kallsyms] [k] smp_apic_timer_interrupt0.32% 0.00% containerd-shim containerd-shim-runc-v2 [.] 0x000000000046b6c10.28% 0.00% runc [kernel.kallsyms] [k] async_page_fault0.28% 0.00% runc [kernel.kallsyms] [k] do_async_page_fault0.28% 0.00% runc [kernel.kallsyms] [k] trace_do_page_fault0.28% 0.03% runc [kernel.kallsyms] [k] __do_page_fault0.28% 0.00% runc runc [.] runtime.goexit.abi00.26% 0.00% runc runc [.] runtime.main0.25% 0.01% runc [kernel.kallsyms] [k] handle_mm_fault0.23% 0.00% runc [kernel.kallsyms] [k] native_flush_tlb_others0.22% 0.00% containerd-shim containerd-shim-runc-v2 [.] 0x00000000004698ca0.22% 0.21% runc [kernel.kallsyms] [k] smp_call_function_many0.18% 0.00% containerd-shim containerd-shim-runc-v2 [.] 0x000000000087eeeb0.17% 0.00% containerd-shim [kernel.kallsyms] [k] system_call_fastpath0.16% 0.00% runc [kernel.kallsyms] [k] do_wp_page0.16% 0.00% runc [kernel.kallsyms] [k] wp_page_copy.isra.730.16% 0.00% runc:[2:INIT] [kernel.kallsyms] [k] async_page_fault0.16% 0.01% runc:[2:INIT] [kernel.kallsyms] [k] __do_page_fault0.16% 0.00% runc:[2:INIT] [kernel.kallsyms] [k] do_async_page_fault0.16% 0.00% runc:[2:INIT] [kernel.kallsyms] [k] trace_do_page_fault0.15% 0.00% runc [kernel.kallsyms] [k] ptep_clear_flush0.15% 0.00% runc [kernel.kallsyms] [k] flush_tlb_page
其他用法
不同的子命令有更详细的用法,请通过perf COMMAND --help 或者perf help COMMAND查看。
注意事项
- 使用
perf时,某些操作可能需要 root 权限,特别是全局记录和跟踪系统调用。 - 在高负载系统中,
perf可能会对性能产生一定影响,建议在性能测试或故障排查时使用。
相关文章:
perf工具使用指导
linux perf工具使用指导 perf 是 Linux 内核自带的性能分析工具,主要用于分析系统性能瓶颈和程序的性能问题。通过合理使用 perf 工具,可以有效地分析和优化系统性能。 安装 perf 在大多数 Linux 发行版中,perf 工具通常随内核源代码包一起…...
WordPress 禁用上传媒体图片自动生成缩略图及多尺寸图片教程
一、在 设置-媒体-媒体设置 中几个尺寸大小的设置不勾选或设置为 0,如下图: 二、找到主题文件 function.php 文件,打开后,在 <?php 后面添加如下代码: function.php 文件路径一般为:WordPress网站根目录…...
锥线性规划【分布鲁棒、两阶段鲁棒方向知识点】
1 锥线性对偶理论 本部分看似和分布鲁棒、两阶段鲁棒优化没什么关系,但值得优先学习,原因将在最后揭晓。 二阶锥 二阶锥(second-order cone,又称ice-cream/Lorentz cone)的形式为: 非负象限锥 半正定锥 …...
linux环境下的程序设计与git操作
目录 前言: 进度条小程序: 先介绍几个背景知识 代码实现 Git操作 总结 其他指令 前言: 本文将重点介绍1. linux下的程序设计,并使用linux下的几个函数接口。实现一个简单的小程序 2.本着开源精神,进行git操作。…...
Matlab中HybridFcn参数的用法
在 MATLAB 中,HybridFcn 参数允许你在全局优化(如遗传算法 ga 或粒子群算法 particleswarm)之后使用局部优化算法进一步微调解的精确度。HybridFcn 通过在全局优化找到的解基础上,进一步调用局部优化器,如 fmincon、pa…...
Leetcode 3316. Find Maximum Removals From Source String
Leetcode 3316. Find Maximum Removals From Source String 1. 解题思路2. 代码实现 题目链接:3316. Find Maximum Removals From Source String 1. 解题思路 这一题思路上的话就是一个动态规划的题目,我们仿照lcs,考察每一个位置是否可以…...
jeecg3版本的vue,离线启动
jeecg的vue2版本已经停止维护,所以只能用vue3的版本。3版本中使用的是pnpm(npm的增强版本)下载依赖。使用pnpm安装的node_modules,不能直接复制到离线主机中(因为在 pnpm安装过程中,会给依赖的配置文件写死…...
C++的内存管理
[TOC} C的内存管理 各个区储存内容 1.栈 局部变量和在执行函数时,函数中创建的局部变量都会在栈上创建,函数执行结束时会被自动释放。从高地址向低地址储存。 2.堆 是new/malloc/calloc/realloc分配的代码块,需要手动释放。如果程序员没…...
YZ系列工具之YZ09:VBA_Excel之读心术
我给VBA下的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套一部VBA手册,教程分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的…...
嵌入式系统---看门狗
在嵌入式系统中,看门狗定时器(Watchdog Timer,WDT)是一种常用的机制,用于检测和恢复系统在异常情况下的故障。如果系统因为某种原因(如软件死循环)而变得无响应,看门狗定时器可以自动…...
从MySQL5.7迁移到8.0时,有哪些重要的参数调整或新参数需要注意?
从 MySQL 5.7 迁移到 MySQL 8.0 时,有一些重要的参数调整和新参数需要注意。MySQL 8.0 引入了许多新功能和改进,同时也对一些现有参数进行了更改或废弃。 1. lower_case_table_names 说明: 控制表名是否区分大小写。重要性: 在迁移过程中,确…...
完整发布/上传uniapp Ios应用到App Store流程
使用uniapp打包,假如使用app store证书打包出来的ipa文件,需要上传到app store上才能上架。假如你还没有app store证书,还没有打包,你可以参考下面这篇文章,先创建打包证书再继续看这篇上架的教程:https://…...
CodeActAgent :Executable Code Actions Elicit Better LLM Agents解读
论文地址 https://arxiv.org/pdf/2402.01030.pdf 项目地址 https://github.com/svjack/CodeActAgent-Gradio/blob/main/README.md 代码智能体的优势 选择代码智能体有以下几个关键原因,它们相较于使用类似JSON的字典输出具有显著优势: 1. 代码的高…...
中小型医院网站开发:Spring Boot入门
2 相关技术简介 2.1 Java技术 Java是一种非常常用的编程语言,在全球编程语言排行版上总是前三。在方兴未艾的计算机技术发展历程中,Java的身影无处不在,并且拥有旺盛的生命力。Java的跨平台能力十分强大,只需一次编译,…...
Java读取PDF后做知识库问答_SpringAI实现
核心思路: 简单来说,就是把PDF文件读取并向量化,然后放到向量存储里面,再通过大模型,来实现问答。 RAG(检索增强生成)介绍: 检索增强生成&#x…...
打开exe程序显示没有适当的访问权限
打开exe程序显示没有适当的访问权限 打开.exe可执行程序,显示Windows 无法访问指定设备、路径或文件。你可能没有适当的权限访问该项目。 解决方法 鼠标选中该文件或文件夹,右键单击选择属性,在弹出的属性选项卡中切换到安全选项卡…...
Python异步编程:使用`create_task`并发执行协程
Python异步编程:使用create_task并发执行协程 1. 什么是create_task?2. 为什么需要create_task?3. 如何使用create_task?3.1 基本用法3.2 任务的返回值 4. 注意事项5. 总结 在Python的异步编程中,asyncio库为我们提供了…...
从零开始搭建你的DolphinScheduler分布式任务调度平台实战指南
文章目录 前言1. 安装部署DolphinScheduler1.1 启动服务 2. 登录DolphinScheduler界面3. 安装内网穿透工具4. 配置Dolphin Scheduler公网地址5. 固定DolphinScheduler公网地址 前言 本篇教程和大家分享一下DolphinScheduler的安装部署及如何实现公网远程访问,结合内…...
第五课:Python学习之if语句
判断(if)语句 目标 开发中的应用场景if 语句体验if 语句进阶综合应用 01. 开发中的应用场景 生活中的判断几乎是无所不在的,我们每天都在做各种各样的选择,如果这样?如果那样?…… 程序中的判断 # 定义…...
群晖前面加了雷池社区版,安装失败,然后无法识别出用户真实访问IP
有nas的相信对公网都不模式,在现在基础上传带宽能有100兆的时代,有公网代表着家里有一个小服务器,像百度网盘,优酷这种在线服务都能部署为私有化服务。但现在运营商几乎不可能提供公网ip,要么自己买个云服务器做内网穿…...
AtCoder 第409场初级竞赛 A~E题解
A Conflict 【题目链接】 原题链接:A - Conflict 【考点】 枚举 【题目大意】 找到是否有两人都想要的物品。 【解析】 遍历两端字符串,只有在同时为 o 时输出 Yes 并结束程序,否则输出 No。 【难度】 GESP三级 【代码参考】 #i…...
DAY 47
三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...
前端导出带有合并单元格的列表
// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...
Spring Boot+Neo4j知识图谱实战:3步搭建智能关系网络!
一、引言 在数据驱动的背景下,知识图谱凭借其高效的信息组织能力,正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合,探讨知识图谱开发的实现细节,帮助读者掌握该技术栈在实际项目中的落地方法。 …...
【HarmonyOS 5 开发速记】如何获取用户信息(头像/昵称/手机号)
1.获取 authorizationCode: 2.利用 authorizationCode 获取 accessToken:文档中心 3.获取手机:文档中心 4.获取昵称头像:文档中心 首先创建 request 若要获取手机号,scope必填 phone,permissions 必填 …...
Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...
FTXUI::Dom 模块
DOM 模块定义了分层的 FTXUI::Element 树,可用于构建复杂的终端界面,支持响应终端尺寸变化。 namespace ftxui {...// 定义文档 定义布局盒子 Element document vbox({// 设置文本 设置加粗 设置文本颜色text("The window") | bold | color(…...
Copilot for Xcode (iOS的 AI辅助编程)
Copilot for Xcode 简介Copilot下载与安装 体验环境要求下载最新的安装包安装登录系统权限设置 AI辅助编程生成注释代码补全简单需求代码生成辅助编程行间代码生成注释联想 代码生成 总结 简介 尝试使用了Copilot,它能根据上下文补全代码,快速生成常用…...
C#最佳实践:为何优先使用as或is而非强制转换
C#最佳实践:为何优先使用as或is而非强制转换 在 C# 的编程世界里,类型转换是我们经常会遇到的操作。就像在现实生活中,我们可能需要把不同形状的物品重新整理归类一样,在代码里,我们也常常需要将一个数据类型转换为另…...
使用 uv 工具快速部署并管理 vLLM 推理环境
uv:现代 Python 项目管理的高效助手 uv:Rust 驱动的 Python 包管理新时代 在部署大语言模型(LLM)推理服务时,vLLM 是一个备受关注的方案,具备高吞吐、低延迟和对 OpenAI API 的良好兼容性。为了提高部署效…...
