当前位置: 首页 > news >正文

6.4 CPU性能分析--Intel处理器跟踪技术

Intel处理器跟踪PT技术记录程序执行过程技术它把记录信息编码存到高压缩二进制文件中二进制文件结合每条指令时间戳重建执行PT技术覆盖度开销有关开销信息详见主要用于性能问题事后分析根因定位

6.4.1 工作流

类似于采样技术PT技术不需要修改任何源代码只要支持PT技术工具下运行目录程序然后抓取跟踪文件即可一旦启动PT基准测试程序开始运行分析工具开始跟踪报文记录到DRAM

类似于LBR Intel PT技术通过记录分支实现程序运行只要CPU遇到分支跳转指令PT将会记录这个分支跳转指令输出对于简单分支跳转指令CPU会用一位记录是被选中还是选中NT对于间接调用PT记录目标地址注意条件分支跳转指令不会记录因为我们知道目标地址

37展示小型指令序列编码类似PUSH,MOV, ADDCMP这样指令会被忽略因为他们不会改变控制然而指令JE可能会跳转label, 所以结果需要记录下来

在分析我们应用程序二进制文件采集PT跟踪信息汇总到一起软件解码器需要应用程序二进制文件重建程序执行入口开始然后采集跟踪信息作为查询参考决定控制流38展示一个解析Intel PT文件例子假设Push指令应用程序二进制文件入口点然后Push mos addCMP保持原来重建这一步查询解析跟踪信息接着软件解码器开始处理JE指令分支跳转指令因此我们需要查询分支跳转指令输出根据38跟踪文件JE条件选中T所以跳过MOV指令调用了CALL指令

我们接着继续分析CALL 也是一个可以改变控制指令因此我们需要解析后跟踪信息查找目标地址它是0x407e1d8高亮指令程序运行过程被执行注意这就是程序运行精确重建并且不会跳过任何指令接下来我们可以通过调试信息汇编指令映射回源代码获得源代码逐行日志

运行时

指令 编码

push

mov

cmp

je.label

mov

label

call 虚函数

37 Intel处理器跟踪PT编码

6.4.2 时间报文

Intel PT工具不仅可以跟踪执行还可以记录时间信息作为保存跳转目标地址补充PT工具还可以产生时间报文39提供了一个时间报文如何用来恢复指令时间戳可视化展示示例前面例子一样我们首先看到JNE没有选中所以需要把它之上所有指令时间戳更新0ns, 然后我们看到一个2ns时间更新JE指令选中所以把它之上所有指令时间戳都更新2ns往后一条间接调用指令但是没有相关时间报文所以我们不需要更新时间戳然后我们看到一个100ns时间更新并且指令JB没有被选中所以其上所有指令时间戳都要更新102ns

39指令数据非常精确但是时间信息没有那么精确显然指令CALL TESTJB不会同时发生但是我们没有有关它们更精确时间信息有了时间戳我们可以程序系统其他事件时间间隔进行对齐并且很容易挂钟时间进行比较某些实现跟踪时许可以通过时钟周期精确模式进一步改进其中硬件记录正常数据报文之间时钟周期计数

分析

指令

mov

jnz

add

cmp

je.label

mov

.label

call

test

jb

6.4.3 采集和解析跟踪文件

Linux perf工具可以方便采集IntelPT跟踪文件

perf record -e intel_pt/cycle/u ./a.out

6.4.4 用法

可能使用PT技术处理的几个例子

1 分析性能问题 因为PT会采集所有指令所以可以分析应用程序无响应一小段时间发生了什么更多详细例子相见easyperf 博客上文章

2 事后调试 PT跟踪文件可以使用传统调试工具此外PT还会提供调试信息即使破坏情况也总是有效PT跟踪文件可以远程机器上采集然后再离线分析

3 程序执行回溯

可以快速发现哪些代码路径从未被执行

借助时间戳发生自旋锁尝试可以计算出等待花费多长时间

通过检测待定指令模式检测安全问题

相关文章:

6.4 CPU性能分析--Intel处理器跟踪技术

Intel处理器跟踪PT技术是记录程序执行过程的技术,它把记录信息编码报文存到高压缩率的二进制文件中。该二进制文件结合每条指令的时间戳重建执行流。PT技术覆盖度大,开销小,有关开销的信息详见,主要用于性能问题的事后分析和根因定…...

期权懂|如何用第三方平台开通期权?

期权小懂每日分享期权知识,帮助期权新手及时有效地掌握即市趋势与新资讯! 如何用第三方平台开通期权? 如果不能满足常规的期权开户条件,可以考虑以下几种方法来尝试开户: 一、选择第三方平台: 通过网络搜…...

JS中const有没有变量提升

在JavaScript中,const 关键字用于声明一个只读的常量,其值在初始化后不能被重新赋值。关于变量提升(Hoisting),它是JavaScript中一个重要的概念,指的是无论变量或函数声明在何处,它们都会被“提…...

Axure RP全面介绍:功能、应用与中文替代方案

Axure RP是一款功能强大的原型设计工具,它被广泛应用于网页和移动应用的设计领域。Axure RP集成了设计、原型制作和文档管理,为产品管理人员、设计师和开发人员提供了一个综合的平台。让我们一步步了解Axure的基本功能、使用技巧以及中文支持平台——“在…...

WordPress用户首次登录强制修改密码

有些企业网站要求很高,比如用户首次登录强制要求修改密码,这里提供一段代码,用于实现强制修改密码供参考。 通过代码可以实现,用户正常注册或者管理员在后台添加用户时,会添加首次登录标记,用户首次登录后会…...

AI开源南京分享会回顾录

AI 开源南京分享会,已于2024年11月30日下午在国浩律师(南京)事务所5楼会议厅成功举办。此次活动由 KCC南京、PowerData、RISC-Verse 联合主办,国浩律师(南京)事务所协办。 活动以“开源视角的 AI 对话”为主…...

基于事件驱动的websocket简单实现

websocket的实现 什么是websocket? WebSocket 是一种网络通信协议,旨在为客户端和服务器之间提供全双工、实时的通信通道。它是在 HTML5 规范中引入的,可以让浏览器与服务器进行持久化连接,以便实现低延迟的数据交换。 WebSock…...

【leetcode100】反转链表

1、题目描述 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 2、初始思路 2.1 思路 # Definition for singly-linked list. # class ListNode: # …...

禅道Bug的一次迁移

一、场景 平时工作记录在公司禅道上的问题想备份一份到本地,但是又没有公司禅道的数据库信息,有时候出测试报告想批量调整数据方便截图很困难,同时也为了学习禅道数据流转过程,所以有了把缺陷保存到本地一份的想法。 实际上禅道支…...

c段和旁站讲解(附查询网址)

1. C段(C类子网段) C段就是一个IP地址的小范围。比如,假设你有一个家庭Wi-Fi网络,Wi-Fi会分配给你一组IP地址(每个设备一个IP地址)。如果你的网络分配的是类似 192.168.1.0 这样的IP地址,那么这…...

Linux编译Kernel时的文件zImage、文件dtb(dtbs)、核心模块分别是什么东西?

zImage文件的介绍 在编译Linux内核时,zImage 是一种内核映像文件,它是内核的压缩版本,通常用于引导嵌入式设备或其他资源有限的环境。 zImage 的具体含义 zImage 是 “Compressed Kernel Image” 的缩写。它是通过压缩原始的内核映像&…...

【深度学习】深刻理解“变形金刚”——Transformer

Transformer 是一种用于处理序列数据的深度学习模型架构,最初由 Vaswani 等人在 2017 年的论文《Attention is All You Need》中提出。它彻底改变了自然语言处理(NLP)领域,成为许多高级任务(如机器翻译、文本生成、问答…...

75_pandas.DataFrame 中查看和复制

75_pandas.DataFrame 中查看和复制 与pandas的DataFrame与NumPy数组ndarray类似,也有视图(view)和拷贝(copy)。 当使用loc[]或iloc[]等选择DataFrame的一部分以生成新的DataFrame时,与原对象共享内存的对…...

打电话玩手机识别-支持YOLO,COCO,VOC格式的标记,超高识别率可检测到手持打电话, 非接触式打电话,玩手机自拍等

打电话玩手机识别-支持YOLO,COCO,VOC格式的标记,超高识别率可检测到手持打电话, 非接触式打电话,玩手机自拍等1275个图片。 手持打电话: 非接触打电话 玩手机 数据集下载 yolov11:https://download.csdn…...

生产慎用之调试日志对空间矢量数据批量插入的性能影响-以MybatisPlus为例

目录 前言 一、一些缘由 1、性能分析 二、插入方式调整 1、批量插入的实现 2、MP的批量插入实现 3、日志的配置 三、默认处理方式 1、基础程序代码 2、执行情况 四、提升调试日志等级 1、在logback中进行设置 2、提升后的效果 五、总结 前言 在现代软件开发中,性能优…...

单片机:实现倒计时(附带源码)

使用单片机实现倒计时功能是一个常见的嵌入式应用,它能帮助你更好地理解如何进行时间控制和如何通过定时器实现精确的倒计时。通过该项目,你将学习如何使用单片机的定时器来进行时间计算,并通过LED或LCD显示倒计时的结果。 1. 项目概述 倒计…...

什么是多线程中的上下文切换

什么是多线程中的上下文切换 回答 上下文切换是指CPU从一个线程转到另一个线程时,需要保存当前线程的上下文状态,恢复另一个线程的上下文状态,以便于下一次恢复执行该线程时能够正确地运行。 在多线程编程中,上下文切换是一种常…...

如何在windwos批量拉取go mod

golang go-zero微服务开发,分的rpc项目太多了,变更了公共包,需要手动去拉取,直接一键拉取就好了,创建一个windwos脚本文件 文件名 tidy_all_go_mod.ps1 代码 # 辅助工具拉取go mod tidy # 根目录v99main执行 ./tidy_all_go_mod.ps1 # 定义项目的根目录 $RootDir Get-Locat…...

【Three.js基础学习】29.Hologram Shader

前言 three.js 通过着色器如何实现全息影像&#xff0c;以及一些动态的效果。 一些难点的思维&#xff0c;代码目录 下面图是摄像机视角观看影响上的时候&#xff0c;如何实现光影的渐变&#xff0c;透视以及叠加等。 一、代码 1.index.html <!DOCTYPE html> <html …...

文件包含进阶玩法以及绕过姿态

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 本文整理文件包含漏洞的进阶玩法与绕过姿态 不涉及基础原理了 特殊玩法汇总 本地包含 文件包含上传文件 原理: php的文件包含有着把其他文件类型当做php代码执行的功效&#xff0c;文件上传一般会限制后缀&am…...

河南AI设计课程指南:机构推荐与避坑秘籍

一、AI 设计热潮下的河南求学路在数字化时代的浪潮中&#xff0c;AI 设计正以前所未有的速度席卷各个行业&#xff0c;成为了创新与效率的新代名词。从广告设计、影视制作到电商运营、交互设计&#xff0c;AI 设计不仅能够大幅提升设计效率&#xff0c;还能通过数据分析和算法模…...

使用 Taotoken 后 API 调用延迟与稳定性体验分享

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 使用 Taotoken 后 API 调用延迟与稳定性体验分享 作为一名日常需要频繁调用大模型 API 的开发者&#xff0c;服务的稳定性和响应速…...

RT-Thread中断管理实战:从Cortex-M硬件机制到线程通信

1. 项目概述&#xff1a;从内核到中断&#xff0c;RT-Thread的实战拼图搞嵌入式开发&#xff0c;尤其是用RTOS&#xff0c;中断处理是绕不开的一道坎。之前我们聊RT-Thread的线程、IPC、内存管理&#xff0c;都是在“太平盛世”下进行的&#xff0c;线程们按部就班地运行、等待…...

保姆级教程:用斐讯N1盒子刷Armbian 5.77,打造你的专属Debian服务器(附解决负载过高问题)

斐讯N1盒子改造指南&#xff1a;从电视盒子到高性能家庭服务器的蜕变 在智能家居和个性化网络需求日益增长的今天&#xff0c;拥有一台24小时运行的家庭服务器成为许多技术爱好者的刚需。而斐讯N1盒子凭借其出色的硬件配置和极低的功耗&#xff0c;成为了DIY玩家眼中的"宝…...

录音转文字app免费版有哪些?2026年免费录音转文字app排行榜实测对比

做语音采访、课程记录或会议纪要的时候&#xff0c;经常卡在两个问题上&#xff1a;一是转写完的文字错漏太多得反复修改&#xff0c;二是处理一堆音频文件特别耗时间。微信里有个叫提词匠的小程序在这类需求里效率比较高&#xff0c;下面会重点拆解它&#xff0c;同时对比几个…...

信息量模型避坑指南:搞懂这3个关键点,你的地质灾害评价结果才靠谱

信息量模型避坑指南&#xff1a;搞懂这3个关键点&#xff0c;你的地质灾害评价结果才靠谱 在地质灾害易发性评价领域&#xff0c;信息量模型因其计算简单、结果直观而广受欢迎。然而&#xff0c;许多GIS从业者和科研人员在应用该模型时&#xff0c;常常陷入"流程正确但结果…...

轻量级网页自动化工具 xiaoclaw:基于 CDP 的高效实践指南

1. 项目概述&#xff1a;一个轻量级、可编程的网页自动化工具最近在折腾一些需要自动处理网页数据的小项目&#xff0c;比如定时抓取某个网站的价格变动、自动填写表单、或者模拟一些重复性的点击操作。一开始想用传统的Selenium&#xff0c;但总觉得它有点“重”&#xff0c;启…...

基于Apify与AI模型的产品安全风险智能识别系统构建指南

1. 项目概述&#xff1a;一个面向产品安全与消费者风险管理的智能工具最近在梳理一些供应链和电商合规的项目时&#xff0c;我反复被一个核心痛点困扰&#xff1a;如何系统性地、自动化地识别和评估海量商品信息中潜藏的消费者风险&#xff1f;无论是作为平台方的风控团队&…...

半导体光刻OPC技术:稀疏模型到网格模型的转换实践

1. 光学邻近效应校正&#xff08;OPC&#xff09;技术演进背景在半导体制造的光刻工艺中&#xff0c;光学邻近效应校正&#xff08;Optical Proximity Correction, OPC&#xff09;是一项至关重要的分辨率增强技术。随着制程节点不断微缩至65nm以下&#xff0c;传统的光学模型面…...

如何利用Dask集成ydata-profiling实现大规模数据处理:2024终极指南

如何利用Dask集成ydata-profiling实现大规模数据处理&#xff1a;2024终极指南 【免费下载链接】fg-data-profiling 1 Line of code data quality profiling & exploratory data analysis for Pandas and Spark DataFrames. 项目地址: https://gitcode.com/gh_mirrors/y…...