ARM64 指令用法学习整理
1. CBZ
当我们谈论ARM64指令集时,CBZ(Compare and Branch on Zero)是一种条件分支指令。它用于在寄存器上进行比较,并且如果该寄存器的值为零,则跳转到指定的标签或地址。
CBZ指令的基本语法如下:
CBZ <寄存器>,<标签>
其中,<寄存器>是一个通用寄存器(例如X0、X1等),而<标签>是跳转的目标标签或地址。
CBZ指令执行的操作如下:
比较寄存器中的值是否为零。
如果寄存器的值为零,则根据指定的标签或地址进行无条件跳转,程序继续执行跳转后的那条指令。
如果寄存器的值不为零,则程序继续顺序执行下一条指令。
下面是一个示例代码段,演示了如何使用CBZ指令:
CBZ X0, Label ; 如果X0的值为零,跳转到Label标签处
... ; 如果X0的值不为零,继续执行下一条指令
Label:
… ; 如果X0的值为零,从此处开始执行
在上述示例中,如果寄存器X0的值为零,则会跳转到标签Label处执行相应的代码;否则,程序将继续执行下一条指令。
值得注意的是,CBZ指令用于判断寄存器值是否为零,它不会修改寄存器的值。因此,在使用CBZ指令前,需要确保寄存器中的值已经被正确赋值。
2. adrp
ADRP指令的基本语法如下:
ADRP <寄存器>, <标签>
其中,<寄存器>是一个通用寄存器(例如X0、X1等),而<标签>是一个数据或代码段的标签。
ADRP指令执行的操作如下:
计算<标签>相对于当前指令的地址偏移量。
将地址偏移量的高32位部分(29至0位)左移12位,并存储到指定的<寄存器>中。
低12位将被清零。这是因为ARM64指令集的访存操作要求地址必须在4字节对齐上。
以下是一个示例代码段,演示了如何使用ADRP指令:
ADRP X0, Label ; 将Label标签的地址的高32位存储到X0寄存器中
... ; 执行其它指令
LDR X1, [X0, #Offset] ; 加载Label标签地址加上偏移量Offset处的数据到X1寄存器中
...
Label:
…
在上述示例中,ADRP指令将Label标签的地址的高32位存储到X0寄存器中。然后,通过LDR指令从X0寄存器加上偏移量Offset处加载数据到X1寄存器中。
ADRP指令的主要目的是加载全局数据或代码段的地址高位,以便进行跳转、访问全局变量或执行函数等操作。通过ADRP指令和后续的LDR指令,可以实现更灵活的地址计算和访存操作。
在Linux内核启动代码primary_entry中,使用adrp指令获取Linux内核在内存中的起始页地址,页大小为4KB,由于内核启动的时候MMU还未打开,此时获取的Linux内核在内存中的起始页地址为物理地址。
adrp通过当前PC地址的偏移地址计算目标地址,和实际的物理无关,因此属于位置无关码。
[arch/arm64/kernel/head.S]
SYM_CODE_START(primary_entry)......adrp x23, __PHYS_OFFSETand x23, x23, MIN_KIMG_ALIGN - 1 // KASLR offset, defaults to 0......
SYM_CODE_END(primary_entry)[arch/arm64/kernel/head.S]
#define __PHYS_OFFSET KERNEL_START // 内核的物理地址
[arch/arm64/include/asm/memory.h]
// 内核的起始地址和结束地址在vmlinux.lds链接脚本中定义
#define KERNEL_START _text // 内核代码段的起始地址,也即内核的起始地址
#define KERNEL_END _end // 内核的结束地址[arch/arm64/include/asm/memory.h]
/** Alignment of kernel segments (e.g. .text, .data).** 4 KB granule: 16 level 3 entries, with contiguous bit* 16 KB granule: 4 level 3 entries, without contiguous bit* 64 KB granule: 1 level 3 entry*/
#define SEGMENT_ALIGN SZ_64K[include/linux/sizes.h]
#define SZ_64K 0x00010000
adrp指令根据PC的偏移地址计算目标页地址。
首先adrp将一个21位有符号立即数左移12位,得到一个33位的有符号数(最高位为符号位),接着将PC地址的低12位清零,这样就得到了当前PC地址所在页的地址,然后将当前PC地址所在页的地址加上33位的有符号数,就得到了目标页地址,最后将目标页地址写入通用寄存器。
此处页大小为4KB,只是为了得到更大的地址范围,和虚拟内存的页大小没有关系。
通过adrp指令,可以获取当前PC地址±4GB范围内的地址。
通常的使用场景是先通过adrp获取一个基地址,然后再通过基地址的偏移地址获取具体变量的地址。
3. adr_l
adr_l是Linux内核定义的一个宏,用于获取基于PC相对偏移+/- 4 GB内的符号地址。在内核上下文中,使用adrp和add指令获取符号地址,而在内核模块上下文中,使用mov指令获取符号地址。
[arch/arm64/include/asm/assembler.h].macro adr_l, dst, sym
#ifndef MODULE /* 内核上下文中 */adrp \dst, \sym /* 获取符号所在页的基地址 *//* :lo12:\sym - 获取符号sym的低12位地址。符号所在页的基地址加上低12位地址就得到符号的完整地址 */add \dst, \dst, :lo12:\sym
#else /* 内核模块上下中 *//* 将符号的bit[64:48]地址加载到dst寄存器中,同时做overflow check,其他位清零 */movz \dst, #:abs_g3:\sym/* 将符号的bit[47:32]地址加载到dst寄存器中,不做overflow check,其他位保持不变 */movk \dst, #:abs_g2_nc:\sym/* 将符号的bit[31:16]地址加载到dst寄存器中,不做overflow check,其他位保持不变 */movk \dst, #:abs_g1_nc:\sym/* 将符号的bit[15:0]地址加载到dst寄存器中,不做overflow check,其他位保持不变 */movk \dst, #:abs_g0_nc:\sym
#endif.endm
4. adr
adr指令根据PC的偏移地址计算目标地址。偏移地址是一个21位的有符号数,加上当前的PC地址得到目标地址。adr可以获取当前PC地址±1MB范围内的地址。下面是adr指令的编码格式。立即数占用21位。
以上是adr族三条指令用法参看了大神 业余程序员plus的分析,欲知详情,请戳原文链接:ARMv8汇编指令-adrp、adr、adr_l
5. blr
blr是ARM64指令集中的一条指令,用于返回到调用函数的地址并跳转到该地址执行。
blr指令的基本语法如下:
blr <寄存器>
其中,<寄存器>是一个通用寄存器(例如X0、X1等),它包含了调用函数的地址。
当执行到blr指令时,它会将寄存器中保存的地址作为返回地址,并跳转到该地址继续执行代码。这实现了函数调用的返回操作。通常,在函数调用完成后,使用blr指令返回到调用者的地址,以便程序继续执行下一条指令。
需要注意的是,blr指令只能在AArch64的执行状态下使用,不可用于AArch32代码。另外,返回地址由寄存器提供,因此寄存器中保存的地址应正确地指向调用函数的位置,否则可能导致未定义的行为或异常。
请注意,在实际的代码中,通常会有一系列先前的操作来设置返回地址,并且blr指令的使用方法可能因编程语言和上下文而有所不同。
BL 和 BLR 执行结果是将 PC 寄存器值的下一个值(也就是PC+8)放到链接寄存器 LR中, 然后将目的子程序的地址放到 PC 中。 BLR的结果 与 BL类似,但是新的PC的值是从特定的寄存器(如x2)取得。。例如:blr x2
【ARM 常见汇编指令学习 1 – 跳转指令 BL 与 BLR 区别】
举一反三:B指令只是单纯的跳转到目标地址执行(单程式/一去不复返式跳转)
BL 和 BLR 指令 跳转到目标地址执行完后,还会回到链接寄存器LR中保存的地址。
6.
7.
4.
4.
4.
麻烦帮忙详细讲解下arm64指令
以上部分内容来自ChatGPT
相关文章:
ARM64 指令用法学习整理
1. CBZ 当我们谈论ARM64指令集时,CBZ(Compare and Branch on Zero)是一种条件分支指令。它用于在寄存器上进行比较,并且如果该寄存器的值为零,则跳转到指定的标签或地址。 CBZ指令的基本语法如下: CBZ &…...
stable-diffusion 模型效果+prompt
摘自个人印象笔记,图不完整可查看原笔记:https://app.yinxiang.com/fx/55cda0c6-2af5-4d66-bd86-85da79c5574ePrompt运用规则及技巧 : 1. https://publicprompts.art/(最适用于OpenArt 线上模型 https://openart.ai/)…...
uniapp 小兔鲜儿 - 首页模块(1)
目录 自定义导航栏 静态结构 安全区域 通用轮播组件 静态结构 自动导入全局组件 全局组件类型声明 .d.ts文件 注册组件 vue/runtime-core 首页 – 轮播图指示点 首页 – 获取轮播图数据 首页 – 轮播图数据类型并渲染 首页 – 轮播图总结 首页分类 首页 – 前…...
selenium.webdriver Python爬虫教程
文章目录 selenium安装和使用 selenium安装和使用 pip install selenium 下载对应的浏览器驱动 实例化浏览器 from selenium import webdriverbrowser webdriver.Chrome()元素定位 控制浏览器...
USB-SC-09编程电缆驱动程序安装说明
USB-SC-09编程电缆驱动程序安装说明 概述 USB编程电缆是通过将电脑的USB口模拟成传统的串行口(通常为COM3),从而使编程软件SWOPC-FXGP/WIN和GPP通过USB-SC-09编程电缆与FX系列PLC进行通信。 功能 ● 支持的操作系统Windows XP/ Windows2000 …...
ONVIF对讲功能漫谈
ONVIF对讲功能漫谈 前言一、onvif对讲功能和onvif协议关系大吗?二、如何上报设备支持onvif对讲功能呢?三、onvif协议中哪个接口上报音频解码配置?四、献上抓包报文:前言 本篇文章尝试使用提问的方式来分享onvif对讲功能那点事。 一、onvif对讲功能和onvif协议关系大吗? on…...
计算文本相似度
目录 Python中的difflib模块模块用法报告涉及的符号实现文本对比普通文本对比文本对比生成HTML报告 余弦相似度sklearn安装使用sklearn的余弦相似度词袋模型 Jaccard相似度编辑距离(Levenshtein距离)TF-IDFWord2VecDoc2VecBERT结论 Python中的difflib模块…...
oracle 增加控制文件
oracle 增加控制文件 1、看control_file路径 SQL> show parameter controlNAME TYPE VALUE ------------------------------------ ----------- ------------------------------ control_file_record_keep_time integer …...
OpenFeign超时时间设置不生效问题排查
最近升级springboot 3,突然发现配置文件中的openFeign的超时时间设置不生效了 之前配置如下: feign: client: config: default: connectTimeout: 3000 readTimeout: 5000 查资料都是说ribbon或者hystrix的超时时间设置问…...
Go和Java实现原型模式
Go和Java实现原型模式 下面将通过一个克隆的示例来说明原型模式的使用。 1、原型模式 原型模式是用于创建重复的对象,同时又能保证性能。这种类型的设计模式属于创建型模式,它提供了一种创建对 象的最佳方式之一。 这种模式是实现了一个原型接口&am…...
linux I/O性能优化
Linux 文件系统 磁盘和文件系统的关系: 磁盘为系统提供了最基本的持久化存储。 文件系统则在磁盘的基础上,提供了一个用来管理文件的树状结构。 文件系统工作原理 索引节点和目录项 文件系统,本身是对存储设备上的文件,进行组织…...
PHP最简单自定义自己的框架model使用(七)
1、实现model使用效果 2、自动加载model,KJ.php //自动加载文件public static function _autoload($className){switch ($className){//自动model类case substr($className,-5)Model:$path MODEL./.$className..php;if(is_file($path)) include $path;break;//自动加载控制器…...
程序猿成长之路之密码学篇-分组密码加密模式及IV(偏移量)的详解
Cipher.getInstance("AES/ECB/PKCS5Padding"); Cipher cipher Cipher.getInstance("AES/CBC/PKCS5Padding"); 在进行加解密编程的时候应该有很多小伙伴接触过以上的语句,但是大伙儿在编码过程中是否了解过ECB/CBC的含义、区别以及PKCS5Padding…...
Windows下批处理删除文件
最近我使用Maven的时候会出现下载jar包不成功的现象,然后需要把它删除然后重新下载,但是有时候文件过多,一个个删除太花费时间,所以用bat的批处理会很舒服。 bat的语法我之前没遇到过,然后我是边学习边试验࿰…...
html中文件上传储存到本地路径
第一步:写html文件 <form action"/uplode" method"post" enctype"multipart/form-data">姓名:<input type"text" name"username"><br>年龄:<input type"text" name"age"><…...
第九章 SpringBoot 自动配置原理 入门
1. 引导加载自动配置类 SpringBootApplication -- SpringBootConfiguration -- EnableAutoConfiguration -- ComponentScan //SpringBootApplicationSpringBootConfiguration EnableAutoConfiguration ComponentScan(excludeFilters { Filter(type FilterType.CUSTOM, cl…...
String str=new String(“tango“) 创建了几个对象?
面试回答 创建的对象数 应该是1个或者2个。 首先要清楚什么是对象? Java 是一种面向对象的语言,而 Java 对象在 JVM 中的存储也是有一定的结构的,在 HotSpot 虚拟机中,存储的形式就是 oop-klass model,即 Java 对象模型…...
引入三阶失真的非线性放大器的模拟输出及使用中值滤波器去除峰值研究(Matlab代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...
【观察者设计模式详解】C/Java/JS/Go/Python/TS不同语言实现
简介 观察者模式(Observer Pattern)是一种行为型模式。它定义对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新。 观察者模式使用三个类Subject、Observer和Client。Subject…...
精细解析中文公司名称:智能分词工具助力地名、品牌名、行业词和后缀提取
精细解析中文公司名称:智能分词工具助力地名、品牌名、行业词和后缀提取 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。 对公司名文本解析,识…...
网络编程(Modbus进阶)
思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…...
【入坑系列】TiDB 强制索引在不同库下不生效问题
文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...
关于nvm与node.js
1 安装nvm 安装过程中手动修改 nvm的安装路径, 以及修改 通过nvm安装node后正在使用的node的存放目录【这句话可能难以理解,但接着往下看你就了然了】 2 修改nvm中settings.txt文件配置 nvm安装成功后,通常在该文件中会出现以下配置&…...
新能源汽车智慧充电桩管理方案:新能源充电桩散热问题及消防安全监管方案
随着新能源汽车的快速普及,充电桩作为核心配套设施,其安全性与可靠性备受关注。然而,在高温、高负荷运行环境下,充电桩的散热问题与消防安全隐患日益凸显,成为制约行业发展的关键瓶颈。 如何通过智慧化管理手段优化散…...
ip子接口配置及删除
配置永久生效的子接口,2个IP 都可以登录你这一台服务器。重启不失效。 永久的 [应用] vi /etc/sysconfig/network-scripts/ifcfg-eth0修改文件内内容 TYPE"Ethernet" BOOTPROTO"none" NAME"eth0" DEVICE"eth0" ONBOOT&q…...
微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据
微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据 Power Query 具有大量专门帮助您清理和准备数据以供分析的功能。 您将了解如何简化复杂模型、更改数据类型、重命名对象和透视数据。 您还将了解如何分析列,以便知晓哪些列包含有价值的数据,…...
保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek
文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama(有网络的电脑)2.2.3 安装Ollama(无网络的电脑)2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...
嵌入式学习笔记DAY33(网络编程——TCP)
一、网络架构 C/S (client/server 客户端/服务器):由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序,负责提供用户界面和交互逻辑 ,接收用户输入,向服务器发送请求,并展示服务…...
AGain DB和倍数增益的关系
我在设置一款索尼CMOS芯片时,Again增益0db变化为6DB,画面的变化只有2倍DN的增益,比如10变为20。 这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析: 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...
SQL慢可能是触发了ring buffer
简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...
