当前位置: 首页 > news >正文

【ARMv8 编程】A64 数据处理指令——位域字节操作指令

有些指令将字节、半字或字扩展到寄存器大小,可以是 X 或 W。这些指令存在于有符号(SXTB、SXTH、SXTW)和无符号(UXTB、UXTH)变体中,并且是适当的位域操作指令。

这些指令的有符号和无符号变体都将字节、半字或字(尽管只有 SXTW 对字进行操作)扩展到寄存器大小。源始终是 W 寄存器。目标寄存器是 X 或 W 寄存器,但 SXTW 除外,它必须是 X 寄存器。

例如:SXTB X0, W1 —— 通过重复字节的最左边的位,将寄存器 W1 的最低有效字节从 8 位符号扩展为 64 位。

位域指令类似于 ARMv7 中存在的指令,包括位域插入 (BFI) 以及有符号和无符号位域提取 ((S/U)BFX)。还有额外的位域指令,例如 BFXIL(低位域提取和插入)、UBFIZ(无符号位域插入零)和 SBFIZ(有符号位域插入零)。

还有 BFM、UBFM 和 SBFM 指令。 这些是 ARMv8 新增的位域移动指令。但是,不需要明确使用这些指令,因为为所有情况提供了别名。这些别名是已经描述的位域操作:[SU]XT[BHWX]、ASR/LSL/LSR immediate、BFI、BFXIL、SBFIZ、SBFX、UBFIZ 和 UBFX。

CLZ —— 计数寄存器中的前导零位。

RBIT —— 反转所有位。

REV —— 反转寄存器的字节顺序。

REV16 —— 反转寄存器中每个半字的字节顺序。

REV32 —— 反转寄存器中每个字的字节顺序。

REV、REV16、可以在字(32 位)或双字(64 位)大小的寄存器上执行,REV32 仅适用于 64 位寄存器。

1. SXTB

SXTB(Signed Extend Byte)指令从寄存器中提取一个 8 位值,将其符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SXTB <Wd>, <Wn>

等价指令

SBFM <Wd>, <Wn>, #0, #7

64-bit (sf == 1 && N == 1)

SXTB <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #7

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

下面是使用 SXTB 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTB %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTB %x[x], %w[y]%w[y] 的最低 8 位符号扩展为 64 位,也就是 0x7080 中的 0x80(0b1000 0000)符号位为 1,扩展到 64 位,即 0xFFFF FFFF FFFF FF80,十进制为 -128,这也是最终 x 的值。

2. SXTH

SXTH(Sign Extend Halfword —— 符号扩展半字)指令提取一个 16 位值,将其符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SXTH <Wd>, <Wn>

等价指令

SBFM <Wd>, <Wn>, #0, #15

64-bit (sf == 1 && N == 1)

SXTH <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #15

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

下面是使用 SXTH 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTH %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTH %x[x], %w[y]%w[y] 的最低 16 位符号扩展为 64 位,也就是 0x7080 中的 0x7080(0b0111 0000 1000 0000)符号位为 0,扩展到 64 位,还是 0x7080,十进制为 28800,这也是最终 x 的值。

3. SXTW

SXTW(Sign Extend Word —— 符号扩展字)指令将一个字符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

64-bit

SXTW <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #31

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

下面是使用 SXTW 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTW %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTW %x[x], %w[y]%w[y] 符号扩展为 64 位,也就是 0x7080 中的 0x7080(0b0000 0000 0000 0000 0111 0000 1000 0000)符号位为 0,扩展到 64 位,还是 0x7080,十进制为 28800,这也是最终 x 的值。

4. UXTB

UXTB(Unsigned Extend Byte —— 无符号扩展字节) 从寄存器中提取一个 8 位值,将其零扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit

UXTB <Wd>, <Wn>

等价指令

UBFM <Wd>, <Wn>, #0, #7

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

下面是使用 UXTB 指令的例子。

    int x = 0;int y = 0x7080;asm volatile("UXTB %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UXTB %w[x], %w[y]%w[y] 扩展为 32 位,也就是 0x7080 中的 0x80(0b1000 0000)扩展到 32 位(以零填充扩展位),最终还为 0x80,这也是最终 x 的值。

5. UXTH

UXTH(Unsigned Extend Halfword —— 无符号扩展半字) 从寄存器中提取一个 16 位值,将其零扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit

UXTH <Wd>, <Wn>

等价指令

UBFM <Wd>, <Wn>, #0, #15

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

下面是使用 UXTH 指令的例子。

    int x = 0;int y = 0x77777080;asm volatile("UXTH %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UXTH %w[x], %w[y]%w[y] 扩展为 32 位,也就是 0x77777080 的低 16 位,即 0x7080(0b0111 0000 1000 0000)扩展到 32 位(以零填充扩展位),最终还为 0x7080,这也是最终 x 的值。

6. BFI

BFI(Bitfield Insert —— 位域插入)指令将 <width> 位的位域从源寄存器的最低有效位复制到目标寄存器的位位置 <lsb>,而其他目标位保持不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFI <Wd>, <Wn>, #<lsb>, #<width>

等价指令

BFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

BFI <Xd>, <Xn>, #<lsb>, #<width>

等价指令

BFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 对于 32 位变体:是目标位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是目标位域的 lsb 的位数,范围为 0 到 63。

<width> 对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>

下图是 BFI W0, W0, #9, #6 指令操作示意图:

在这里插入图片描述

下面是使用 BFI 指令的例子。

    long long int x = -1;long long int y = 0x77777080;asm volatile("BFI %x[x], %x[y], #16, #16\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFI %x[x], %x[y], #16, #16%x[y] 最低 16 位复制到 %x[x] 的 16 ~ 31 位,也就是 0x77777080 的低 16 位,即 0x7080(0b0111 0000 1000 0000)复制到 %x[x] 的 16 ~ 31 位,最终的结果就是 0xFFFF FFFF 7080 FFFF,这也是最终 x 的值。

7. BFC

BFC(Bitfield Clear —— 位域清零) 将目标寄存器的位位置 <lsb> 处的 <width> 位的位域设置为零,而其他目标位保持不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFC <Wd>, #<lsb>, #<width>

等价指令

BFM <Wd>, WZR, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

BFC <Xd>, #<lsb>, #<width>

等价指令

BFM <Xd>, XZR, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<lsb> 对于 32 位变体:是目标位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是目标位域的 lsb 的位数,范围为 0 到 63。

<width> 对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>

下图是 BFC W1, #3, #4 指令操作示意图:

在这里插入图片描述

下面是使用 BFC 指令的例子。

    long long int x = -1;asm volatile("BFC %x[x], #8, #8\n":[x] "+r"(x):: "cc", "memory");

执行 BFC %x[x], #8, #8%x[x] 寄存器的 8 ~ 15 位(宽度为 8)清零,即 0xFFFF FFFF FFFF 00FF,这也是最终 x 的值。

8. SBFX

SBFX(Signed Bitfield Extract —— 有符号位域提取) 指令复制一个 <width> 位的位域,从源寄存器中的位位置 <lsb> 开始到目标寄存器的最低有效位,并将位域前面的目标位设置为位域最高有效位的副本。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFX <Wd>, <Wn>, #<lsb>, #<width>

等价指令

SBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

SBFX <Xd>, <Xn>, #<lsb>, #<width>

等价指令

SBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 对于 32 位变体:是源位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是源位域的 lsb 的位数,范围为 0 到 63。

<width> 对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>

下面是使用 SBFX 指令的例子。

    long long int x = 0;long long int y = 0x87;asm volatile("SBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFX %x[x], %x[y], #4, #4,首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位,又因为 0x87 的第七位为 1,所以使用 1 扩展 %x[x] 的 4 ~ 63 位(这里体现了符号位),即 0xFFFF FFFF FFFF FF80,这也是最终 x 的值。

9. UBFX

UBFX(Unsigned Bitfield Extract —— 无符号位域提取)指令复制一个 <width> 位的位域,从源寄存器中的位位置 <lsb> 开始到目标寄存器的最低有效位,并将位域前面的目标位设置为零。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFX <Wd>, <Wn>, #<lsb>, #<width>

等价指令

UBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

UBFX <Xd>, <Xn>, #<lsb>, #<width>

等价指令

UBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 对于 32 位变体:是源位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是源位域的 lsb 的位数,范围为 0 到 63。

<width> 对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>

下图是 UBFX W1, W0, #18, #7 指令操作示意图:

在这里插入图片描述

下面是使用 UBFX 指令的例子。

    long long int x = 0;long long int y = 0x87;asm volatile("UBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFX %x[x], %x[y], #4, #4,首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位,接着使用 0 扩展 %x[x] 的 4 ~ 63 位,即 0x8,这也是最终 x 的值。

10. BFXIL

位域提取并在低端插入,其他位不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFXIL <Wd>, <Wn>, #<lsb>, #<width>

等价指令

BFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

BFXIL <Xd>, <Xn>, #<lsb>, #<width>

等价指令

BFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>;对于 64 位变体:范围为 1 到 64-<lsb>

下面是使用 BFXIL 指令的例子。

    long long int x = 0x4444;long long int y = 0x87;asm volatile("BFXIL %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFXIL %x[x], %x[y], #4, #4,首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位,其它位保持不变,所以最终 %x[x] 的值为 0x4448。

11. UBFIZ

无符号位域插入零,左右为零。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFIZ <Wd>, <Wn>, #<lsb>, #<width>

等价指令

UBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

UBFIZ <Xd>, <Xn>, #<lsb>, #<width>

等价指令

UBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>;对于 64 位变体:范围为 1 到 64-<lsb>

下面是使用 UBFIZ 指令的例子。

    long long int x = 0x444444;long long int y = 0x89;asm volatile("UBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFIZ %x[x], %x[y], #8, #8,首先将 %x[y] 寄存器内的 0x89 低 8 位复制到 %x[x] 寄存器的 8 ~ 15 位,其它位全部清零,所以最终 %x[x] 的值为 0x8900。

12. SBFIZ

带符号的位域插入零,符号复制到左边,零复制到右边。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFIZ <Wd>, <Wn>, #<lsb>, #<width>

等价指令

SBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

SBFIZ <Xd>, <Xn>, #<lsb>, #<width>

等价指令

SBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>;对于 64 位变体:范围为 1 到 64-<lsb>

下面是使用 SBFIZ 指令的例子。

    long long int x = 0x444444;long long int y = 0x89;asm volatile("SBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFIZ %x[x], %x[y], #8, #8,首先将 %x[y] 寄存器内的 0x89 低 8 位复制到 %x[x] 寄存器的 8 ~ 15 位,接着由于 0x89 符号位为 1,所以 16 ~ 63 位全部复制为 1, 0 ~ 7 位则清零,所以最终 %x[x] 的值为 0xFFFF FFFF FFFF 8900。

13. BFM

BFM(Bitfield move —— 位域移动)位域移动,其他位不变。该指令由别名 BFC、BFI 和 BFXIL 使用。

  • 如果 <imms> 大于或等于 <immr>,则将从源寄存器中的位位置 <immr> 开始的(<imms> - <immr> + 1)位的位域复制到目标寄存器的最低有效位。

  • 如果 <imms> 小于<immr>,则将源寄存器的最低有效位中的(<imms> + 1)位的位域复制到目标寄存器的位位置(regsize - <immr>),其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下,目的寄存器的其他位保持不变。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

BFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<immr> 是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。

<imms> 是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。

下面是使用 BFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("BFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFM %x[x], %x[y], #8, #4,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x],也就是将 0x19 移动到 %x[x] 的最左边(从 64 - 8 = 56 位开始复制),其它位保持不变,最终为 0x1900 0000 0044 4444。

14. UBFM

UBFM(Unsigned Bitfield Move —— 无符号位域移动)指令通常通过其别名之一进行访问,该别名始终是反汇编的首选。

  • 如果 <imms> 大于或等于 <immr>,则将从源寄存器中的位位置 <immr> 开始的(<imms> - <immr> + 1)位的位域复制到目标寄存器的最低有效位。

  • 如果 <imms> 小于<immr>,则将源寄存器的最低有效位中的(<imms> + 1)位的位域复制到目标寄存器的位位置(regsize - <immr>),其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下,位域前面和后面的目标位都设置为零。

该指令由别名 LSL(立即数)、LSR(立即数)、UBFIZ、UBFX、UXTB 和 UXTH 使用。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

UBFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<immr> 是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。

<imms> 是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。

下面是使用 UBFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("UBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFM %x[x], %x[y], #8, #4,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x],也就是将 0x19 移动到 %x[x] 的最左边(从 64 - 8 = 56 位开始复制),其它位清零,最终为 0x1900 0000 0000 0000。

15. SBFM

SBFM(Signed Bitfield Move —— 有符号位域移动)指令通常通过其别名之一访问,该别名始终是反汇编的首选。

  • 如果 <imms> 大于或等于 <immr>,则将从源寄存器中的位位置 <immr> 开始的(<imms> - <immr> + 1)位的位域复制到目标寄存器的最低有效位。

  • 如果 <imms> 小于<immr>,则将源寄存器的最低有效位中的(<imms> + 1)位的位域复制到目标寄存器的位位置(regsize - <immr>),其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下,位域后面的目的位被设置为零,位域前面的位被设置到位域的最高有效位的拷贝。

该指令由别名 ASR(立即数)、SBFIZ、SBFX、SXTB、SXTH 和 SXTW 使用。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

SBFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

<immr> 是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。

<imms> 是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。

下面是使用 SBFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("SBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFM %x[x], %x[y], #8, #4,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x],也就是将 0x19 移动到 %x[x] 的最左边(从 64 - 8 = 56 位开始复制),它的后面的位清零,前面的位由于符号位为 1,因此全部复制为 1,最终为 0xF900 0000 0000 0000。

16. CLZ

计算前导零位数:Rd = CLZ(Rn)。

在这里插入图片描述

32-bit (sf = 0)

CLZ <Wd>, <Wn>

64-bit (sf = 1)

CLZ <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

下面是使用 CLZ 指令的例子。

    long long int x = 0;long long int y = 0x79;asm volatile("CLZ %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 CLZ %x[x], %x[y],计算 %x[y] 前导零的位数,即 0x79(0b01111001)中前导零的位数,也就是 64 - 7 = 57,最终将 57 写入 %x[x]

17. RBIT

RBIT 指令反转所有位(反转位序)。

在这里插入图片描述

32-bit (sf = 0)

RBIT <Wd>, <Wn>

64-bit (sf = 1)

RBIT <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

下面是使用 RBIT 指令的例子。

    long long int x = 0;long long int y = 0x79;asm volatile("RBIT %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 RBIT %x[x], %x[y],反转 %x[y] 中的所有位(反转位序),即 0x79(0b01111001)反转为 0x9E00 0000 0000 0000,最终将 0x9E00 0000 0000 0000 写入 %x[x]

18. REV

REV 指令反转所有字节。

在这里插入图片描述

32-bit (sf = 0)

REV <Wd>, <Wn>

64-bit (sf = 1)

REV <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

下面是使用 REV 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV %x[x], %x[y],反转 %x[y] 中的所有字节,即 0x12436579 反转为 0x7965 4312 0000 0000,最终将 0x7965 4312 0000 0000 写入 %x[x]

19. REV16

REV16 指令反转 16 位半字中的字节。

在这里插入图片描述

32-bit (sf = 0)

REV16 <Wd>, <Wn>

64-bit (sf = 1)

REV16 <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称,在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称,在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

在这里插入图片描述

下面是使用 REV16 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV16 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV16 %x[x], %x[y],反转 %x[y] 中 16 位半字中的字节,即 0x12436579 反转为 0x43127965,最终将 0x43127965 写入 %x[x]

20. REV32

REV32 指令反转 32 位字中的字节。

在这里插入图片描述

64-bit

REV32 <Xd>, <Xn>

<Xd> 是通用目标寄存器的 64 位名称,在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称,在“Rn”字段中编码。

在这里插入图片描述

下面是使用 REV32 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV32 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV32 %x[x], %x[y],反转 %x[y] 中 32 位字中的字节,即 0x12436579 反转为 0x79654312,最终将 0x79654312 写入 %x[x]

参考资料

1.《ARMv8-A-Programmer-Guide》
2.《Arm® A64 Instruction Set Architecture Armv8, for Armv8-A architecture profile》

相关文章:

【ARMv8 编程】A64 数据处理指令——位域字节操作指令

有些指令将字节、半字或字扩展到寄存器大小&#xff0c;可以是 X 或 W。这些指令存在于有符号&#xff08;SXTB、SXTH、SXTW&#xff09;和无符号&#xff08;UXTB、UXTH&#xff09;变体中&#xff0c;并且是适当的位域操作指令。 这些指令的有符号和无符号变体都将字节、半字…...

ctfshow 愚人杯菜狗杯部分题目(flasksession伪造ssti)

目录 <1>愚人杯 (1) easy_signin (2) easy_ssti(无过滤ssti) (3) easy_flask(flash-session伪造) (4) easy_php(C:开头序列化数据) <2> 菜狗杯 (1) 抽老婆(flask_session伪造) (2) 一言既出&#xff0c;驷马难追(intval) (3) 传说之下&#xff08;js控制台&…...

linux拓展笔记——【补充学习知识点】

文章目录1. ./configure --prefix中的prefix详解1. ./configure --prefix中的prefix详解 源码的安装一般由3个步骤组成&#xff1a;配置(configure)、编译(make)、安装(makeinstall)。 Configure是一个可执行脚本&#xff0c;在待安装的源码路径下使用命令./configure–help输…...

为何银行各岗位之间的薪酬差别如此之大?

银行里的职位种类相对较多&#xff0c;观观整理了5个最常见的职位&#xff0c;看一下你要申请的职位薪资水平到底是怎样的&#xff1f;根据如信银行考试中心发布&#xff1a; 1、客户经理岗 客户经理分为对公客户经理和对私客户经理&#xff0c;他们的主要工作不同&#xff0…...

TensorFlow 深度学习第二版:1~5

原文&#xff1a;Deep Learning with TensorFlow Second Edition 协议&#xff1a;CC BY-NC-SA 4.0 译者&#xff1a;飞龙 本文来自【ApacheCN 深度学习 译文集】&#xff0c;采用译后编辑&#xff08;MTPE&#xff09;流程来尽可能提升效率。 不要担心自己的形象&#xff0c;只…...

微前端micro-app的使用

演示效果 子应用的项目 基应用嵌入子应用效果图 目录 前言 一、微前端是什么&#xff1f; 它主要解决了两个问题&#xff1a; 二、使用步骤 1.安装依赖 2.在入口处引入 3.子应用的路由&#xff08;&#xff09; 4.分配一个路由给子应用&#xff08;重要&#xff09;&#xff0…...

【JUC】Java内存模型之JMM

【JUC】Java内存模型之JMM 文章目录【JUC】Java内存模型之JMM1. 概念2. JMM三大特性2.1 可见性2.2 原子性2.3 有序性3. 多线程对变量的读写过程4. 先行发生原则——happens-before4.1 happens-before八条规则4.1.1 次序规则4.1.2 锁定规则4.1.3 volatile变量规则4.1.4 传递规则…...

Win11快速打开便签和使用技巧分享

Win11快速打开便签和使用技巧分享。Win11系统中为用户提供了一个非常实用的系统组件&#xff0c;就是便签功能&#xff0c;使用这个功能可以帮助我们便捷的进行一些重要内容的记录。那么如何去开启开启这个程序来使用呢&#xff1f;来看看以下的详情分享吧。 详细分享&#xff…...

CSS:横向导航栏

横向导航栏&#xff08;盗版导航栏&#xff0c;B站仿写。&#xff09; 原视频链接 <html><head><title>demo</title><style>*{margin: 0;padding: 0;list-style: none;text-decoration: none;}body{display: flex;justify-content: center;a…...

视频动态库测试及心得

视频动态库测试及心得 这几天一直在弄动态库测试&#xff0c;h给的写好的动态库--预处理模块的库。视频处理项目一部分&#xff0c;需要连接实际情况测试。 需求&#xff1a; 1.把实际相机连接到&#xff0c;并读取实时数据流&#xff0c;保存到双循环链表里面; 2.测试背景建模…...

陶泓达:4.18午间欧盘黄金原油最新精准操作建议!

黄金方面&#xff1a; 黄金消息面解析&#xff1a;周一&#xff08;4月17日&#xff09;美市盘中&#xff0c;美国公布的4月纽约联储制造业指数和4月NAHB房产市场指数均超出预期&#xff0c;提振了美联储在5月继续加息的预期。数据公布之后&#xff0c;美元指数加速上扬&#x…...

环境变量相关知识

目录 目录 谢谢你的阅读&#xff0c;这是对我最大的鼓舞 先说结论&#xff1a; 开始论述&#xff1a; 让我们举个例子 相关指令 创建本地变量 创建环境变量 方法一&#xff1a; 方法二&#xff1a; 删除环境变量 子进程中也有环境变量 第一种&#xff1a; 第二种 …...

如何快速入门ChatGPT

作为一个AI模型&#xff0c;ChatGPT并不需要像人一样“学习”&#xff0c;它已经通过大量的训练数据和算法进行了预训练&#xff0c;可以回答广泛的问题。 然而&#xff0c;如果你想学习如何使用ChatGPT来进行对话或者问答&#xff0c;以下是一些建议&#xff1a; 一、了解Ch…...

Akka定时任务schedule()方法

Akka定时任务schedule()方法 文章目录Akka定时任务schedule()方法什么是Akka定时任务schedule()方法&#xff1f;如何使用Akka定时任务schedule()方法&#xff1f;如何在actor外部获取Scheduler对象为什么需要提供一个隐式的ExecutionContext对象&#xff0c;用于执行定时任务&…...

Python实现处理和分析大规模文本数据集,包括数据清洗、标注和预处理

处理和分析大规模文本数据集,包括数据清洗、标注和预处理,是自然语言处理(NLP)中非常重要的一步。Python 是一种非常流行的编程语言,拥有丰富的 NLP 库和工具,可以帮助我们完成这些任务。以下是一个简单的实现示例,包括数据清洗、标注和预处理: import re import nltk…...

灌区量测水系统

1)灌区量测水 灌区量测水是水资源管理的基础&#xff0c;是推进节水农业和水价改革的重要手段。常规在主要水闸处&#xff0c;监测闸前和闸后水位及闸门开启状态(闸位)&#xff0c;通过实时监测数据&#xff0c;计算过闸流量。要实现全灌区水资源动态配置、精准灌溉&#xff0…...

3.3 泰勒公式

学习目标&#xff1a; 复习微积分基础知识。泰勒公式是微积分的一个重要应用&#xff0c;因此在学习泰勒公式之前&#xff0c;需要复习微积分的基本概念和技能&#xff0c;包括函数的导数和微分、极限、定积分等。可以参考MIT的微积分课程进行复习和加强。 学习泰勒级数和泰勒…...

ubuntu中通过vscode编译调试ORB-SLAM3

为了在orb-slam3的基础上进行二次开发&#xff0c;这几天花了不少精力&#xff0c;终于搞懂怎么在ubuntu系统中像windows里visual studio中一样方便的打断点调试了&#xff0c;在这里把整个过程再重新梳理一下。 1 首先从安装ubuntu 22.04开始 因为是从实验室毕业先辈那里继承…...

阿里版 ChatGPT 突然上线!

转自:纯洁的微笑 其实早本月初&#xff0c;就传出过不少阿里要推出类ChatGPT的消息。 前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT&#xff0c;就是基于大模型的“压缩版”&#xff0c;已经以其惊艳表现吸引了众目光。 如今“原版大菜”上桌&#xff0c;自然一点即着&a…...

《Kubernetes部署篇:Ubuntu20.04基于containerd部署kubernetes1.24.12单master集群》

一、架构图 如下图所示&#xff1a; 二、环境信息 主机名K8S版本系统版本内核版本IP地址备注k8s-master-621.24.12Ubuntu 20.04.5 LTS5.15.0-69-generic192.168.1.62master节点k8s-worker-631.24.12Ubuntu 20.04.5 LTS5.15.0-69-generic192.168.1.63worker节点k8s-worker-641…...

后进先出(LIFO)详解

LIFO 是 Last In, First Out 的缩写&#xff0c;中文译为后进先出。这是一种数据结构的工作原则&#xff0c;类似于一摞盘子或一叠书本&#xff1a; 最后放进去的元素最先出来 -想象往筒状容器里放盘子&#xff1a; &#xff08;1&#xff09;你放进的最后一个盘子&#xff08…...

日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻

在如今就业市场竞争日益激烈的背景下&#xff0c;越来越多的求职者将目光投向了日本及中日双语岗位。但是&#xff0c;一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧&#xff1f;面对生疏的日语交流环境&#xff0c;即便提前恶补了…...

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统 下面是一个完整的 Python 系统,利用大模型实现智能 UI 自动化,结合计算机视觉和自然语言处理技术,实现"看屏操作"的能力。 系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

【Oracle APEX开发小技巧12】

有如下需求&#xff1a; 有一个问题反馈页面&#xff0c;要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据&#xff0c;方便管理员及时处理反馈。 我的方法&#xff1a;直接将逻辑写在SQL中&#xff0c;这样可以直接在页面展示 完整代码&#xff1a; SELECTSF.FE…...

中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试

作者&#xff1a;Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位&#xff1a;中南大学地球科学与信息物理学院论文标题&#xff1a;BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接&#xff1a;https://arxiv.…...

OkHttp 中实现断点续传 demo

在 OkHttp 中实现断点续传主要通过以下步骤完成&#xff0c;核心是利用 HTTP 协议的 Range 请求头指定下载范围&#xff1a; 实现原理 Range 请求头&#xff1a;向服务器请求文件的特定字节范围&#xff08;如 Range: bytes1024-&#xff09; 本地文件记录&#xff1a;保存已…...

跨链模式:多链互操作架构与性能扩展方案

跨链模式&#xff1a;多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈&#xff1a;模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展&#xff08;H2Cross架构&#xff09;&#xff1a; 适配层&#xf…...

学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1

每日一言 生活的美好&#xff0c;总是藏在那些你咬牙坚持的日子里。 硬件&#xff1a;OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写&#xff0c;"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换 即使单核CPU也可以进行多线程执行代码&#xff0c;CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短&#xff0c;所以CPU会不断地切换线程执行&#xff0c;从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...