当前位置：首页 > news >正文

【ARMv8 编程】A64 数据处理指令——位域字节操作指令

news 2026/5/20 4:31:37

有些指令将字节、半字或字扩展到寄存器大小，可以是 X 或 W。这些指令存在于有符号（SXTB、SXTH、SXTW）和无符号（UXTB、UXTH）变体中，并且是适当的位域操作指令。

这些指令的有符号和无符号变体都将字节、半字或字（尽管只有 SXTW 对字进行操作）扩展到寄存器大小。源始终是 W 寄存器。目标寄存器是 X 或 W 寄存器，但 SXTW 除外，它必须是 X 寄存器。

例如：SXTB X0, W1 —— 通过重复字节的最左边的位，将寄存器 W1 的最低有效字节从 8 位符号扩展为 64 位。

位域指令类似于 ARMv7 中存在的指令，包括位域插入（BFI）以及有符号和无符号位域提取（(S/U)BFX）。还有额外的位域指令，例如 BFXIL（低位域提取和插入）、UBFIZ（无符号位域插入零）和 SBFIZ（有符号位域插入零）。

还有 BFM、UBFM 和 SBFM 指令。这些是 ARMv8 新增的位域移动指令。但是，不需要明确使用这些指令，因为为所有情况提供了别名。这些别名是已经描述的位域操作：[SU]XT[BHWX]、ASR/LSL/LSR immediate、BFI、BFXIL、SBFIZ、SBFX、UBFIZ 和 UBFX。

CLZ —— 计数寄存器中的前导零位。

RBIT —— 反转所有位。

REV —— 反转寄存器的字节顺序。

REV16 —— 反转寄存器中每个半字的字节顺序。

REV32 —— 反转寄存器中每个字的字节顺序。

REV、REV16、可以在字（32 位）或双字（64 位）大小的寄存器上执行，REV32 仅适用于 64 位寄存器。

1. SXTB

SXTB（Signed Extend Byte）指令从寄存器中提取一个 8 位值，将其符号扩展到寄存器的大小，并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SXTB <Wd>, <Wn>

等价指令

SBFM <Wd>, <Wn>, #0, #7

64-bit (sf == 1 && N == 1)

SXTB <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #7

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

下面是使用 SXTB 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTB %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTB %x[x], %w[y] 将 %w[y] 的最低 8 位符号扩展为 64 位，也就是 0x7080 中的 0x80（0b1000 0000）符号位为 1，扩展到 64 位，即 0xFFFF FFFF FFFF FF80，十进制为 -128，这也是最终 x 的值。

2. SXTH

SXTH（Sign Extend Halfword —— 符号扩展半字）指令提取一个 16 位值，将其符号扩展到寄存器的大小，并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SXTH <Wd>, <Wn>

等价指令

SBFM <Wd>, <Wn>, #0, #15

64-bit (sf == 1 && N == 1)

SXTH <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #15

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

下面是使用 SXTH 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTH %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTH %x[x], %w[y] 将 %w[y] 的最低 16 位符号扩展为 64 位，也就是 0x7080 中的 0x7080（0b0111 0000 1000 0000）符号位为 0，扩展到 64 位，还是 0x7080，十进制为 28800，这也是最终 x 的值。

3. SXTW

SXTW（Sign Extend Word —— 符号扩展字）指令将一个字符号扩展到寄存器的大小，并将结果写入目标寄存器。该指令是 SBFM 指令的别名。

在这里插入图片描述

64-bit

SXTW <Xd>, <Wn>

等价指令

SBFM <Xd>, <Xn>, #0, #31

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

下面是使用 SXTW 指令的例子。

    long long int x = 0;int y = 0x7080;asm volatile("SXTW %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SXTW %x[x], %w[y] 将 %w[y] 符号扩展为 64 位，也就是 0x7080 中的 0x7080（0b0000 0000 0000 0000 0111 0000 1000 0000）符号位为 0，扩展到 64 位，还是 0x7080，十进制为 28800，这也是最终 x 的值。

4. UXTB

UXTB（Unsigned Extend Byte —— 无符号扩展字节）从寄存器中提取一个 8 位值，将其零扩展到寄存器的大小，并将结果写入目标寄存器。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit

UXTB <Wd>, <Wn>

等价指令

UBFM <Wd>, <Wn>, #0, #7

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

下面是使用 UXTB 指令的例子。

    int x = 0;int y = 0x7080;asm volatile("UXTB %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UXTB %w[x], %w[y] 将 %w[y] 扩展为 32 位，也就是 0x7080 中的 0x80（0b1000 0000）扩展到 32 位（以零填充扩展位），最终还为 0x80，这也是最终 x 的值。

5. UXTH

UXTH（Unsigned Extend Halfword —— 无符号扩展半字）从寄存器中提取一个 16 位值，将其零扩展到寄存器的大小，并将结果写入目标寄存器。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit

UXTH <Wd>, <Wn>

等价指令

UBFM <Wd>, <Wn>, #0, #15

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

下面是使用 UXTH 指令的例子。

    int x = 0;int y = 0x77777080;asm volatile("UXTH %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UXTH %w[x], %w[y] 将 %w[y] 扩展为 32 位，也就是 0x77777080 的低 16 位，即 0x7080（0b0111 0000 1000 0000）扩展到 32 位（以零填充扩展位），最终还为 0x7080，这也是最终 x 的值。

6. BFI

BFI（Bitfield Insert —— 位域插入）指令将 <width> 位的位域从源寄存器的最低有效位复制到目标寄存器的位位置 <lsb>，而其他目标位保持不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFI <Wd>, <Wn>, #<lsb>, #<width>

等价指令

BFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

BFI <Xd>, <Xn>, #<lsb>, #<width>

等价指令

BFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 对于 32 位变体：是目标位域的 lsb 的位数，范围为 0 到 31。对于 64 位变体：是目标位域的 lsb 的位数，范围为 0 到 63。

<width> 对于 32 位变体：是位域的宽度，范围为 1 到 32-<lsb>。对于 64 位变体：是位域的宽度，范围为 1 到 64-<lsb>。

下图是 BFI W0, W0, #9, #6 指令操作示意图：

在这里插入图片描述

下面是使用 BFI 指令的例子。

    long long int x = -1;long long int y = 0x77777080;asm volatile("BFI %x[x], %x[y], #16, #16\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFI %x[x], %x[y], #16, #16 将 %x[y] 最低 16 位复制到 %x[x] 的 16 ~ 31 位，也就是 0x77777080 的低 16 位，即 0x7080（0b0111 0000 1000 0000）复制到 %x[x] 的 16 ~ 31 位，最终的结果就是 0xFFFF FFFF 7080 FFFF，这也是最终 x 的值。

7. BFC

BFC（Bitfield Clear —— 位域清零）将目标寄存器的位位置 <lsb> 处的 <width> 位的位域设置为零，而其他目标位保持不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFC <Wd>, #<lsb>, #<width>

等价指令

BFM <Wd>, WZR, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

BFC <Xd>, #<lsb>, #<width>

等价指令

BFM <Xd>, XZR, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<lsb> 对于 32 位变体：是目标位域的 lsb 的位数，范围为 0 到 31。对于 64 位变体：是目标位域的 lsb 的位数，范围为 0 到 63。

<width> 对于 32 位变体：是位域的宽度，范围为 1 到 32-<lsb>。对于 64 位变体：是位域的宽度，范围为 1 到 64-<lsb>。

下图是 BFC W1, #3, #4 指令操作示意图：

在这里插入图片描述

下面是使用 BFC 指令的例子。

    long long int x = -1;asm volatile("BFC %x[x], #8, #8\n":[x] "+r"(x):: "cc", "memory");

执行 BFC %x[x], #8, #8 将 %x[x] 寄存器的 8 ~ 15 位（宽度为 8）清零，即 0xFFFF FFFF FFFF 00FF，这也是最终 x 的值。

8. SBFX

SBFX（Signed Bitfield Extract —— 有符号位域提取）指令复制一个 <width> 位的位域，从源寄存器中的位位置 <lsb> 开始到目标寄存器的最低有效位，并将位域前面的目标位设置为位域最高有效位的副本。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFX <Wd>, <Wn>, #<lsb>, #<width>

等价指令

SBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

SBFX <Xd>, <Xn>, #<lsb>, #<width>

等价指令

SBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 对于 32 位变体：是源位域的 lsb 的位数，范围为 0 到 31。对于 64 位变体：是源位域的 lsb 的位数，范围为 0 到 63。

<width> 对于 32 位变体：是位域的宽度，范围为 1 到 32-<lsb>。对于 64 位变体：是位域的宽度，范围为 1 到 64-<lsb>。

下面是使用 SBFX 指令的例子。

    long long int x = 0;long long int y = 0x87;asm volatile("SBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFX %x[x], %x[y], #4, #4，首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位，又因为 0x87 的第七位为 1，所以使用 1 扩展 %x[x] 的 4 ~ 63 位（这里体现了符号位），即 0xFFFF FFFF FFFF FF80，这也是最终 x 的值。

9. UBFX

UBFX（Unsigned Bitfield Extract —— 无符号位域提取）指令复制一个 <width> 位的位域，从源寄存器中的位位置 <lsb> 开始到目标寄存器的最低有效位，并将位域前面的目标位设置为零。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFX <Wd>, <Wn>, #<lsb>, #<width>

等价指令

UBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

UBFX <Xd>, <Xn>, #<lsb>, #<width>

等价指令

UBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 对于 32 位变体：是源位域的 lsb 的位数，范围为 0 到 31。对于 64 位变体：是源位域的 lsb 的位数，范围为 0 到 63。

<width> 对于 32 位变体：是位域的宽度，范围为 1 到 32-<lsb>。对于 64 位变体：是位域的宽度，范围为 1 到 64-<lsb>。

下图是 UBFX W1, W0, #18, #7 指令操作示意图：

在这里插入图片描述

下面是使用 UBFX 指令的例子。

    long long int x = 0;long long int y = 0x87;asm volatile("UBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFX %x[x], %x[y], #4, #4，首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位，接着使用 0 扩展 %x[x] 的 4 ~ 63 位，即 0x8，这也是最终 x 的值。

10. BFXIL

位域提取并在低端插入，其他位不变。该指令是 BFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFXIL <Wd>, <Wn>, #<lsb>, #<width>

等价指令

BFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)

64-bit (sf == 1 && N == 1)

BFXIL <Xd>, <Xn>, #<lsb>, #<width>

等价指令

BFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体：范围为 0 到 31；对于 64 位变体：范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体：范围为 1 到 32-<lsb>；对于 64 位变体：范围为 1 到 64-<lsb>。

下面是使用 BFXIL 指令的例子。

    long long int x = 0x4444;long long int y = 0x87;asm volatile("BFXIL %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFXIL %x[x], %x[y], #4, #4，首先将 %x[y] 寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x] 寄存器的 0 ~ 3 位，其它位保持不变，所以最终 %x[x] 的值为 0x4448。

11. UBFIZ

无符号位域插入零，左右为零。该指令是 UBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFIZ <Wd>, <Wn>, #<lsb>, #<width>

等价指令

UBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

UBFIZ <Xd>, <Xn>, #<lsb>, #<width>

等价指令

UBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体：范围为 0 到 31；对于 64 位变体：范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体：范围为 1 到 32-<lsb>；对于 64 位变体：范围为 1 到 64-<lsb>。

下面是使用 UBFIZ 指令的例子。

    long long int x = 0x444444;long long int y = 0x89;asm volatile("UBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFIZ %x[x], %x[y], #8, #8，首先将 %x[y] 寄存器内的 0x89 低 8 位复制到 %x[x] 寄存器的 8 ~ 15 位，其它位全部清零，所以最终 %x[x] 的值为 0x8900。

12. SBFIZ

带符号的位域插入零，符号复制到左边，零复制到右边。该指令是 SBFM 指令的别名。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFIZ <Wd>, <Wn>, #<lsb>, #<width>

等价指令

SBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)

64-bit (sf == 1 && N == 1)

SBFIZ <Xd>, <Xn>, #<lsb>, #<width>

等价指令

SBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<lsb> 是源位域的“lsb”的位数。对于 32 位变体：范围为 0 到 31；对于 64 位变体：范围为 0 到 63。

<width> 是位域的宽度。对于 32 位变体：范围为 1 到 32-<lsb>；对于 64 位变体：范围为 1 到 64-<lsb>。

下面是使用 SBFIZ 指令的例子。

    long long int x = 0x444444;long long int y = 0x89;asm volatile("SBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFIZ %x[x], %x[y], #8, #8，首先将 %x[y] 寄存器内的 0x89 低 8 位复制到 %x[x] 寄存器的 8 ~ 15 位，接着由于 0x89 符号位为 1，所以 16 ~ 63 位全部复制为 1， 0 ~ 7 位则清零，所以最终 %x[x] 的值为 0xFFFF FFFF FFFF 8900。

13. BFM

BFM（Bitfield move —— 位域移动）位域移动，其他位不变。该指令由别名 BFC、BFI 和 BFXIL 使用。

如果 <imms> 大于或等于 <immr>，则将从源寄存器中的位位置 <immr> 开始的（<imms> - <immr> + 1）位的位域复制到目标寄存器的最低有效位。
如果 <imms> 小于<immr>，则将源寄存器的最低有效位中的（<imms> + 1）位的位域复制到目标寄存器的位位置（regsize - <immr>），其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下，目的寄存器的其他位保持不变。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

BFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

BFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<immr> 是循环右移量，在“immr”字段中编码。对于 32 位变体：在 0 到 31 的范围内；对于 64 位变体：是在 0 到 63 范围内。

<imms> 是要从源移动的最左边的位数（the leftmost bit number to be moved from the source），编码在“imms”字段中。对于 32 位变体：在 0 到 31 的范围内；对于 64 位变体：范围从 0 到 63。

下面是使用 BFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("BFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 BFM %x[x], %x[y], #8, #4，将 0x79（0b01111001）中的 0 ~ 4 位（4 + 1 = 5 共 5 位）（0b11001）移动到目标寄存器 %x[x]，也就是将 0x19 移动到 %x[x] 的最左边（从 64 - 8 = 56 位开始复制），其它位保持不变，最终为 0x1900 0000 0044 4444。

14. UBFM

UBFM（Unsigned Bitfield Move —— 无符号位域移动）指令通常通过其别名之一进行访问，该别名始终是反汇编的首选。

如果 <imms> 大于或等于 <immr>，则将从源寄存器中的位位置 <immr> 开始的（<imms> - <immr> + 1）位的位域复制到目标寄存器的最低有效位。
如果 <imms> 小于<immr>，则将源寄存器的最低有效位中的（<imms> + 1）位的位域复制到目标寄存器的位位置（regsize - <immr>），其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下，位域前面和后面的目标位都设置为零。

该指令由别名 LSL（立即数）、LSR（立即数）、UBFIZ、UBFX、UXTB 和 UXTH 使用。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

UBFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

UBFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<immr> 是循环右移量，在“immr”字段中编码。对于 32 位变体：在 0 到 31 的范围内；对于 64 位变体：是在 0 到 63 范围内。

下面是使用 UBFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("UBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 UBFM %x[x], %x[y], #8, #4，将 0x79（0b01111001）中的 0 ~ 4 位（4 + 1 = 5 共 5 位）（0b11001）移动到目标寄存器 %x[x]，也就是将 0x19 移动到 %x[x] 的最左边（从 64 - 8 = 56 位开始复制），其它位清零，最终为 0x1900 0000 0000 0000。

15. SBFM

SBFM（Signed Bitfield Move —— 有符号位域移动）指令通常通过其别名之一访问，该别名始终是反汇编的首选。

如果 <imms> 大于或等于 <immr>，则将从源寄存器中的位位置 <immr> 开始的（<imms> - <immr> + 1）位的位域复制到目标寄存器的最低有效位。
如果 <imms> 小于<immr>，则将源寄存器的最低有效位中的（<imms> + 1）位的位域复制到目标寄存器的位位置（regsize - <immr>），其中 regsize 是 32 或 64 位的目标寄存器大小。

在这两种情况下，位域后面的目的位被设置为零，位域前面的位被设置到位域的最高有效位的拷贝。

该指令由别名 ASR（立即数）、SBFIZ、SBFX、SXTB、SXTH 和 SXTW 使用。

在这里插入图片描述

32-bit (sf == 0 && N == 0)

SBFM <Wd>, <Wn>, #<immr>, #<imms>

64-bit (sf == 1 && N == 1)

SBFM <Xd>, <Xn>, #<immr>, #<imms>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

<immr> 是循环右移量，在“immr”字段中编码。对于 32 位变体：在 0 到 31 的范围内；对于 64 位变体：是在 0 到 63 范围内。

下面是使用 SBFM 指令的例子。

    long long int x = 0x444444;long long int y = 0x79;asm volatile("SBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 SBFM %x[x], %x[y], #8, #4，将 0x79（0b01111001）中的 0 ~ 4 位（4 + 1 = 5 共 5 位）（0b11001）移动到目标寄存器 %x[x]，也就是将 0x19 移动到 %x[x] 的最左边（从 64 - 8 = 56 位开始复制），它的后面的位清零，前面的位由于符号位为 1，因此全部复制为 1，最终为 0xF900 0000 0000 0000。

16. CLZ

计算前导零位数：Rd = CLZ(Rn)。

在这里插入图片描述

32-bit (sf = 0)

CLZ <Wd>, <Wn>

64-bit (sf = 1)

CLZ <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

下面是使用 CLZ 指令的例子。

    long long int x = 0;long long int y = 0x79;asm volatile("CLZ %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 CLZ %x[x], %x[y]，计算 %x[y] 前导零的位数，即 0x79（0b01111001）中前导零的位数，也就是 64 - 7 = 57，最终将 57 写入 %x[x]。

17. RBIT

RBIT 指令反转所有位（反转位序）。

在这里插入图片描述

32-bit (sf = 0)

RBIT <Wd>, <Wn>

64-bit (sf = 1)

RBIT <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

下面是使用 RBIT 指令的例子。

    long long int x = 0;long long int y = 0x79;asm volatile("RBIT %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 RBIT %x[x], %x[y]，反转 %x[y] 中的所有位（反转位序），即 0x79（0b01111001）反转为 0x9E00 0000 0000 0000，最终将 0x9E00 0000 0000 0000 写入 %x[x]。

18. REV

REV 指令反转所有字节。

在这里插入图片描述

32-bit (sf = 0)

REV <Wd>, <Wn>

64-bit (sf = 1)

REV <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

下面是使用 REV 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV %x[x], %x[y]，反转 %x[y] 中的所有字节，即 0x12436579 反转为 0x7965 4312 0000 0000，最终将 0x7965 4312 0000 0000 写入 %x[x]。

19. REV16

REV16 指令反转 16 位半字中的字节。

在这里插入图片描述

32-bit (sf = 0)

REV16 <Wd>, <Wn>

64-bit (sf = 1)

REV16 <Xd>, <Xn>

<Wd> 是通用目标寄存器的 32 位名称，在“Rd”字段中编码。

<Wn> 是通用源寄存器的 32 位名称，在“Rn”字段中编码。

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

在这里插入图片描述

下面是使用 REV16 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV16 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV16 %x[x], %x[y]，反转 %x[y] 中 16 位半字中的字节，即 0x12436579 反转为 0x43127965，最终将 0x43127965 写入 %x[x]。

20. REV32

REV32 指令反转 32 位字中的字节。

在这里插入图片描述

64-bit

REV32 <Xd>, <Xn>

<Xd> 是通用目标寄存器的 64 位名称，在“Rd”字段中编码。

<Xn> 是通用源寄存器的 64 位名称，在“Rn”字段中编码。

在这里插入图片描述

下面是使用 REV32 指令的例子。

    long long int x = 0;long long int y = 0x12436579;asm volatile("REV32 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");

执行 REV32 %x[x], %x[y]，反转 %x[y] 中 32 位字中的字节，即 0x12436579 反转为 0x79654312，最终将 0x79654312 写入 %x[x]。

参考资料

1.《ARMv8-A-Programmer-Guide》
2.《Arm® A64 Instruction Set Architecture Armv8, for Armv8-A architecture profile》

1. SXTB

2. SXTH

3. SXTW

4. UXTB

5. UXTH

6. BFI

7. BFC

8. SBFX

9. UBFX

10. BFXIL

11. UBFIZ

12. SBFIZ

13. BFM

14. UBFM

15. SBFM

16. CLZ

17. RBIT

18. REV

19. REV16

20. REV32

相关文章：