当前位置：首页 > news >正文

3.2.1.2 汇编版原子操作 CAS

news 2025/7/17 15:43:35

基本原理说明

在 x86 和 ARM 架构上，原子操作通常利用硬件提供的原子指令来实现，比如 LOCK 前缀（x86）或 LDREX/STREX（ARM）。以下是一些关键的原子操作（例如原子递增和比较交换）的汇编实现。

1. x86 架构的原子操作

（1）原子递增

x86 的 LOCK 前缀可以用来保证指令在多核处理器上的原子性。例如原子递增操作：

实现原子递增

global atomic_increment
section .text
atomic_increment:mov eax, 1          ; 设置递增值为 1lock xadd [rdi], eax ; 对地址 rdi 所指向的变量执行原子加操作add rax, 1          ; xadd 返回的是原值，rax = 原值 + 1ret

解释：

LOCK XADD [rdi], eax：对 rdi 指向的地址执行原子加操作，将原值存入 eax，并把 eax 加上后写回 rdi。
使用 LOCK 前缀可以保证多核环境下的原子性。

（2）比较并交换（CAS）

x86 提供了 CMPXCHG 指令，可以用来实现原子的比较并交换（CAS）。

实现原子 CAS

global atomic_compare_exchange
section .text
atomic_compare_exchange:mov rax, rsi        ; 将期望值放入 raxlock cmpxchg [rdi], rdx ; 如果 [rdi] 的值等于 rax（期望值），将 rdx 写入 [rdi]ret

参数说明：

rdi：目标地址。
rsi：期望值。
rdx：需要交换的值。

解释：

LOCK CMPXCHG [rdi], rdx：
- 如果 [rdi] 的值等于 RAX，则将 rdx 写入 [rdi]。
- 否则将 [rdi] 的当前值写入 RAX。
返回值：RAX 中存储的是 rdi 的旧值，调用者可以根据是否等于 rsi 判断交换是否成功。

2. ARM 架构的原子操作

ARM 使用 LDREX/STREX 指令对原子操作进行支持。这是一种 负载-存储排他模型，可以保证在加载到存储之间没有其他线程或进程修改目标变量。

（1）原子递增

在 ARM 架构下，使用 LDREX/STREX 实现原子递增：

实现原子递增

.global atomic_increment
atomic_increment:mov r1, #1          ; 将 1 存入 r1（递增值）
1:ldrex r0, [r0]      ; 使用 LDREX 加载 [r0] 的值到 r0add r0, r0, r1      ; r0 = r0 + 1strex r2, r0, [r0]  ; 尝试将 r0 写回 [r0]，如果成功 r2 = 0cmp r2, #0          ; 检查写入是否成功bne 1b              ; 如果不成功，重试dmb                 ; 数据内存屏障，确保操作完成bx lr

解释：

LDREX：加载目标地址的值，同时标记为“独占”访问。
STREX：尝试存储值到目标地址，如果目标地址在此期间被其他核修改，存储操作会失败，返回非 0。
使用循环保证操作成功。

（2）比较并交换（CAS）

实现原子 CAS

.global atomic_compare_exchange
atomic_compare_exchange:ldrex r0, [r1]      ; 从地址 r1 加载值到 r0（旧值）cmp r0, r2          ; 比较 r0 和 r2（期望值）bne 1f              ; 如果不相等，跳转到 1f，返回旧值strex r3, r3, [r1]  ; 尝试将 r3 写入 [r1]，如果成功 r3 = 0cmp r3, #0          ; 检查是否存储成功bne atomic_compare_exchange ; 如果失败，重新尝试
1:dmb                 ; 数据内存屏障，保证一致性bx lr

参数说明：

r1：目标地址。
r2：期望值。
r3：要交换的值。

解释：

如果 LDREX 加载的值与 期望值（r2）相等，则尝试存储 r3。
如果存储失败，则重复尝试。
成功后返回原值。

3. 汇编操作的注意事项

x86 的强内存模型：
- x86 硬件有一个相对强的内存序，很多情况下 LOCK 前缀可以满足原子操作需求。
ARM 的弱内存模型：
- ARM 是弱内存模型，使用 LDREX/STREX 操作时，通常需要内存屏障（如 DMB）来确保指令顺序和数据同步。
重试机制：
- 对于 ARM 的 LDREX/STREX 模式，如果存储失败需要通过循环重试。
指令可用性：
- 需要确保目标平台支持这些指令。比如 CMPXCHG 在早期的 x86 处理器（如 80386）上不可用。

4. 比较总结

操作	x86	ARM
原子递增	`LOCK XADD`	`LDREX + ADD + STREX`
原子比较交换	`LOCK CMPXCHG`	`LDREX + CMP + STREX`
内存屏障	`MFENCE`（可选）	`DMB`

x86 汇编通常较为简单，因为其强内存序模型降低了编程复杂性；ARM 则需要更明确的同步和屏障操作。

代码实现

my_atomic.h

#include <stdint.h>
#include <stdio.h>// 平台区分
#if defined(__x86_64__)#define ATOMIC_X86
#elif defined(__aarch64__)#define ATOMIC_ARM
#else#error "Unsupported platform"
#endif// ===================== x86 实现 =====================
#ifdef ATOMIC_X86// 原子递增
static inline int atomic_increment(int *addr) {int result;__asm__ __volatile__("lock xaddl %0, %1": "=r"(result), "+m"(*addr): "0"(1): "memory");return result + 1; // 返回递增后的值
}// 原子递减
static inline int atomic_decrement(int *addr) {int result;__asm__ __volatile__("lock xaddl %0, %1": "=r"(result), "+m"(*addr): "0"(-1) // 减 1: "memory");return result - 1; // 返回递减后的值
}// 原子比较交换
static inline int atomic_compare_exchange(int *addr, int expected, int desired) {int old;__asm__ __volatile__("lock cmpxchgl %2, %1": "=a"(old), "+m"(*addr): "r"(desired), "0"(expected): "memory");return old; // 返回旧值
}// 原子读取
static inline int atomic_load(int *addr) {int value;__asm__ __volatile__("movl %1, %0": "=r"(value): "m"(*addr): "memory");return value; // 返回读取值
}#endif // ATOMIC_X86// ===================== ARM 实现 =====================
#ifdef ATOMIC_ARM// 原子递增
static inline int atomic_increment(int *addr) {int old, tmp;do {__asm__ __volatile__("ldrex %0, [%2]      \n" // 读取旧值到 old"add   %1, %0, #1    \n" // tmp = old + 1"strex %0, %1, [%2]  \n" // 尝试写回: "=&r"(old), "=&r"(tmp): "r"(addr): "memory", "cc");} while (old != 0); // 如果写失败，重试return tmp; // 返回递增后的值
}// 原子递减
static inline int atomic_decrement(int *addr) {int old, tmp;do {__asm__ __volatile__("ldrex %0, [%2]      \n" // 读取旧值到 old"sub   %1, %0, #1    \n" // tmp = old - 1"strex %0, %1, [%2]  \n" // 尝试写回: "=&r"(old), "=&r"(tmp): "r"(addr): "memory", "cc");} while (old != 0); // 如果写失败，重试return tmp; // 返回递减后的值
}// 原子比较交换
static inline int atomic_compare_exchange(int *addr, int expected, int desired) {int old, status;do {__asm__ __volatile__("ldrex %0, [%2]       \n" // 加载到 old"cmp   %0, %3         \n" // 比较 old 和 expected"bne   1f             \n" // 如果不相等，跳转到 1"strex %1, %4, [%2]   \n" // 尝试写回 desired"1:": "=&r"(old), "=&r"(status): "r"(addr), "r"(expected), "r"(desired): "memory", "cc");} while (status != 0); // 如果写失败，重试return old; // 返回旧值
}// 原子读取
static inline int atomic_load(int *addr) {int value;__asm__ __volatile__("ldrex %0, [%1] \n" // 加载值到 value: "=&r"(value): "r"(addr): "memory");return value; // 返回读取值
}#endif // ATOMIC_ARM

my_atomic_test.c

#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include "my_atomic.h"#define NUM_THREADS 4
#define ITERATIONS 1000volatile int shared_counter = 0; // 全局共享计数器// 线程函数：执行递增操作
void* thread_increment(void* arg) {for (int i = 0; i < ITERATIONS; i++) {atomic_increment((int*)&shared_counter);}return NULL;
}// 线程函数：执行递减操作
void* thread_decrement(void* arg) {for (int i = 0; i < ITERATIONS; i++) {atomic_decrement((int*)&shared_counter);}return NULL;
}int main() {pthread_t threads[NUM_THREADS];// 创建增量线程for (int i = 0; i < NUM_THREADS / 2; i++) {if (pthread_create(&threads[i], NULL, thread_increment, NULL) != 0) {perror("pthread_create");exit(EXIT_FAILURE);}}// 创建减量线程for (int i = NUM_THREADS / 2; i < NUM_THREADS; i++) {if (pthread_create(&threads[i], NULL, thread_decrement, NULL) != 0) {perror("pthread_create");exit(EXIT_FAILURE);}}// 等待所有线程完成for (int i = 0; i < NUM_THREADS; i++) {pthread_join(threads[i], NULL);}// 最终结果int final_value = atomic_load((int*)&shared_counter);printf("最终计数器值: %d\n", final_value);return 0;
}

ubuntu x86编译运行

$ gcc -pthread -o a.out my_atomic_test.c
$ ./a.out
最终计数器值: 0

gitlab.0voice.com

3.2.1.2 汇编版原子操作 CAS

基本原理说明在 x86 和 ARM 架构上，原子操作通常利用硬件提供的原子指令来实现，比如 LOCK 前缀（x86）或 LDREX/STREX（ARM）。以下是一些关键的原子操作（例如原子递增和比较交换）的汇…...

编程日记 2024/12/19 1:59:18

InnoDB事务系统（二）：事务的实现

事务隔离性由锁来实现。原子性、一致性、持久性通过数据库的 redo log 和 undo log 来完成。 redo log 称为重做日志，用来保证事务的原子性和持久性。undo log 用来保证事务的一致性。有的 DBA 或许会认为 undo 是 redo 的逆过程，其实不然。redo 和 u…...

编程日记 2024/12/19 1:57:16

xdoj ：模式匹配

模式匹配题目描述： 接收信号中包含特定的信号模式，对接收信号进行检测，以统计特定模式出现的次数。例如接收信号为 9 3 5 7 5 8 6 3 5 7 1 9 3 5 7，如果特定信号为 3 5 7，则接收信号中包含了 3 个特定模式。通过键…...

编程日记 2024/12/19 1:56:14

Redis的基本使用命令（GET,SET,KEYS,EXISTS,DEL,EXPIRE,TTL,TYPE）

目录 SET GET KEYS EXISTS DEL EXPIRE TTL redis中的过期策略是怎么实现的（面试） 上文介绍reids的安装以及基本概念，本章节主要介绍 Redis的基本使用命令的使用 Redis 是一个基于键值对（KEY - VALUE）存储的…...

编程日记 2024/12/19 1:55:12

LruCache（本地cache）生产环境中遇到的问题及改进

问题：单机qps增加时请求摘要后端，耗时也会增加，因为超过了后端处理能力（最大qps，存在任务堆积）。版本一引入LruCache。为了避免数据失效，cache数据的时效性要小于摘要后端物料的更新时间&…...

编程日记 2024/12/19 1:53:07

智慧公交指挥中枢，数据可视化 BI 驾驶舱

随着智慧城市的蓬勃发展，公共交通作为城市运营的核心枢纽，正朝着智能化和数据驱动的方向演进。通过整合 CAN 总线技术(Controller Area Network，控制器局域网总线)、车载智能终端、大数据分析及处理等尖端技术，构建的公交“大脑”…...

编程日记 2024/12/19 1:51:05

【计算机网络】期末考试预习复习|上

作业讲解物理层作业共有4个用户进行CDMA通信。这4个用户的码片序列为： A: (–1 –1 –1 1 1 –1 1 1)；B: (–1 –1 1 –1 1 1 1 –1) C: (–1 1 –1 1 1 1 –1 –1)；D: (–1 1 –1 –1 –1 –1 1 –1) 现收到码片序列：(–1 1 –…...

编程日记 2024/12/19 1:40:51

YOLOv8目标检测(四)_图片推理

YOLOv8目标检测(一)_检测流程梳理：YOLOv8目标检测(一)_检测流程梳理_yolo检测流程-CSDN博客 YOLOv8目标检测(二)_准备数据集：YOLOv8目标检测(二)_准备数据集_yolov8 数据集准备-CSDN博客 YOLOv8目标检测(三)_训练模型：YOLOv8目标检测(三)_训…...

编程日记 2024/12/19 1:36:46

AI工具如何深刻改变我们的工作与生活

在当今这个科技日新月异的时代，人工智能（AI）已经从科幻小说中的概念变成了我们日常生活中不可或缺的一部分。从智能家居到自动驾驶汽车，从医疗诊断到金融服务，AI正以惊人的速度重塑着我们的世界。一、工作方式的革新…...

编程日记 2024/12/19 1:34:44

springboot中——Logback介绍

程序中的日志，是用来记录应用程序的运行信息、状态信息、错误信息等。 Logback基本使用 springboot的依赖自动传递了logback的依赖，所以不用再引入依赖之后在resources文件下创建logback.xml文件，写入 <?xml version"1.0" …...

编程日记 2024/12/19 1:32:42

【Tomcat】第一站：理解tomcat与Socket

目录 1. Tomcat 1.1 Tomcat帮助启动http服务器。 1.2 tomcat理解： 2. 计算机网络最基本的流程 2.1 信息是怎么来的？ 2.2 端口是干什么的？ 3. 简单的Socket案例服务端客户端启动： 3.2 在Tomcat发送信息，看…...

编程日记 2024/12/19 1:29:40

TQ15EG开发板教程：使用SSH登录petalinux

本例程在上一章“创建运行petalinux2019.1”基础上进行，本例程将实现使用SSH登录petalinux。将上一章生成的BOOT.BIN与imag.ub文件放入到SD卡中启动。给开发板插入电源与串口，注意串口插入后会识别出两个串口号，都需要打开，查看串…...

编程日记 2024/12/19 1:26:37

Java从入门到工作4 - MySQL

一：检测数据库网络 telnet 127.0.0.1 3306 注意ip和端口后之间是空格，不需要引号二：SQL语法 1、创建结果集 SELECT 电视机 AS typeUNION SELECT 电冰箱UNION SELECT 洗衣机UNION SELECT 空调UNION SELECT 电脑UNION SELECT 热水器UNION…...

编程日记 2024/12/19 1:25:36

OpenShift 4 - 多云管理(2) - 配置多集群观察功能

《OpenShift / RHEL / DevSecOps 汇总目录》本文在 OpenShift 4.17 RHACM 2.12 环境中进行验证。文章目录多集群观察技术架构安装多集群观察功能监控多集群的运行状态监控多集群的应用运行在被管集群监控应用运行在管理集群监控被管集群的应用运行参考多集群观察技术架构…...

编程日记 2024/12/19 1:24:34

【鸿睿创智开发板试用】RK3568 NPU的人工智能推理测试

目录引言驱动移植例程编译修改build.sh 执行编译运行测试部署libc的库文件执行测试程序结语引言鸿睿创智的H01开发板是基于RK3568芯片的，瑞芯微芯片的一大特色就是提供了NPU推理的支持。本文将对其NPU推理进行测试。驱动移植 H01的开发板已经…...

编程日记 2024/12/19 1:22:32

iOS swift开发系列 -- tabbar问题总结

1.单视图如何改为tabbar，以便显示2个标签页右上角➕，输入tabbar 找到控件，然后选中，把entrypoint移动到tabbar控件 2.改成tabbar，生成两个item，配置各自视图后，启动发现报错 Thread 1: “-[p…...

编程日记 2024/12/19 1:17:28

四、CSS3

一、CSS3简介 1、CSS3概述 CSS3 是 CSS2 的升级版本，他在CSS2的基础上，新增了很多强大的新功能，从而解决一些实际面临的问题。 CSS在未来会按照模块化的方式去发展：https://www.w3.org/Style/CSS/current-work.html …...

编程日记 2024/12/19 1:15:26

Three.js 使用 WebGPU 的关键 TSL TSL: three.js shader language 介绍 three.js 材质转为webgpu的关键流程, 从而引出 TSL. 1、关键类关系 WebGPURenderer|-- library: StandardNodeLibrary|-- _nodes: Nodes|-- _objects: RenderObjects|-- createRenderObject()StandardN…...

编程日记 2024/12/19 1:14:24

ESP32-S3模组上跑通ES8388（30）

接前一篇文章：ESP32-S3模组上跑通ES8388（29）二、利用ESP-ADF操作ES8388 2. 详细解析上一回终于解析完了es8388_init函数的所有代码。本回回到调用它的地方，继续往下讲解。我们是从ESP32-S3模组上跑通ES8388（7）-CSDN博客开始进入es8388_init函数，展开对于它的解析的…...

编程日记 2024/12/19 1:09:17

概率论得学习和整理24：EXCEL的各种图形，统计图形

目录 0 EXCEL的各种图形，统计图形 1 统计图形 / 直方图 / 其实叫频度图 hist最合适(用原始数据直接作图) 1.1 什么是频度图 1.2 如何创建频度图，一般是只选中1列数据（1个数组） 1.3 如何修改频度图的宽度 1.4 hist图的一个特…...

编程日记 2024/12/19 1:03:08

龙虎榜——20250610

上证指数放量收阴线，个股多数下跌，盘中受消息影响大幅波动。深证指数放量收阴线形成顶分型，指数短线有调整的需求，大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技代表标的：御银股份、雄帝科技驱动…...

编程新知 2025/7/17 1:35:07

业务系统对接大模型的基础方案：架构设计与关键步骤

业务系统对接大模型：架构设计与关键步骤在当今数字化转型的浪潮中，大语言模型（LLM）已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中，不仅可以优化用户体验，还能为业务决策提供…...

编程新知 2025/7/16 6:02:18

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2025/7/12 18:28:25

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器在Ubuntu上，你可以使用apt包管理器来安装NFS服务器。打开终端并运行： sudo apt update sudo apt install nfs-kernel-server创建共享目录创建一个目录用于共享，例如/shared： sudo mkdir /shared sud…...

编程新知 2025/7/9 22:10:40

（十）学生端搭建

本次旨在将之前的已完成的部分功能进行拼装到学生端，同时完善学生端的构建。本次工作主要包括： 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑一、学生端在主界面可以选择自己的用户角色选择学生则进入学生登录界面…...

编程新知 2025/7/10 11:31:41

SciencePlots——绘制论文中的图片

文章目录安装一、风格二、1 资源安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源论文绘图神器来了：一行…...

编程新知 2025/7/12 6:45:46

在rocky linux 9.5上在线安装 docker

前面是指南，后面是日志 sudo dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo dnf install docker-ce docker-ce-cli containerd.io -y docker version sudo systemctl start docker sudo systemctl status docker …...

编程新知 2025/7/11 12:05:22

Caliper 配置文件解析：config.yaml

Caliper 是一个区块链性能基准测试工具，用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构，并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件，主要包含以下几个部…...

编程新知 2025/7/7 17:01:50

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文全面剖析RNN核心原理，深入讲解梯度消失/爆炸问题，并通过LSTM/GRU结构实现解决方案，提供时间序列预测和文本生成…...

编程新知 2025/7/16 10:41:18

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2025/7/14 19:39:37

基本原理说明

1. x86 架构的原子操作

（1）原子递增

实现原子递增

解释：

（2）比较并交换（CAS）

实现原子 CAS

参数说明：

解释：

2. ARM 架构的原子操作

（1）原子递增

实现原子递增

解释：

（2）比较并交换（CAS）

实现原子 CAS

参数说明：

解释：

3. 汇编操作的注意事项

4. 比较总结

代码实现

my_atomic.h

my_atomic_test.c

ubuntu x86编译运行

相关文章：