深入解析 CAS 操作
一、CAS 的本质:硬件级别的乐观锁
CAS(Compare-And-Swap,比较并交换) 是一种原子操作指令,用于实现对共享变量的无锁并发修改。它是现代多核处理器支持的底层硬件指令,也是构建高效并发数据结构(如锁、队列、计数器)的核心基础。
核心原理
- 操作原子性:CAS 操作由硬件保证在执行过程中不会被线程调度打断
- 三步合一:将"读取-判断-写入"合并为单个原子操作
- 乐观锁机制:假设竞争很少发生,先操作后检测冲突
// CAS 伪代码表示
bool CAS(T* ptr, T expected, T new_value) {if (*ptr == expected) { // 比较内存当前值*ptr = new_value; // 交换新值return true;}return false;
}
二、工作流程详解
- 读取内存值:获取共享变量当前值 V
- 计算新值:基于 V 计算目标值 New
- 原子提交:
- 若内存值仍为 V ⇒ 写入 New
- 若内存值已变化 ⇒ 放弃操作
三、关键优势:突破并发瓶颈
特性 | 传统锁机制 | CAS 机制 |
---|---|---|
线程阻塞 | 可能发生等待 | 无阻塞 |
死锁风险 | 存在 | 不存在 |
性能开销 | 上下文切换代价高 | 仅需单条CPU指令 |
并发粒度 | 粗粒度 | 细粒度 |
四、ABA 问题:隐藏的陷阱
问题场景
- 线程1读取值 A
- 线程2修改 A→B→A
- 线程1执行 CAS:检测值仍为 A ⇒ 操作成功
后果:数据看似未变,实际已发生中间状态变更
解决方案
- 版本号机制:
// Java AtomicStampedReference 实现 AtomicStampedReference<String> ref = new AtomicStampedReference<>("A", 0); // 初始版本0ref.compareAndSet("A", "B", 0, 1); // 同时验证值和版本号
- 时间戳标记:IBM zSeries 的 double-width CAS
- 垃圾回收指针:依赖GC防止内存重用(如.NET)
五、编程语言实现案例
Java 的 java.util.concurrent.atomic
// 原子整型自增实现
public final int getAndIncrement() {return unsafe.getAndAddInt(this, valueOffset, 1);
}// Hotspot Unsafe 源码实现
public final int getAndAddInt(Object o, long offset, int delta) {int v;do {v = getIntVolatile(o, offset); // 读取当前值} while (!compareAndSwapInt(o, offset, v, v + delta)); // CAS重试return v;
}
C++11 原子库
#include <atomic>
std::atomic<int> counter(0);// CAS操作实现自增
int old_val = counter.load();
while (!counter.compare_exchange_weak(old_val, old_val + 1)) {// 优化:允许虚假失败,通常配合循环使用
}
六、典型应用场景
-
无锁计数器
# Python ctypes 访问硬件CAS import ctypes libc = ctypes.cdll.LoadLibrary('libc.so.6') counter = ctypes.c_int(0)def atomic_increment():while True:old = counter.valueif libc.__sync_val_compare_and_swap(ctypes.byref(counter), old, old+1) == old:break
-
无锁栈实现(Treiber Stack)
class ConcurrentStack<T> {AtomicReference<Node<T>> top = new AtomicReference<>();void push(T item) {Node<T> newHead = new Node<>(item);Node<T> oldHead;do {oldHead = top.get();newHead.next = oldHead;} while (!top.compareAndSet(oldHead, newHead));}T pop() {Node<T> oldHead;Node<T> newHead;do {oldHead = top.get();if (oldHead == null) return null;newHead = oldHead.next;} while (!top.compareAndSet(oldHead, newHead));return oldHead.item;} }
-
无锁队列(Michael-Scott 队列)
type Node struct {value interface{}next *Node }type Queue struct {head *Nodetail *Node }func (q *Queue) Enqueue(v interface{}) {node := &Node{value: v}for {last := q.tailnext := last.nextif last == q.tail { // 验证状态未变if next == nil {if atomic.CompareAndSwapPointer(&last.next, nil, node) {atomic.CompareAndSwapPointer(&q.tail, last, node)return}} else {atomic.CompareAndSwapPointer(&q.tail, last, next)}}} }
七、底层硬件支持架构
处理器架构 | CAS 指令 | 位宽支持 |
---|---|---|
x86/x86-64 | CMPXCHG | 8/16/32/64位 |
ARMv8 | LDXR + STXR (LL/SC模型) | 64位 |
POWER | lwarx + stwcx | 64位 |
RISC-V | lr.w + sc.w | 32/64/128位 |
LL/SC(Load-Link/Store-Conditional):现代RISC架构采用的替代实现方案
Load-Link
:标记内存区域- 执行计算
Store-Conditional
:当标记区域未被修改时写入
八、性能优化策略
-
缓存行填充避免伪共享
// C++ 缓存行对齐结构 struct alignas(64) AtomicCounter {std::atomic<int> value;char padding[64 - sizeof(std::atomic<int>)]; };
-
指数退避减少竞争
while (!casSuccess) {int delay = random.nextInt(baseDelay);for (int i = 0; i < delay; i++) Thread.yield(); // 让出CPUbaseDelay *= 2; // 指数级增加等待 }
-
批量操作减少CAS调用
// 批量增加计数器 func (c *Counter) Add(n int) {const batchSize = 32for n > 0 {batch := nif batch > batchSize {batch = batchSize}// 单次CAS更新批量值c.accumulate(batch) n -= batch} }
九、局限性及替代方案
-
循环开销问题:高竞争场景下自旋消耗CPU
- 解决方案:
java.util.concurrent.locks.LockSupport.park()
- 解决方案:
-
单一变量限制:无法原子修改多个独立变量
- 替代方案:事务内存(Transactional Memory)
-
优先级颠倒风险:低优先级线程持有CAS导致高优先级饥饿
- 实时系统解决方案:优先级继承协议
-
内存顺序约束:
// C++ 内存顺序控制 counter.compare_exchange_weak(old_val, new_val,std::memory_order_acq_rel, // 成功时的内存序std::memory_order_acquire // 失败时的内存序 );
十、现代发展方向
-
128位 CAS 扩展:用于原子更新指针+元数据(如指针标记)
bool __atomic_compare_exchange_16(void* ptr, __int128* expected,__int128 desired );
-
持久内存 CAS:Intel Optane PMEM 的持久化原子操作
bool pmemobj_atomic_compare_exchange(PMEMoid *ptr, uint64_t *expected_oid,uint64_t desired_oid );
-
GPU 原子操作:NVIDIA CUDA 的全局内存原子CAS
int atomicCAS(int* address, int compare, int val);
-
分布式 CAS:跨多节点的分布式原子操作协议
参与者 → 协调者:CAS请求 协调者 → 所有节点:预提交 节点响应符合条件 → 协调者:投票 多数同意 → 协调者:提交指令
总结:CAS 的核心价值
CAS 操作通过硬件级原子指令,实现了:
- 无锁并发:消除传统锁的开销
- 非阻塞算法:提升系统响应能力
- 细粒度同步:实现高性能并发数据结构
尽管存在 ABA 问题、高竞争场景性能下降等局限,但通过版本号机制、缓存优化等手段可有效缓解。作为现代并发编程的基石,CAS 在操作系统内核、数据库系统、中间件等高性能系统中发挥着不可替代的作用。理解其原理和最佳实践,是构建高性能并发系统的必备技能。
相关文章:

深入解析 CAS 操作
一、CAS 的本质:硬件级别的乐观锁 CAS(Compare-And-Swap,比较并交换) 是一种原子操作指令,用于实现对共享变量的无锁并发修改。它是现代多核处理器支持的底层硬件指令,也是构建高效并发数据结构࿰…...

vue3+TS+eslint9配置
记录eslint升级到9.x的版本之后遇到的坑 在 ESLint 9 中,配置方式发生了变化。Flat Config 格式(eslint.config.js 或 .ts)不再支持 extensions 选项。所以vscode编辑器中的 extensions 需要注释掉,要不然保存的时候不会格式化。…...

【bug】Error: /undefinedfilename in (/tmp/ocrmypdf.io.9xfn1e3b/origin.pdf)
在使用ocrmypdf的时候,需要Ghostscript9.55及以上的版本,但是ubuntu自带为9.50 然后使用ocrmypdf报错了 sudo apt update sudo apt install ghostscript gs --version 9.50 #版本不够安装的版本为9.50不够,因此去官网https://ghostscript.c…...
HarmonyOS5.0——CodeGenie:鸿蒙生态的AI编程革命
CodeGenie:鸿蒙生态的AI编程革命 华为推出的 CodeGenie 是集成于 DevEco Studio 的 AI 辅助编程工具,专为 HarmonyOS 应用开发设计。它通过深度优化 ArkTS 和 C 语言的代码生成能力,显著提升开发效率,降低鸿蒙生…...
【Dv3Admin】系统视图字典管理API文件解析
业务系统中静态数据管理常被忽视,但它直接影响到扩展性与维护效率。字典模块通过集中管理各类基础数据,避免硬编码,使系统具备更高的灵活性和适配能力,成为后台管理平台的重要基础组件。 文章解析 dvadmin/system/views/dictiona…...
免费 SecureCRT8.3下载、安装、注册、使用与设置
参考:SecureCRT 8.3中文 安装教程 - Hope - 博客园...

Redis :String类型
String类型 String是Redis中的字符串,是Redis中最基本的数据类型,直接是按照二进制数据的进行存储 Redis中的所有key都是String类型,但是value是有差别的 常见的命令 set 将String类型的value存储到key中,如果之间有相同的ke…...
两种Https正向代理的实现原理
正向代理 HTTPS 主要有两种方案,分别是基于证书的解密与再加密方案和基于 HTTP CONNECT 隧道的方案,以下是这两种方案的具体信息: 一、基于证书的解密与再加密方案 原理 工作原理:代理服务器拥有自己的证书,客户端需…...

第18节 Node.js Web 模块
什么是 Web 服务器? Web服务器一般指网站服务器,是指驻留于因特网上某种类型计算机的程序。 Web服务器的基本功能就是提供Web信息浏览服务。它只需支持HTTP协议、HTML文档格式及URL,与客户端的网络浏览器配合。 大多数web服务器都支持服务…...

网络爬虫一课一得
网页爬虫(Web Crawler)是一种自动化程序,通过模拟人类浏览行为,从互联网上抓取、解析和存储网页数据。其核心作用是高效获取并结构化网络信息,为后续分析和应用提供数据基础。以下是其详细作用和用途方向: …...

LeetCode--24.两两交换链表中的结点
解题思路: 1.获取信息: 给了一个链表,要求两两一组地交换位置 限定条件:只能进行结点交换,不能修改结点内部的值 额外条件:结点数在0-100的范围,闭区间 2.分析题目:…...

嵌入式SDK技术EasyRTC音视频实时通话助力即时通信社交/教育等多场景创新应用
一、引言 在数字化时代,即时通信已成为人们生活和工作中不可或缺的部分。音视频功能作为即时通信的核心,能实现更加直观、高效的信息传递。EasyRTC作为一款强大的实时通信框架,具备诸多优势,为即时通信的音视频应用提供了优质解…...

IDEA集成JRebel插件,实现实时热部署
系列文章目录 文章目录 系列文章目录一、JRebel是什么?1.1、对比传统开发流程1.2、JRebel特性以及优势 二、IDEA集成JRebel三、IDEA以JRebel运行报错处理四、IDEA以JRebel运行演示实时热部署 一、JRebel是什么? JRebel 是一款针对 Java 开发的热部署工具…...

1-3 Linux-虚拟机(2025.6.7学习篇- mac版本)
1、VMware Fusion下载 在windows系统中使用的VMwareWorkStation未提供Mac版,Mac系统可以使用VMwareFusionPro FusionPro和WorkstationPro均是VMware公司出品,完全兼容,体验基本是一致的。 下载地址:https://www.vmware.com/cn/pro…...

如何打造一款金融推理工具Financial Reasoning Workflow:WebUI+Ollama+Fin-R1+MCP/RAG
在之前的文章中,我探讨了如何使用具身人工智能,让大语言模型智能体来模仿[当今著名对冲基金经理的投资策略]。 在本文中,我将探讨另一种方法,该方法结合了经过金融推理训练的特定大语言模型(LLM)࿰…...
mybatis的if判断==‘1‘不生效,改成‘1‘.toString()才生效的原因
mybatis的xml文件中的if判断‘1’不生效,改成’1’.toString()才生效 Mapper接口传入的参数 List<Table> queryList(Param("state") String state);xml内容 <where><if test"state ! null and state 1">AND EXISTS(select…...

【试卷篇】Spring面试试卷题
一、选择题 1. 下面关于AOP的说法错误的是( C)。 A.AOP将散落在系统中的“方面”代码集中实现 B.AOP有助于提高系统的可维护性 C.AOP已经表现出了将要替代面向对象的趋势 D.AOP是一种设计模式,…...

通过阿里云 DashScope API 调用通义千问
获取API Key 百炼控制台https://bailian.console.aliyun.com/?tabmodel#/api-key 步骤 1:安装 DashScope SDK pip install dashscope 步骤 2:LangChain 调用 from langchain_community.llms import Tongyi# 设置阿里云 API Key(从环境变…...
Go 中 map 的双值检测写法详解
Go 中 map 的双值检测写法详解 在 Go 中,if char, exists : pairs[s[i]]; exists { 是一种利用 Go 语言特性编写的优雅条件语句,用于检测 map 中是否存在某个键。让我们分解解释这种写法: 语法结构解析 if value, ok : mapVariable[key]; …...

大故障:阿里云核心域名爆炸了
大故障:阿里云核心域名被拖走了 今天早上许多群里出现网站故障的讨论,比如 cnblogs 全国访问一片红,一看原来是阿里云又出故障了。 今天早上许多群里出现网站故障的讨论,比如 cnblogs 全国访问一片红,一看原来是阿里云…...

解决Zotero翻译插件Zotero PDF Translate无法正常翻译
试了很多方法了,不管怎么样还是报错,找到最简单的解决办法,把翻译引擎改成CNJI学术翻译就可以了。 不能用的原因是google 翻译API 无法调用。...

【Latex】Windows/Ubuntu 绘制 eps 矢量图通用方法(drawio),支持插入 Latex 数学公式
一直感觉 Visio 或者 PPT 中 Mathtype 对 latex 公式渲染效果不好,且在 Ubuntu 下的支持不好,最近重新调研发现一个好用的工具 drawio。 在线使用 https://app.diagrams.net/?srcabout 也有桌面版的应用,Windows 就下载 exe 安装器&#x…...
Vue---vue使用AOS(滚动动画)库
AOS介绍 aos.js是一个轻量级的动画库插件,可以简单的实现页面滚动触发动画效果,可以让我们网页看起来更加生动(高大上) 官网演示地址:aos.js 安装 YARN, NPM, BOWER安装 yarn add aos npm install aos --save bower install aos --save CDN引入 <link href"https…...
十(1). 强制类型转换
继第十部分C强制类型转换的四种方式,再进行强化巩固一下知识点 static_cast 最常用的,在指针之间做转换 const_cast 去除常量属性 dynamic_cast 用在基类和派生类之间的转换 reinterpret_cast 在任意类型之间进行转 10.1 static_cast 常见的使用场景&am…...
从npm库 Vue 组件到独立SDK:打包与 CDN 引入的最佳实践
文章目录 前言一、 原始方案:直接发布 npm 组件二、升级为独立 SDK:支持 CDN 引入三、核心要点总结1. 独立 Vue 实例2. 动态渲染组件3. 手动挂载到 DOM4. 与用户环境的关系 前言 近期在项目中引入了一个支持多格式(PDF、Video、Word等&#…...

rknn优化教程(一)
文章目录 1. 前述2. 优化思想2.1 实时帧率2.2 多线程处理2.2.1 排序2.2.2 批量处理2.2.3 队列 2.3 进一步优化 3. 代码 1. 前述 OK,铺垫了很久的rknn优化,终于开始写了。为什么要优化呢?当然是我们的使用遇到了瓶颈,要么使用的时…...

uniapp Vue2 获取电量的独家方法:绕过官方插件限制
在使用 uniapp 进行跨平台应用开发时,获取设备电量信息是一个常见的需求。然而,uniapp 官方提供的uni.getBatteryInfo方法存在一定的局限性,它不仅需要下载插件,而且目前仅支持 Vue3,这让使用 Vue2 进行开发的开发者陷…...

【统计方法】树模型,ensemble,bagging, boosting
决策树基础 回归树 理论上,决策区域可以有任何形状。• 然而,我们选择将预测空间划分为高维矩形或框,这是为了简单和易于解释结果预测模型 目标:将预测空间划分为矩形区域,最小化残差平方和(RSS&#x…...

【选配电脑】CPU核显工作机控制预算5000
【选配电脑】CPU核显工作机控制预算5000 1.背景2.配置及估价3.选配的说明 1.背景 不需要独立显卡,内存,硬盘尽量大; 预算控制到5000, 主板型号,电源功率支持后续添加独立显卡。 时间节点:2025.06.07 2.配…...

Mysql 插入中文乱码
session范围 查看数据库编码: show variables like %char%; # MySQL 5.7 字符集强制配置 # 修复 character_set_databaselatin1 等问题 [mysqld] character-set-server utf8mb4 collation-server utf8mb4_unicode_ci init_connect SET NAMES utf8mb4[client] d…...