当前位置: 首页 > article >正文

volatile这个关键字到底什么时候该加

你的变量被编译器偷偷优化掉了——volatile这个关键字到底什么时候该加欢迎关注微信公众号“边缘AI嵌入式”带你了解更多嵌入式加边缘AI的前沿技术和应用示例今天写volatile时想到上学那会给企业做的一个项目用的是某国产MCUADCDMA采集8个通道的模拟量。DMA搬运完成后触发中断中断里设标志位主循环里检测到标志位就去DMA缓冲区读数据做计算。开发阶段一直用-O0编译一切正常。交付前切到-O2做性能优化结果ADC读出来的值死活不更新永远是上电时第一次读到的值。查了两天。最后发现DMA缓冲区没加volatile。编译器在-O2下把缓冲区里的旧值缓存到了寄存器里后面每次读其实都在读寄存器里的过时数据。加上volatile两秒钟解决。两天的时间换了一个单词。这大概就是嵌入式开发的浪漫。你有没有遇到类似的这种玄学事件代码逻辑查了八百遍没问题。硬件信号拿示波器看了也没问题。但程序就是不按预期跑。最诡异的是——你把编译器优化等级从-O2降到-O0bug就消失了。你开始怀疑人生怀疑编译器甚至怀疑这颗芯片是从义乌小商品市场批发来的。别慌。十有八九你漏了一个volatile。先看一个经典翻车现场uint8_tflag0;voidEXTI0_IRQHandler(void){flag1;}intmain(void){// ... 初始化 ...while(flag0){// 等待中断把flag置1}// flag变成1了往下执行do_something();}逻辑清清楚楚主循环里死等等中断把flag改成1就往下走。有什么问题-O0编译一切正常。中断来了flag变1循环退出皆大欢喜。-O2编译主循环死在那里了。中断触发了一万次flag的值在内存里确实是1了但程序就是不往下走。原因是编译器太聪明了。编译器的小心思编译器的优化器在分析while(flag 0)这段代码的时候它看到的世界是这样的“flag在进入循环之前是0循环体里没有任何代码会修改flag所以flag永远是0。既然永远是0那这个循环永远不会退出。既然永远不退出我就不用每次都去内存里读flag了直接当成0就行。”然后编译器把你的代码优化成了等价于while(1){// 永远在这儿转}编译器没有错。从C语言的标准来看它的分析完全正确。因为编译器不知道有个叫中断的东西会在背后偷偷改变flag的值。在编译器的认知里如果当前的执行流没有修改一个变量那这个变量就不会变。这就是问题所在编译器不知道存在你的代码之外的力量。中断服务函数是硬件触发的不在编译器分析的正常执行流范围内。DMA控制器也是外设寄存器也是——它们都可以在你的代码背后偷偷改变内存中的值。volatile的作用告诉编译器别自作聪明volatile这个关键字翻译过来是易变的。它的作用就一句话告诉编译器这个变量可能在你看不见的地方被修改所以每次访问它都必须老老实实去内存里读别给我缓存到寄存器里偷懒。修复方案极其简单volatileuint8_tflag0;// 就加这么一个词加了volatile之后编译器在生成while(flag 0)的汇编代码时每次循环都会从flag对应的内存地址重新读取值而不是用寄存器里缓存的旧值。一个单词解决一个通宵。到底哪些场景必须加volatile记住这个口诀凡是会被你的代码之外的力量修改的变量都需要volatile。场景一中断和主循环之间共享的变量这是最常见的场景上面已经演示过了。中断里改的变量主循环里读加volatile。反过来也一样主循环里改的变量如果中断里要读也加。volatileuint32_tsystick_count0;// SysTick中断里累加voidSysTick_Handler(void){systick_count;}uint32_tget_tick(void){returnsystick_count;// 主循环里读}场景二硬件外设寄存器这个其实你已经在用了只是可能没注意到。STM32的CMSIS头文件里所有外设寄存器的定义都带着volatiletypedefstruct{__IOuint32_tCR1;// __IO就是volatile__IOuint32_tCR2;__IOuint32_tSR;// 状态寄存器硬件会自己修改它__IOuint32_tDR;// 数据寄存器收到数据硬件自动填进去// ...}USART_TypeDef;状态寄存器的值是硬件自己改的你的代码没动它但它就是变了。如果不加volatile编译器可能会把第一次读到的状态值缓存起来之后都用这个旧值那你永远也等不到发送完成的标志位。场景三RTOS中多个任务共享的变量如果你用了FreeRTOS之类的实时操作系统两个任务之间通过全局变量通信虽然正规做法应该用信号量或消息队列那这个变量也需要volatile。因为任务切换是由调度器控制的对编译器来说另一个任务的代码也属于看不见的力量。场景四DMA操作的目标缓冲区DMA直接内存访问可以在不经过CPU的情况下直接往内存里写数据。你的代码没动那块内存但DMA把串口收到的数据搬进去了。如果缓冲区没加volatile编译器可能认为那块内存里的内容没变过。volatileuint8_tdma_rx_buf[256];// DMA往这里搬数据volatile不能做的事讲完了该加的场景再讲讲volatile经常被过度神化的地方。误区一volatile能保证原子性不能。volatileuint32_tcounter0;// 中断里voidTIM_IRQHandler(void){counter;}// 主循环里voidmain_loop(void){uint32_tvalcounter;// 读出来的值可靠吗}在32位MCU上读写一个32位变量通常是原子的一条指令搞定所以上面这个例子碰巧没问题。但如果是一个64位变量或者是一个结构体counter这个操作就不是原子的了——它是读-改-写三步。中断可能在读和写之间插进来造成数据竞争。volatile只保证每次都去内存读不保证读写过程中不被打断。需要原子性的话你得关中断或者用硬件提供的原子操作指令。误区二volatile能当内存屏障用不完全能。在简单的Cortex-M单核MCU上volatile的效果通常足够了。但如果你在写多核系统或者和Cache打交道的高端SoC比如Cortex-A系列光靠volatile是不够的你还需要DMB/DSB之类的内存屏障指令来保证数据在各级缓存和内存之间的一致性。不过话说回来如果你在看这篇文章大概率还在跟Cortex-M打交道内存屏障的事暂时不用焦虑。误区三volatile会拖慢程序会但没你想的那么严重。加了volatile后编译器不能把这个变量优化到寄存器里每次都要访问内存确实会慢一点。但在嵌入式里需要加volatile的变量通常是标志位、计数器这种低频访问的东西。你的性能瓶颈绝不会出在这几个变量上。反过来说不该加的地方别乱加。如果你给一个纯粹的局部计算变量加了volatile编译器就没法做寄存器优化、循环展开这些加速手段那才是真的浪费性能。一个进阶技巧volatile的指针和指向volatile的指针这个是面试常考题也是日常开发中容易搞混的。volatileuint32_t*p1;// p1指向一个volatile的变量常用uint32_t*volatilep2;// p2本身是volatile的但指向的内容不是volatileuint32_t*volatilep3;// 全都是volatile的偶尔需要最常用的是第一种指针指向的那个内存地址里的值是可能被外部修改的。比如你定义一个指针指向外设寄存器的地址volatileuint32_t*uart_dr(volatileuint32_t*)0x40011004;每次通过*uart_dr读值编译器都会老老实实从0x40011004这个地址读不会缓存。这正是你想要的。第二种用得很少除非指针本身会在中断里被修改比如中断里切换了缓冲区的指针。第三种更少见除非指针和它指向的内容都可能被外部修改。那我怎么判断一个变量到底要不要加volatile问自己三个问题这个变量会不会在中断/DMA/其他任务里被修改——会就加。这个变量是不是映射到硬件寄存器的——是就加。这个变量只在当前函数或当前执行流里使用——那就别加让编译器好好优化。如果你实在拿不准还有一招开-O2编译跑一遍。再开-O0编译跑一遍。如果行为不一样大概率就是少了volatile。当然这招只能当救火工具不能当设计方法论。最好还是在写代码的时候就想清楚每个变量的生命周期和谁会动它。最后当你盯着屏幕上死活不变的变量值想砸键盘的时候先冷静看看是不是少了个volatile。它可能就是你和准时下班之间唯一的距离。*

相关文章:

volatile这个关键字到底什么时候该加

你的变量被编译器偷偷优化掉了——volatile这个关键字到底什么时候该加欢迎关注微信公众号,“边缘AI嵌入式”,带你了解更多嵌入式加边缘AI的前沿技术和应用示例今天写volatile时,想到上学那会给企业做的一个项目,用的是某国产MCU&…...

【泛型】泛型:泛型擦除、通配符、上下界限定

文章目录泛型:泛型擦除、通配符、上下界限定一、泛型基础概述1. 定义2. 核心作用二、泛型擦除(Type Erasure)1. 概念2. 擦除规则3. 擦除后的处理4. 影响与限制5. 代码示例三、通配符(Wildcard)1. 概念2. 三种通配符类型…...

【Java】Java核心关键字:final、static、volatile、synchronized、transient(附《面试高频考点》)

文章目录Java 5大核心关键字5大关键字——对比表1. final 关键字定义作用使用场景实现原理注意事项2. static 关键字定义作用使用场景实现原理注意事项3. volatile 关键字定义作用使用场景实现原理注意事项4. synchronized 关键字定义作用使用场景实现原理注意事项5. transient…...

写作压力小了!8个降AIGC网站测评:开源免费真能帮你降AI率吗

在学术写作日益依赖AI工具的当下,如何有效降低AIGC率、去除AI痕迹,同时保持文章的语义通顺和逻辑清晰,成为许多学生和研究者面临的难题。AI降重工具的出现,正是为了解决这一痛点,通过智能分析与优化,帮助用…...

【事务】Spring Framework核心——事务管理:ACID特性、隔离级别、传播行为、@Transactional底层原理、失效场景

文章目录事务管理一、事务核心基石:ACID四大特性二、事务并发问题与隔离级别2.1 并发事务引发的3大核心读异常2.2 SQL标准4大隔离级别2.3 核心补充:MVCC与隔离级别的关联三、Spring事务传播行为3.1 第一类:支持当前事务(优先加入已…...

QGIS缓冲区功能详解:从‘线段数’到‘端点样式’,这些高级参数你真的用对了吗?

QGIS缓冲区功能深度解析:参数组合的艺术与科学 引言:为什么需要关注缓冲区高级参数? 在空间分析领域,缓冲区分析是最基础却最容易被低估的工具之一。大多数QGIS用户都能快速创建一个简单的缓冲区——选择图层、输入距离、点击运行…...

跨平台启动盘制作:Linux环境下Windows安装介质创建全攻略

跨平台启动盘制作:Linux环境下Windows安装介质创建全攻略 【免费下载链接】windows2usb Windows 7/8/8.1/10/11 ISO to Flash Drive burning utility for Linux (MBR/GPT, BIOS/UEFI, FAT32/NTFS) 项目地址: https://gitcode.com/gh_mirrors/wi/windows2usb …...

开源工具维护终止:微信云备份工具cloudbak风险应对指南

开源工具维护终止:微信云备份工具cloudbak风险应对指南 【免费下载链接】cloudbak 微信云备份,备份到服务器、Docker、NAS,Web访问。 项目地址: https://gitcode.com/gh_mirrors/cl/cloudbak 事件概述:cloudbak项目生命周期…...

从图表示学习到影响力优化:DeepIM框架的端到端革新之路

1. 影响力最大化的技术困局与破局点 社交网络分析领域有个经典问题:给你100个免费试用品,如何选择初始用户才能让产品信息像病毒一样扩散?这就是影响力最大化(Influence Maximization)问题的现实映射。传统方法就像拿着…...

foobox-cn深度解析:foobar2000高级定制实战指南

foobox-cn深度解析:foobar2000高级定制实战指南 【免费下载链接】foobox-cn DUI 配置 for foobar2000 项目地址: https://gitcode.com/GitHub_Trending/fo/foobox-cn foobar2000作为专业音乐播放器,其默认界面往往难以满足高级用户的个性化需求。…...

Kotlin协程flow缓冲buffer任务流,批次任务中选取优先级最高任务最先运行(十)

Kotlin协程flow缓冲buffer任务流,批次任务中选取优先级最高任务最先运行(十) 在 https://blog.csdn.net/zhangphil/article/details/159286201 基础上改进,简化LoadMgr提交简单任务的方法 。 Kotlin协程Flow结合缓冲(buffer)实现…...

用Pyecharts玩转动态图表:Flask整合3种数据源实战教程(CSV/MySQL/Linux集群)

用Pyecharts玩转动态图表:Flask整合3种数据源实战教程(CSV/MySQL/Linux集群) 数据可视化是现代数据分析不可或缺的一环,而将数据以动态、交互式的方式呈现则能极大提升信息传达的效率。对于Python开发者来说,Pyecharts…...

如何3倍提升代码分析效率?这款工具让复杂项目一目了然

如何3倍提升代码分析效率?这款工具让复杂项目一目了然 【免费下载链接】codequery A code-understanding, code-browsing or code-search tool. This is a tool to index, then query or search C, C, Java, Python, Ruby, Go and Javascript source code. It build…...

EBioMedicine(IF=10.8)英国伦敦国王学院等团队:融合CT深度学习、CT放射组学与外周血免疫特征在症状患者队列中诊断肺癌的研究

01文献学习今天分享的文献是由英国伦敦国王学院综合癌症中心、英国伦敦大学学院等团队于2026年2月在《eBioMedicine》(中科院1区top,IF10.8)上发表的研究“Fusing data from CT deep learning, CT radiomics and peripheral blood immune pro…...

LaTeX多行大括号公式速成指南:5分钟搞定不等式排版(附常见错误排查)

LaTeX多行大括号公式速成指南:5分钟搞定不等式排版(附常见错误排查) 在学术写作中,数学公式的排版质量直接影响论文的专业性。对于不等式组、分段函数等需要多行对齐的场景,LaTeX的大括号语法是每个研究者必须掌握的技…...

从SEO到GEO:网络设备厂商必学的AI时代内容优化新技能

从SEO到GEO:网络设备厂商必学的AI时代内容优化新技能 当ChatGPT在2022年底横空出世时,很少有人能预料到生成式AI会如此迅速地重塑整个技术信息的传播格局。对于网络设备厂商而言,这场变革来得尤为猛烈——传统的关键词堆砌、外链建设等SEO手段…...

HR筛简历,第一眼先看什么?

HR筛简历,第一眼先看什么? 很多求职者投简历石沉大海,总觉得是自己能力不够,其实真相是:HR根本没看到你的亮点,就已经把你刷掉了。在海量简历面前,HR筛一份简历通常只需要6到15秒,第…...

优化问题存储格式对比:CBF vs MPS vs LP,哪种更适合你的场景?

优化问题存储格式深度对比:CBF、MPS与LP的技术选型指南 1. 优化问题存储格式的核心价值 在数学优化领域,数据存储格式的选择往往决定了工作流的效率和可扩展性。当处理包含混合整数变量、锥约束或大规模稀疏矩阵的复杂优化问题时,一个设计良好…...

别再混淆了!用Arduino实操演示ROM、RAM和FLASH的区别(附内存监控技巧)

别再混淆了!用Arduino实操演示ROM、RAM和FLASH的区别(附内存监控技巧) 在嵌入式开发领域,存储器类型的选择直接影响着程序性能和系统稳定性。许多初学者在面对ROM、RAM和FLASH时常常感到困惑——它们看起来都是"存储数据&quo…...

如何构建自主思考的AI智能体:微软官方完整入门指南

如何构建自主思考的AI智能体:微软官方完整入门指南 【免费下载链接】ai-agents-for-beginners 这个项目是一个针对初学者的 AI 代理课程,包含 10 个课程,涵盖构建 AI 代理的基础知识。源项目地址:https://github.com/microsoft/ai…...

Step3-VL-10B-Base与卷积神经网络结合:图像理解性能提升

Step3-VL-10B-Base与卷积神经网络结合:图像理解性能提升 在图像识别任务中,传统卷积神经网络(CNN)虽然擅长提取局部特征,但在处理复杂语义理解、多模态上下文推理等任务时往往表现有限。而视觉-语言大模型&#xff08…...

智能告警管理平台如何帮助运维团队减少75%告警噪音:Keep AIOps平台实践指南

智能告警管理平台如何帮助运维团队减少75%告警噪音:Keep AIOps平台实践指南 【免费下载链接】keep The open-source alerts management and automation platform 项目地址: https://gitcode.com/GitHub_Trending/kee/keep 在现代IT环境中,运维团队…...

从散乱点到完美圆:Python实战最小二乘法圆拟合,处理2D/3D数据一键搞定

从散乱点到完美圆:Python实战最小二乘法圆拟合,处理2D/3D数据一键搞定 在计算机视觉、工业检测和科学计算领域,圆拟合是一项基础但至关重要的技术。想象一下这样的场景:你需要从激光雷达扫描的点云中识别机械零件的圆形轮廓&#…...

通义千问3-VL-Reranker-8B在电商搜索中的惊艳效果展示

通义千问3-VL-Reranker-8B在电商搜索中的惊艳效果展示 1. 多模态重排序如何改变电商搜索体验 电商平台的搜索功能正面临前所未有的挑战。当用户输入"白色连衣裙 夏季 透气"时,传统搜索引擎只能基于文本匹配返回结果,无法理解"透气"…...

别再死磕监督学习了!用Python从零搭建一个强化学习智能体(附完整代码)

用Python实战强化学习:从CartPole到自主决策智能体 在机器学习领域,监督学习长期占据主导地位,但当我们面对需要与环境持续交互、通过试错获取反馈的复杂任务时,强化学习展现出独特优势。本文将带您用Python构建一个能玩转OpenAI …...

Kimi/豆包/DeepSeek生成的论文怎么降AI率?不同AI工具降AIGC策略详解

Kimi/豆包/DeepSeek生成的论文怎么降AI率?不同AI工具降AIGC策略详解 2026年初,一个新现象引起了高校老师们的注意:同一个班级的毕业论文,虽然题目各不相同,但读起来总有一种微妙的"相似感"。有些论文像是同一…...

论文降AI率要花多少钱?2026主流降AI工具收费标准对比

论文降AI率要花多少钱?2026主流降AI工具收费标准对比 “降一次AI率要好几百,太贵了吧?” “隔壁寝室用的那个才几十块,不知道靠不靠谱。” “有没有免费的降AI工具?” 每年毕业季,这些问题都会在各个论文交…...

Windows/Mac双平台实测:Qt 6.9.0离线安装包+在线安装器对比评测

Qt 6.9.0跨平台安装全攻略:离线包与在线安装器的深度实测 当开发团队需要为Windows和macOS双平台部署Qt 6.9.0开发环境时,选择正确的安装方式往往能节省数小时的配置时间。本文将基于真实企业级部署场景,通过20组对照实验数据,揭示…...

文科论文降AI率难度更大?人文社科类论文降AIGC率的正确方法

文科论文降AI率难度更大?人文社科类论文降AIGC率的正确方法 “我全文都是自己写的,为什么AI率还有42%?” 这是一位中文系研究生最近在论文交流群里的吐槽。她的毕业论文研究的是明清小说叙事结构,通篇都是自己一字一句写的&#x…...

Gazebo Materials 颜色与材质应用指南

1. Gazebo Materials基础入门:从颜色列表到材质选择 第一次打开Gazebo仿真环境时,很多人会被默认的灰色网格世界搞得兴趣全无。其实只要稍微了解Materials系统,你就能让机器人仿真场景瞬间鲜活起来。Gazebo内置了超过60种预定义材质&#xff…...