在MCU工程中优化CPU工作效率的几种方法
在嵌入式系统开发中,优化 CPU 工作效率对于提升系统性能、降低功耗、提高实时性至关重要。Keil 作为主流的嵌入式开发工具,提供了多种优化策略,包括 关键字使用、内存管理、字节对齐、算法优化 等。本文将从多个方面介绍如何在 Keil 工程中优化 CPU 运行效率。
一、关键字优化
1. 使用 static 关键字
-
减少栈操作:static 变量存放在 静态存储区,避免函数调用时频繁创建和销毁局部变量,减少 CPU 访问栈的开销。
-
优化函数调用:static 限定函数作用域,编译器可以优化调用方式,如内联优化或删除未使用的函数。
示例:
static int counter = 0; // 避免频繁创建局部变量,提升性能
2. 使用 inline 关键字
- 减少函数调用开销:对于小的、频繁调用的函数,使用 inline 让编译器展开函数,减少栈操作,提高执行效率。
示例:
inline int add(int a, int b) {return a + b; // 直接展开,提高性能
}
3. 使用 const 关键字
-
优化编译器优化空间:const 变量不会被修改,编译器可将其优化为常量表达式,减少 RAM 访问,提高指令执行效率。
-
避免全局变量占用 RAM:const 变量通常存储在 Flash(只读存储区),减少 RAM 使用,提高运行效率。
示例:
const uint32_t baud_rate = 115200; // 存放在 Flash 中,减少 RAM 占用
4. 使用 volatile 关键字
-
防止编译器优化:适用于 寄存器变量、外设寄存器、共享变量,避免编译器优化导致的错误,确保每次都从实际地址读取值。
-
适用于中断变量、硬件寄存器访问等场景。
示例:
volatile uint8_t flag = 0; // 确保每次读取的值都是最新的
二、字节对齐(结构体优化)
嵌入式系统中,结构体成员若未对齐,CPU 可能需要额外的 总线周期 读取数据,从而降低效率。
1. 使用 attribute((aligned(n))) 或 #pragma pack(n)
#pragma pack(4) // 4字节对齐
typedef struct {uint32_t id;uint16_t value;uint8_t flag;
} __attribute__((aligned(4))) my_struct_t;
#pragma pack()
-
尽量让结构体成员按 32-bit (4字节) 对齐,提高访问效率。
-
结构体字段按照 uint32_t -> uint16_t -> uint8_t 顺序排列,避免填充字节,减少存储空间浪费。
三、内存管理优化
1. 减少堆(heap)使用
-
malloc/free 开销大,容易导致碎片化,应避免在 实时任务 或 中断 中使用。
-
优先使用静态内存 (static 变量) 代替堆内存分配,提高执行效率。
2. 使用 DMA(直接存储访问)
-
减少 CPU 负担,使用 DMA 传输数据(如 UART、SPI、I2C),CPU 仅需触发 DMA 传输,不用参与整个数据搬运过程。
-
适用于大数据量传输场景,如传感器数据读取、LCD 屏幕刷新等。
四、指令优化(算法层面)
1. 使用位运算代替乘除法
>> 代替除法,<< 代替乘法,减少 CPU 指令执行时间。
int x = a * 8; // 慢
int y = a << 3; // 快
2. 使用查表法
预计算常用值 存入查找表(LUT),避免实时计算,如 sin() 和 cos()。
const uint8_t sine_table[256] = { /* 预计算数据 */ };
uint8_t value = sine_table[angle]; // 直接查表,提高效率
3. 使用循环展开
for (int i = 0; i < 4; i++) {sum += arr[i]; // 常规循环
}// 进行循环展开
sum = arr[0] + arr[1] + arr[2] + arr[3]; // 提高 CPU 指令并行度
4. 减少浮点运算
-
浮点运算 (float) 比整数运算 (int) 慢,尽量使用整数计算。
-
使用 fixed-point 计算替代浮点计算(如 Q31、Q15 格式)。
五、其他优化措施
1. 使用 O3 级别优化
-
Keil 提供 优化选项 O0 ~ O3,O3 优化级别最高,可自动优化代码执行效率,但可能影响调试。
-
O2 适用于大多数场景,O3 适用于对性能要求极高的任务。
2. 优化中断
-
减少 ISR 执行时间,避免在中断中执行复杂运算。
-
使用
__attribute__((interrupt))声明中断函数,优化编译器生成的中断代码。
3. 使用 CMSIS 和 ARM DSP 库
-
ARM 提供的 CMSIS-DSP 和 CMSIS-NN 库 对 Cortex-M 内核进行了优化,加速数学运算。
-
例如,使用 arm_math.h 中的 arm_sqrt_f32() 计算平方根,比 sqrt() 更快。
总结

相关文章:
在MCU工程中优化CPU工作效率的几种方法
在嵌入式系统开发中,优化 CPU 工作效率对于提升系统性能、降低功耗、提高实时性至关重要。Keil 作为主流的嵌入式开发工具,提供了多种优化策略,包括 关键字使用、内存管理、字节对齐、算法优化 等。本文将从多个方面介绍如何在 Keil 工程中优…...
优化程序命名:提升专业感与用户体验
在软件开发的广阔天地中,程序命名这一环节常常被开发者们忽视。不少程序沿用着简单直白、缺乏雕琢的名字,如同素面朝天的璞玉,虽不影响其核心功能的发挥,但却在无形之中错失了许多提升用户印象与拓展应用场景的机会。今天…...
美团民宿 mtgsig 小程序 mtgsig1.2 分析
声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向分析 cp execjs.compile(open(民…...
短视频团队架构工作流程---2025.3.30 李劭卓
短视频团队架构&工作流程—2025.3.30 李劭卓 文章目录 短视频团队架构&工作流程---2025.3.30 李劭卓1 工作职责1.1 编剧:1.2 主编:1.3 总编:1.4 导演:1.5 摄影:1.6 演员:1.7 后期:1.8 美…...
es 集群存储字典 json字段----python实现
本人的意思是value为json格式数据,而不是简单的如下这种:这种我就没有必要写个博文,肯定是复杂的情况啊。 from elasticsearch import Elasticsearch import json# 创建Elasticsearch客户端 es = Elasticsearch([{host: localhost, port: 9200}])# 定义要存储的字典 my_dic…...
(done) MIT6.824 Lecture 02 - RPC and Threads
知乎专栏:https://zhuanlan.zhihu.com/p/641105196 原视频:https://www.bilibili.com/video/BV16f4y1z7kn?spm_id_from333.788.videopod.episodes&vd_source7a1a0bc74158c6993c7355c5490fc600&p2 看知乎专栏 一、Why we choose go?…...
软件工程面试题(二十四)
1、连接池的原理 j2ee 服务器启动时会建立一定数量的池连接,并一直维持不少于此数量的池连接。当客户端程序需要连接时,吃驱动程序会返回一个未使用的池连接并将其标记为忙。如果当前 没有空闲连接,池驱动就建立一定新的 连接 2、用javascript编写脚本小程序,实现点击全选…...
LayaAir3.3.0-beta.3重磅更新!Spine4.2、2D物理、UI系统、TileMap等全面升级!
正式版推出前,说明3.3的功能还没开发完。所以,又一大波更新来了~ 下面对重点更新进行说明。 Spine的重要更新 3.3.0-beta.3版本开始,新增了Spine 4.2 的运行时库,Spine动画上可以支持物理特性了。例如,下图右侧女孩在启…...
【AI学习】机器学习算法
1,线性回归模型(Linear Regression):预测连续数值 寻找自变量(解释变量)与因变量(被解释变量)之间的线性关联关系,通过构建线性方程来对数据进行拟合和预测。即两个变量之间是一次函…...
【渗透测试】Vulnhub靶机-FSoft Challenges VM: 1-详细通关教程
下载地址:https://www.vulnhub.com/entry/fsoft-challenges-vm-1,402/ 目录 前言 信息收集 目录扫描 wpscan扫描 修改密码 反弹shell 提权 思路总结 前言 开始前注意靶机简介,当第一次开机时会报apache错误,所以要等一分钟后重启才…...
【区块链+ 房产建筑】山东省建筑产业互联网平台 | FISCO BCOS 应用案例
山东省建筑产业互联网平台(山东省弘商易盟平台)是基于区块链技术构建的分布式产业互联网平台, 旨在把各企业内部的供应链协同管理系统(包括采购或者SRM 系统, 以及销售或CRM 系统)利用区块链技术链接起来&a…...
Node.js全局生效的中间件
目录 1. 目录结构 2. 代码实现 2.1 安装Express 2.2 app.js - 主文件 2.3 globalMiddleware.js - 全局中间件 3. 程序运行结果 4. 总结 在Node.js的Express框架中,全局生效的中间件是指应用程序启动后,对所有请求都有效的中间件。它通常用于日志记…...
国家天文台携手阿里云,发布国际首个太阳大模型“金乌”
2025年4月1日,中国科学院国家天文台与阿里云共同宣布推出全球首个太阳物理大模型“金乌”,在太阳活动预测领域实现颠覆性突破——其针对破坏性最强的M5级太阳耀斑预报准确率高达91%,远超传统数值模型,标志着人类对太阳的认知迈入“…...
数据结构(5)——栈
目录 前言 一、栈的概念及其结构 二、栈的实现 2.1说明 2.2动态栈结构体定义 2.3初始化 2.4销毁 2.5进(压)栈 2.6检验栈是否为空 2.7弹(出)栈 2.8栈的元素个数 2.9访问栈顶元素 三、运行 总结 前言 栈是一种常见的…...
Css径向渐变 - radial-gradient
由background-image: radial-gradient(at 75% 7%, blue 0px, transparent 50%);引出: 一、径向渐变是什么 径向渐变是颜色从一个中心点向外扩散的变化过程。 二、radial-gradient 函数是什么 1、使用语法: background-image: radial-gradient(shape si…...
理解激活函数,多个网络层之间如何连接
1. 激活函数如何在两个层之间作用 如果不在两个层之间添加激活函数,模型将无法学习非线性关系,表现出像线性模型一样的局限性。 LeakyReLU(0.2) 是一个激活函数,它的作用是对每一层的输出进行非线性转换。激活函数通常在神经网络中用于增加网…...
HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板
HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板 这里写目录标题 HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板项目介绍技术栈核心功能实现1. 画板初始化与工具管理2. 多样化绘画工具3. 事件处理机制 技术要点分析1. Canvas上下文优化…...
2025亲测有用 yolov8 pt转onnx转ncnn 部署安卓
参考文章:pt转onnx转ncnn模型(yolov8部署安卓)_best.pt 转ncnn模型-CSDN博客 Yolov8-Ncnn模型部署Android,实现单一图片识别_yolov8转ncnn-CSDN博客 onnx转化为ncnn这条路径现在已经落后了,更多的是通过pnnx转化为nc…...
cursor的.cursorrules详解
文章目录 1. 文件位置与作用2. 基本语法规则3. 常用规则类型与示例3.1 忽略文件/目录3.2 限制代码生成范围3.3 自定义补全建议3.4 安全规则 4. 高级用法4.1 条件规则4.2 正则表达式匹配4.3 继承规则 5. 示例文件6. 注意事项 Cursor 是一款基于 AI 的智能代码编辑器,…...
MySQL 入门大全:运算符
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…...
Oracle数据库数据编程SQL<3.6 PL/SQL 包(Package)>
包是Oracle数据库中一种重要的PL/SQL程序结构,它将逻辑相关的变量、常量、游标、异常、过程和函数组织在一起,提供了更好的封装性和模块化。在大型项目中,可能有很多模块,而每一个模块又有自己的存过、函数等。而这些存过、函数默认是放在一起的,如果所有的存过函数都是放…...
Rust 语言语法糖深度解析:优雅背后的编译器魔法
之前介绍了语法糖的基本概念和在C/Python/JavaScript中的使用,今天和大家讨论语法糖在Rust中的表现形式。 程序语言中的语法糖:让代码更优雅的甜味剂 引言:语法糖的本质与价值 语法糖(Syntactic Sugar) 是编程语言中那些并不引入新功能&…...
React-Markdown详解
React-Markdown 详解(2025年最新实践指南) 一、核心特性与架构解析 React-Markdown 是一个基于 React 的 Markdown 渲染组件库,其核心设计理念是通过 Unified 生态系统实现安全、可扩展的 Markdown 解析。关键特性包括: 安全渲染…...
uniapp 微信小程序 使用ucharts
文章目录 前言一、组件功能概述二、代码结构分析2.1 模板结构 总结 前言 本文介绍一个基于 Vue 框架的小程序图表组件开发方案。该组件通过 uCharts 库实现折线图的绘制,并支持滚动、缩放、触摸提示等交互功能。文章将从代码结构、核心方法、交互实现和样式设计等方…...
mysql中将外部文本导入表中过程出现的错误及解决方法
问题一: MySQL Loading local data is disabled; this must be enabled on both the client and server sides (MySQL加载本地数据被禁用;这必须在客户端和服务器端同时启用) 解决方法: 1,依次输入以下命令…...
C#实现HiveQL建表语句中特殊数据类型的包裹
用C#实现搜索字符串中用’(‘和’)‘包裹的最外层的里面里面的字符串,将里面的记录按一个或多个空格、换行或tab,或者是它的在一起的组合作为分隔,分隔出多个字符串组,如果组中有字符串中同时包含’<‘和’>’,则…...
【idea】实用插件
SonarLint SonarLint:代码质量扫描工具 使用 SonarLint 可以帮助我们发现代码的问题,并且还提供了相应的解决方案. 对于每一个问题,SonarLint 都给出了示例,还有相应的解决方案,教我们怎么修改,极大的方便了我们的开发…...
关于mysql 数据库中的 慢SQL 的详细分析,包括定义、原因、解决方法及表格总结
以下是关于 慢SQL 的详细分析,包括定义、原因、解决方法及表格总结: 1. 什么是慢SQL? 定义: 慢SQL 是指执行时间超过预设阈值(如 2 秒)的 SQL 语句,通常会导致数据库响应延迟、资源占用过高&am…...
uniapp选择文件使用formData格式提交数据
1. Vue实现 在vue项目中,我们有个文件,和一些其他字段数据需要提交的时候,我们都是使用axios 设置请求头中的Content-Type: multipart/form-data,然后new FormData的方式来进行提交。方式如下: const sendRequest = () => {const formData = new FormData()formData…...
蓝牙数字音频和模拟音频优劣势对比?
蓝牙模块中我们常说的模拟音频和数字音频,是指两种不同的信号处理技术,它们都可以实现声音的录制、存储、编辑、压缩或播放,但也有一些区别和特点。本文将为您深入解析蓝牙数字音频和模拟音频的一些常见区别。 数字音频: 蓝牙数…...
