当前位置: 首页 > news >正文

【研发日记】嵌入式处理器技能解锁(六)——ARM的Cortex-M4内核

文章目录

前言

背景介绍

指令集架构

ARM起源

ARM分类

Cortex-M4

内核框架

指令流水线

实践应用

总结

参考资料


前言

        见《【研发日记】嵌入式处理器技能解锁(一)——多任务异步执行调度的三种方法》

        见《【研发日记】嵌入式处理器技能解锁(二)——TI C2000 DSP的SCI(串口)通信》

        见《【研发日记】嵌入式处理器技能解锁(三)——TI C2000 DSP的C28x内核》        

        见《【研发日记】嵌入式处理器技能解锁(四)——TI C2000 DSP的Memory》

        见《【研发日记】嵌入式处理器技能解锁(五)——TI C2000 DSP的中断系统》

背景介绍

        ARM内核最典型的应用就是STM32,也是ARM内核出货量最大,应用最广泛的一个地方,如下图所示:

指令集架构

        理论上指令集分为复杂指令集(Complex Instruction Set Computer,CISC)和精简指令集(Reduced Instruction Set Computer,RISC)。CISC出现的较早,典型的代表是x86架构。CISC里边的每个指令通常包含多个操作(指令长度在几字节到十几字节不等),这些操作可以在单个指令中完成,这样就可以通过一条指令完成复杂的操作,减少了内存访问次数实现更高的代码执行效率,同时也提高了代码密度减少了软件开发人员编写代码的时间和工作量。随着技术的发展,指令数量越来越多,CISC处理器的设计和优化变得越来越困难,并且大部分的指令的使用频率非常低,导致了硬件资源的浪费。所以就出现了RISC,慢慢更加流行起来。RISC的特点是每个指令只执行一个操作(指令长度在2字节或4字节),指令数量精简掉很多,提高了处理器的可靠性。软件开发人员组合使用这些指令,也可以实现复杂的功能,同时也更容易对复杂操作进行设计和优化。

        下面以伪汇编指令举例,说明一个简单加法运算:地址[0001]的数据,和地址[0002]的数据相加,结果存到地址[0003]里。

        ACC形式的伪汇编指令如下:

LOAD ACC [0001]  //地址[0001]的数据,加载到累加器ACCADD ACC [0002] ACC  //ACC加地址[0002]的数据,结果存到ACCSTOR ACC [0003]  //ACC的数据存到地址[0003]

        LOAD_ STORE形式的伪汇编指令如下:

LOAD R1 [0001]    //地址[0001]的数据,加载到R1寄存器LOAD R2 [0002]    //地址[0002]的数据,加载到R2寄存器ADD R3 R1 R2       //R1+R2,结果存到R3寄存器STORE R3 [0003]   //R3寄存器的数据存到地址[0003]

        ACC形式的微控制器只有一个ACC(累加器,ACC可以认为是一个寄存器),数据可以直接从RAM到ACC进行累加,但是运算结果需要还存回RAM里,ACC才能放入新数据。运算速度的瓶颈卡在ACC寄存器数量太少。

        LOAD_ STORE形式的微控制器没有ACC,而是增加了多个内部运算寄存器R1、R2、R3、…、R12等等,多形参函数不用反复的压栈和出栈,降低了内核和外部数据的耦合程度(同时也增加了调度难度)。运算速度的瓶颈卡在LOAD环节太多。

        总的来讲CISC和RISC各有优缺点,现代计算机处理器通常采用混合指令集。现实中的嵌入式系统芯片大多是以RISC为主体(有利于平台化通用化),少量补充一些专用CISC(有利于专项性能极致发挥),所以很难把一个厂商的处理器明确地划分为CISC或者RISC。当前影响比较大的两类是ARM(Advanced RISC Machines)和RISC-V(Reduced Instruction Set Computer -Five)。

        ARM是一种基于RISC架构的处理器架构,采用了Thumb简化指令集和Thumb-2扩展指令集。Thumb简化指令集是一种基于RISC的指令集,指令长度为16位,比原本的32位指令集要短,占用空间更小,能够在存储和传输数据时提高效率。Thumb-2扩展指令集则是在Thumb简化指令集的基础上扩展而来的,指令长度包括16位和32位两种,支持更多的指令和操作,满足不同领域应用的需求。除了RISC之外,ARM还采用了一些特殊的技术,如流水线、分支预测等,以提高指令的执行速度和效率。ARM的部分指令集如下图所示:

        RISC-V是基于RISC的一个开放,免费的指令集架构,具有灵活、可扩展定制、跨平台、广泛适用等特点。RISC-V指令集设计的目标是提供一种通用的指令集架构,适用于各种计算机系统和嵌人式系统,包括高性能服务器、个人计算机、移动设备、物联网、机器人、汽车电子等领域。RISC-V包括基本指令集(RV32I、RV64I)和标准扩展指令集(RV32G、RV64G),以及可选的专用扩展指令集,如浮点指令集(RV32F、RV32D、RV64F、RV64D),向量指令集(RV32V、RV64V)等,开发者可以根据实际需求选择合适的指令集。RISC-V的特性点决定了其在未来计算机系统和嵌人式系统发展趋势中的重要地位,是我国芯片领域自主创新的一个重要方向,以华为麒麟710、北京兆易GD32V系列为代表的国产RISC-V芯片,已经开始广泛用于各种领域。

        Tips1:MIPS(Microprocessor without Interlocked Pipeline Stages)也是采取RISC的一种指令集架构。

        Tips2:TI C2000 DSP的C28x内核官方宣称是RISC,实际上也包含了CISC。

ARM起源

        1978年,物理学家Hermann Hauser和工程师Chris Curry在英国剑桥创办了CPU(Cambridge Processing Unit)公司,主要业务是为当地市场供应电子设备。后来公司改名为ACG(Acorn Computer Group)公司。

        1983年,ACG公司开始研发一种新的处理器架构,命名为ARM(Advanced RISC Machine)。两年时间就开始被应用在自家的新一代计算机Archimedes上。

        1990年,ACG公司正式改名为ARM计算机公司,吸引了很多大公司的投资。苹果公司、芯片厂商VLSI公司,加上ACG本身的资金和知识产权,一起人股做了一家这样的ARM计算机公司。起初由于业务不景气,ARM公司被迫放弃自己制造芯片,把芯片的设计方案授权给其他公司来生产。正是因为这个因祸得福的模式,使ARM的芯片遍地开花。这个迫于无奈的决定,在今天看来意义非常深远,奠定了ARM公司长久以来的发展模式。

        近年来,ARM 继续推出了一系列高性能、低功耗的处理器,如Cortex-A76、Cortex-A77和Cortex-A78等,被广泛地应用于智能手机、物联网和自动驾驶等领域。同时,ARM还在人工智能、机器学习等领域不断进行探索。

        现在的ARM公司是全球嵌人式处理器领域的领导者,在嵌入式领域有着巨大的影响。ARM公司基本不生产处理器芯片,而是专注于设计处理器内核和架构,然后再授权给其他芯片厂商,赚取首次的授权费和后续销售每颗处理器芯片的知识产权费。ARM合作商遍布全球,根据ARM公司发布的数据,其处理器架构在全球处理器市场份额已经超过50%,特别是在智能手机和平板电脑等领域,几乎是市场的独霸者。由于ARM刚好赶上了移动设备爆发式发展的时代,最终造就了它的辉煌。

        未来,虽然ARM公司宣称其基本统一了全球的智能手机领域,但在手机领域里并不轻松,有被边缘化的可能性。手机行业的客户非常强大又强势,且客户的研发实力更强,也不想受制于人,都开始着手做自己的微架构(国内的手机公司也准备抛弃ARM公司的微架构)。苹果、高通等手机芯片厂家,并不采用ARM公司的微架构,仅购买其指令集,所以不同手机处理器厂家有不同的处理速度、扩展硬件和扩展指令。

        Tips:ARM起初是一家英国公司,2016年被日本软银集团收购了,到了2020年美国NVIDIA(英伟达)想再次收购ARM,因垄断调查没有成功。

ARM分类

        ARM处理器产品分为传统经典系列和较新的Cortex处理器系列,并且根据应用范围的不同又分为应用处理器、实时处理器、微控制处理器三种类别。如下图所示:

        Cortex-A系列:这是一种ARMv7、ARMv8(64位)或ARMv9(64位)版本的应用处理器架构,采用了超标量流水线设计,能够实现更高的性能和效率。适用于高性能的移动设备、智能电视、网络设备、云计算和服务器等场景。

        Cortex-R系列:这是一种针对实时系统的ARM架构,增加了一些安全机制,具有强实时性和高可靠性,支持容错和纠错机制。适用于汽车、工业自动化、航空航天和医疗设备等领域中的专项应用,相比A系列和M系列它的市场应用窄很多。

        Cortex-M系列:这是一种专门为嵌入式系统和微控制器设计的ARM架构,具有低功耗、低成本和微实时性等特点,可以实现小型、低功耗的嵌入式系统设计。适用于智能家居、物联网、汽车、工业自动化、航空航天和医疗设备等领域的广泛应用。Cortex-M系列逐渐有覆盖R系列和A系列部分特性的发展趋势,其子系列非常丰富,包括:

1、低速度和低功耗定点系列:MO、M0+;

2、中端定点系列:M3;

3、中端含有DSP功能的可选浮点系列:M4;

4、高端含有DSP功能的浮点系列:M7;

5、加人安全机制系列:M23、M33、M35P。

        Tips:这里缺少了M1系列,因为M1系列只适用于运行在FPGA上,不是通用的微控制器内核。

Cortex-M4

        ST(意法半导体),由意大利和法国的两家半导体公司合并而成。ST公司以STM32为前缀的32位微处理器,就是采用ARM的内核。其中最为人熟知,最主流也是性价比最高的,就是入门级别的STM32 F1系列和中端级别STM32 F3系列。F1系列与F3系列最主要的不同之处就是,Cortex-M4比Cortex-M3多了浮点处理单元和DSP单元,如下图所示:

        DSP(Digital Signal Process)特性:

Single-cycle 16/32-bit MAC(Combined Multiply and Accumulate);

Single-cycle dual 16-bit MAC;

8/16-bit SIMD(Single Instruction, Multiple Data) arithmetic;

Hardware support for conversion, addition, subtraction, multiplication with optional accumulate, division(2-12 cycles), and square root;

        FPU(Floating-Point Unit)特性:

Optional single precision floating point unit;

IEEE 754 compliant;

内核框架

        Cortex-M4的内核框架如下图所示:

指令流水线

        Cortex-M4采用3级Pipeline(流水线)如下图所示:

实践应用

        👍点赞过100,下一篇文章继续

总结

一个处理器要向更高性能升级,常用的主要途径是:

1、采用更先进的nm制程工艺水平;

2、降低内核电压,从而降低功耗获得更快的工作频率

3、增加多级流水线

4、多核,但也带来代码复杂性的急剧上升;

5、增加更宽的位数,从而一次性处理多个数据,即单指令多数据流(SIMD);

6、添加新的独立硬件单元,并添加新指令。与此同时,仍要保持系统的向下兼容性,保留原先大多数的旧指令。

        随着指令的增加,要保持系统仍是精简指令集,是一件困难的事情。有程序员感叹:这个世界到底有没有指令很少的精简指令集系统?虽然多数书籍时髦的人云亦云地说,RISC架构的指令更少,实际上不断增长的ARM指令非常多,绝对不比CISC指令少。

        以上就是本人在研发中使用ARM Cortex-M4处理器时,一些个人理解和分析的总结,主要介绍了ARM的起源和发展,展示了ARM Cortex-M4内核的工作原理,并分析了它的特点和应用场景。

        后续还会分享另外几个最近解锁的嵌入式处理器新技能,欢迎评论区留言、点赞、收藏和关注,这些鼓励和支持都将成文本人持续分享的动力。

        另外,上述例程使用的Demo工程,可以到笔者的主页查找和下载。

参考资料

        Arm-Cortex-M4-Processor-Datasheet.pdf


        版权声明,原创文章,转载和引用请注明出处和链接,侵权必究!

相关文章:

【研发日记】嵌入式处理器技能解锁(六)——ARM的Cortex-M4内核

文章目录 前言 背景介绍 指令集架构 ARM起源 ARM分类 Cortex-M4 内核框架 指令流水线 实践应用 总结 参考资料 前言 见《【研发日记】嵌入式处理器技能解锁(一)——多任务异步执行调度的三种方法》 见《【研发日记】嵌入式处理器技能解锁(二)——TI C2000 DSP的SCI(…...

深度学习经典模型之T5

T5(Text-to-Text Transfer Transformer) 是继BERT之后Google的又外力作,它是一个文本到文本迁移的基于Transformer的NLP模型,通过将 所有任务统一视为一个输入文本并输出到文本(Text-to-Text)中,即将任务嵌入在输入文本中,用文本的…...

10.第二阶段x86游戏实战2-反编译自己的程序加深堆栈的理解

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 本次游戏没法给 内容参考于:微尘网络安全 工具下载: 链接:https://pan.baidu.com/s/1rEEJnt85npn7N38Ai0_F2Q?pwd6tw3 提…...

ARM总复习

1.计算机的组成 输入设备 输出设备 存储设备 运算器 控制器、总线 2.指令和指令集 2.1 机器指令 机器指令又叫机器码,在运算器内部存在各种运算电路,当处理器从内存中获取一条机器指令,就可以按照指令让运算器内部的指定的运算电路进行运…...

​​使用ENVI之大气校正(下)

再根据遥感影像的拍摄时间将Flight ate与Flight Time GMT (H:M:SS)填写,如要查询按如下方法 这里按照表中的内容修改 根据影像范围的经纬度与拍摄时间更改Atmospheric Model,更改完成后点击Multispectral Settings...在跳出的界面中选择GUI再点击Default…...

C++(学习)2024.9.18

目录 C基础介绍 C特点 面向对象的三大特征 面向对象与面向过程的区别 C拓展的非面向对象的功能 引用 引用的性质 引用的参数 指针和引用的区别 赋值 键盘输入 string字符串类 遍历方式 字符串与数字转换 函数 内联函数 函数重载overload 哑元函数 面向对象基…...

认知小文2《成功之路:习惯、学习与实践》

内容摘要: 在这个充满机遇的时代,成功不再是偶然,而是可以通过培养良好习惯、持续学习和实践来实现的目标。    一、肌肉记忆:技能的基石 成功往往需要像运动员一样,通过日复一日的练习来形成肌肉记忆。无论是健身…...

【数据仓库】数据仓库层次化设计

一、基本概念 **1. RDS(RAW DATA STORES,原始数据存储)** RDS作为原始数据存储层,用于存储来自各种源头的未经处理的数据。这些数据可能来自企业内部的业务系统、外部数据源或各种传感器等。RDS确保原始数据的完整性和可访问性&…...

【DAY20240918】03教你轻松配置 Git 远程仓库并高效推送代码!

文章目录 前言 git diff一、远程仓库?1、在 Gitee 上新建仓库:2、Git 全局设置:3、添加远程仓库:4、推送本地代码到远程仓库:5、输入用户名和密码:6、后续推送: 二、全情回顾三、参考 前言 git …...

从IPC摄像机读取视频帧解码并转化为YUV数据到转化为Bitmap

前言 本文主要介绍根据IPC的RTSP视频流地址,连接摄像机,并持续读取相机视频流,进一步进行播放实时画面,或者处理视频帧,将每一帧数据转化为安卓相机同格式数据,并保存为bitmap。 示例 val rtspClientListener = object: RtspClient.RtspClientListener {override fun …...

LeetCode 面试经典 150 题回顾

目录 一、数组 / 字符串 1.合并两个有序数组 (简单) 2.移除元素 (简单) 3.删除有序数组中的重复项 (简单) 4.删除有序数组中的重复项 II(中等) 5.多数元素(简单&am…...

【网络安全的神秘世界】渗透测试基础

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 渗透测试基础 基于功能去进行漏洞挖掘 1、编辑器漏洞 1.1 编辑器漏洞介绍 一般企业搭建网站可能采用了通用模板&#xff…...

【重学 MySQL】二十九、函数的理解

【重学 MySQL】二十九、函数的理解 什么是函数不同 DBMS 函数的差异函数名称和参数功能实现数据类型支持性能和优化兼容性和可移植性 MySQL 的内置函数及分类单行函数多行函数(聚合函数)使用注意事项 什么是函数 函数(Function)在…...

MySQL5.7主从复制搭建-gtid方式

环境准备 1、主机名和和IP地址如下 10.0.0.51 db01.ljbb.com 10.0.0.52 db02.ljbb.com 10.0.0.53 db03.ljbb.com2、配置文件 db01 [mysqld] usermysql basedir/app/mysql datadir/data/mysql/data socket/tmp/mysql.sock server_id51 port3306 secure-file-priv/tmp autoco…...

golang学习笔记22——golang微服务中数据竞争问题及解决方案

推荐学习文档 golang应用级os框架,欢迎stargolang应用级os框架使用案例,欢迎star案例:基于golang开发的一款超有个性的旅游计划app经历golang实战大纲golang优秀开发常用开源库汇总想学习更多golang知识,这里有免费的golang学习笔…...

yolo训练出现Could not load library libcudnn_cnn_train.so.8问题及解决方法

问题场景: 训练yolov5或者yolov8时候会报错: Could not load library libcudnn_cnn_train.so.8. Error: /usr/local/cuda-12.1/lib64/libcudnn_cnn_train.so.8: uined symbol: _ZN5cudnn3cnn34layerNormFwd_execute_internal_implERKNS_7backend11Vari…...

携手科大讯飞丨云衔科技为企业提供全栈AI技术解决方案

作为智能时代的核心驱动力,人工智能不仅重塑了传统行业的面貌,更开辟了全新的经济增长点。科大讯飞以其深厚的技术底蕴和创新能力,持续引领着人工智能领域的发展潮流。云衔科技作为科大讯飞开放平台的AI技术产品线合作伙伴代理商,…...

57页PPT | 智慧文旅整体建设解决方案

主要介绍了智慧文旅的建设背景、需求分析、解决方案、应用系统功能需求、客户价值、企业价值、建设理念、建设思路、总体架构、安全管理体系、融媒体综合服务平台、大数据分析平台、智慧文旅云平台、智慧管理、智慧营销、智慧服务等方面的内容。 背景及需求分析 方案架构及理念…...

线性代数之QR分解和SVD分解

文章目录 1.QR分解Schmidt正交化Householder变换QR分解的应用 2. 求矩阵特征值、特征向量的基本方法3.SVD分解SVD分解的应用 参考文献 1.QR分解 矩阵的正交分解又称为QR分解,是将矩阵分解为一个正交矩阵Q和一个上三角矩阵R的乘积的形式。 任意实数方阵A&#xff0c…...

在虚拟机安装mysql数据库

一、安装步骤(下载包-传输软件包-安装包-启用仓库-使用yum安装服务器) 1、要在mysql官网下载yum仓库包 2、下载好rpm包后,将其通过xftp传输到root目录下 3、使用sudo yum install yum的仓库名(sudo yum install mysql-community-…...

详解QT插件机制

Qt插件机制允许将功能模块化为独立的插件,从而在运行时动态加载和卸载这些模块。这种机制对于扩展应用程序、插件架构和动态功能添加非常有用 插件机制 插件的基本概念 插件: 在Qt中,插件是实现特定接口的动态库(DLL或so文件),这些接口由Qt插件框架定义。插件可以被应用程序…...

【Hot100】LeetCode—32. 最长有效括号

目录 1- 思路题目识别动态规划 2- 实现⭐32. 最长有效括号——题解思路 3- ACM 实现 原题链接:32. 最长有效括号 1- 思路 题目识别 识别1 :给定一个字符串 s ,求解 s 中的最长有效括号 动态规划 动态规划五部曲 递推公式难如果遇到了 s.…...

力扣198-打家劫舍

你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存放金额的…...

Python 入门教程(4)数据类型 | 4.1、数据类型

文章目录 一、数据类型1、弱类型与强类型2、变量没有类型,数据有类型3、不可变类型和可变类型 前言: Python 是一种高级编程语言,以其简洁的语法、丰富的内置库和动态类型系统而闻名。在 Python 中,数据类型是编程的基础&#xff…...

如何进行DAP-seq的数据挖掘,筛选验证位点

从样本准备到寄送公司,每一天都在“祈祷”有个心仪的分析结果,终于在这天随着邮件提示音的响起,收到了分析结果...... 分析前工作 爱基在进行数据分析之前,会有两次质控报告反馈给老师们。第一个,基因组DNA的提取质控…...

学习大数据DAY56 业务理解和第一次接入

作业1 1 了解行业名词 ERP CRM OA MES WMS RPA SAAS 了解每个系统的功能和应用 ERP 系统,(Enterprise Resource Planning,企业资源计划系统):ERP 系统 是一种用于管理企业各类资源的软件系统,包括生产管理…...

java线程池编程示例

程序功能 这段代码展示了如何使用 Java 线程池 来并发执行多个任务。通过创建一个固定大小为 3 的线程池,程序提交了 5 个任务,并让线程池中的线程并发处理这些任务。每个任务模拟了一个耗时操作,最后程序等待所有任务完成后关闭线程池。 …...

02 基于STM32的按键控制继电器驱动电机

本专栏所有源资料都免费获取,没有任何隐形消费。 注意事项:STM32仿真会存在各种各样BUG,且尽量按照同样仿真版本使用。本专栏所有的仿真都采用PROTEUS8.15。 本文已经配置好STM32F103C8T6系列,在PROTUES仿真里,32单片…...

网页本地存储

网页本地存储 <html> <script>//添加数据function add(){var text;textdocument.getElementById(text).value;indexlocalStorage.length1;localStorage.setItem(index,text);}//显示localStorage所有内容function showall(){storagelocalStorage;var length stor…...

SpringBoot2:web开发常用功能实现及原理解析-@ControllerAdvice实现全局异常统一处理

文章目录 前言1、工程包结构2、POM依赖3、Java代码 前言 本篇主要针对前后端分离的项目&#xff0c;做的一个统一响应包装、统一异常捕获处理。 在Spring里&#xff0c;我们可以使用ControllerAdvice来声明一些关于controller的全局性的东西&#xff0c;其用法主要有以下三点…...