网络工程师 (3)指令系统基础
一、寻址方式
(一)指令寻址
顺序寻址:通过程序计数器(PC)加1,自动形成下一条指令的地址。这是计算机中最基本、最常用的寻址方式。
跳跃寻址:通过转移类指令直接或间接给出下一条指令的地址。跳跃寻址的转移地址形成方式有直接(绝对)、相对和间接寻址三种,用于实现程序的分支和循环。
(二)数据寻址
隐含寻址:操作数地址不明显的给出,隐藏在指令中。这种寻址方式简化了指令的格式,但降低了指令的灵活性。
立即寻址:指令中直接给出操作数的值,而不是操作数的地址。这种寻址方式获取操作数最快,因为不需要访问内存。例如,
MOV AX,#40H,这条指令将立即数40H传送给通用寄存器AX。直接寻址:指令中直接给出操作数的地址。例如,
MOV A,40H,这条指令将内部RAM中40H地址的内容传送给累加器A。直接寻址方式简单明了,但寻址范围受限。间接寻址:指令中给出的地址不是操作数的地址,而是存放操作数地址的内存单元的地址。间接寻址方式可以扩大寻址范围,但增加了访问内存的次数,降低了指令的执行速度。间接寻址有一级寻址和多级间接寻址之分,多级间接寻址需要多次访问内存才能得到操作数。
寄存器寻址:指令中直接给出操作数所在的寄存器的编号。寄存器寻址方式访问速度快,因为寄存器通常位于CPU内部,但寄存器数量有限,寻址范围受限。
寄存器间接寻址:指令中的地址码给出某一通用寄存器的编号,该寄存器中存放的是操作数的有效地址。例如,
MOV A,@Ri(i=0或1),这条指令先寻址Ri寄存器,得到其中内容为操作数的地址,再访问该地址得到操作数。寄存器间接寻址方式结合了寄存器寻址和间接寻址的优点,既提高了访问速度,又扩大了寻址范围。相对寻址:将程序计数器(PC)的内容加上指令格式中的形式地址,形成操作数的有效地址。相对寻址方式使得操作数的地址随着指令地址的变化而变化,但两者之间总是相差一个固定值,这对于实现程序的分支和循环非常有用。
基址寻址:将基址寄存器的内容加上指令格式中的位移量,形成操作数的有效地址。基址寻址方式通常用于将用户的逻辑地址转换为主存的物理地址,解决程序在主存中的定位问题。
变址寻址:将变址寄存器的内容与指令中给出的形式地址相加,形成操作数的有效地址。变址寻址方式最典型的用法是将指令中的形式地址作为基准地址,而变址寄存器的内容作为修改量,用于访问字符串、向量和数组等成批数据。
堆栈寻址:从规定的堆栈中取出操作数。堆栈是一种特殊的数据结构,遵循后进先出的原则,堆栈寻址方式通常用于实现子程序的调用和返回。
二、指令系统类型
(一)按指令集长度分类
复杂指令系统(CISC)
- 特点:指令长度可变,包含大量复杂的指令,指令格式和寻址方式多样化。
- 优点:功能丰富,能够直接执行高级语言的某些操作,减少编译器的复杂性。
- 缺点:指令复杂度高,执行时间长,功耗大,且大量复杂指令在实际中很少被使用,造成硬件资源的浪费。
- 代表:x86指令集。
精简指令系统(RISC)
- 特点:指令长度固定,指令格式简单,采用流水线技术,指令数量较少但每条指令的功能相对简单。
- 优点:指令执行速度快,功耗低,易于实现高速缓存和流水线技术,适合用于高性能计算机和嵌入式系统。
- 缺点:需要更多的指令来完成相同的任务,编译器和汇编语言的设计相对复杂。
- 代表:MIPS、ARM、LoongArch等。
超长指令系统(VLIW)
- 特点:本质是多条同时执行指令的组合,每条指令可以包含多个操作,指令长度非常长。
- 优点:能够充分利用处理器的并行处理能力,提高指令的执行效率。
- 缺点:编译器的设计非常复杂,需要精确地预测哪些指令可以并行执行,且对处理器的硬件设计有较高要求。
- 应用:主要在一些高性能计算领域和特定应用中使用。
(二)按指令操作的数据类型分类
堆栈型指令
- 特点:操作数都在栈顶,通过压栈和出栈操作进行数据的存取和运算。
- 优点:指令格式简单,易于实现,适合用于解释性语言和某些嵌入式系统。
- 缺点:运算速度相对较慢,因为需要频繁地进行栈操作。
累加器型指令
- 特点:一个隐含操作数是累加器,另一个操作数在指令中指定,结果写回到累加器中。
- 优点:简化了指令格式,减少了内存访问次数。
- 缺点:累加器的使用限制了指令的并行性,且不适用于所有类型的运算。
寄存器型指令
- 特点:操作数都来自寄存器,结果也存于寄存器中。寄存器型指令包括寄存器-存储器型和寄存器-寄存器型两种。
- 优点:访问速度快,因为寄存器通常位于CPU内部,且能够充分利用处理器的并行处理能力。
- 缺点:寄存器数量有限,寻址范围受限,需要编译器进行复杂的寄存器分配和优化。
(三)按指令的功能分类
数据传送类指令
功能:实现数据在不同存储单元之间的传送,包括主存单元之间、主存和寄存器之间、寄存器和寄存器之间的数据传送。算术/逻辑运算类指令
功能:完成定点/浮点数的四则运算、求补等运算,以及逻辑运算、移位操作等。程序控制类指令
功能:改变程序的执行顺序,包括条件转移、无条件转移、循环控制等。输入输出类指令
功能:实现外设和主机之间、外围设备之间的信息交换。其他指令
功能:包括字符串处理指令、特权指令、程序状态字寄存器置位复位指令、测试指令、暂停指令等。这些指令用于实现特定的功能或满足特定的需求。

三、Flynn分类
(一)基本概念
指令流:指计算机在执行程序时,指令序列的流动。
数据流:指计算机在执行指令时,所需数据的流动。
(二)四种基本架构类型
单指令流单数据流(SISD, Single Instruction Single Data Stream)
- 特点:传统的顺序处理计算机,其指令部件一次仅对一条指令进行译码,并仅对一个操作部件分配数据。
- 示例:早期的个人计算机,如386、486等,以及某些单片机系统。
- 应用:适用于简单的顺序执行任务,如基本的算术和逻辑运算。
单指令流多数据流(SIMD, Single Instruction Multiple Data Stream)
- 特点:包含多个重复的运算处理单元,但仅存在唯一的指令部件。指令部件从存储器中取出指令,译码后发往所有运算处理单元,各运算处理单元按照同一指令流的要求处理各自不同的数据。
- 优点:能够高效处理大量相同类型的数据,实现空间上的并行性。
- 示例:图形处理器(GPU)、Intel的MMX或SSE指令集、AMD的3D Now!指令集。
- 应用:适用于多媒体处理、图像处理、科学计算等领域。
多指令流单数据流(MISD, Multiple Instruction Stream Single Data Stream)
- 特点:多个指令流处理单个数据流。然而,这种架构在实际应用中很少见,因为它并不高效。理论上,每个指令流可能对数据流执行不同的操作,但在实践中,很难找到一个实际的应用场景,其中这种处理方式会比单指令流或多指令流多数据流更有优势。
- 现状:主要作为理论模型存在,没有投入到实际应用之中。
多指令流多数据流(MIMD, Multiple Instruction Stream Multiple Data Stream)
- 特点:实现作业、任务、指令、数据各个级别全面并行执行的计算机系统。拥有多个处理机,每个处理机具有独立的程序,每个程序为相应的处理器生成一个指令流,并处理各自不同的数据。
- 优点:能够充分利用处理器的并行处理能力,提高系统的整体性能。
- 示例:高性能服务器、超级计算机、分布式计算机系统。
- 应用:适用于大规模数据处理、高性能计算、云计算等领域。
(三)意义与应用
Flynn分类法不仅有助于理解不同计算机架构的并行性特点和处理方式,还为计算机系统的设计和优化提供了指导。例如,在开发高性能计算机或嵌入式系统时,可以根据具体的应用需求选择合适的架构类型。同时,Flynn分类法也为计算机体系结构的研究和发展提供了重要的理论基础。
四、流水线技术
(一)基本原理
流水线技术的基本原理是将一个重复的过程分解为若干个子过程,这些子过程在时间上重叠进行,前一个子过程为下一个子过程创造执行条件。在计算机系统中,流水线技术被用来优化指令的执行过程,将一条复杂的指令分解为多个简单的子任务,并由不同的功能部件并行处理,从而提高整体执行效率。
(二)分类
按处理级别分类:
- 部件级流水线:在处理较为复杂的运算时采用。
- 指令级流水线:将一条指令的执行过程分为多个阶段,如取指令、译码、执行、写回结果等。
- 处理器间级流水线:每个处理器完成其专门的任务。
按功能分类:
- 单功能流水线:只完成一种功能,如乘法或浮点运算等,多用于数字信号处理器(DSP)。
- 多功能流水线:在不同情况下可完成不同功能。
按连接方式分类:
- 静态流水线:同一时间内,多功能结构只能按一种功能的连接方式工作。
- 动态流水线:同一时间内,可以有多种功能的连接方式同时工作。
按处理对象分类:
- 标量流水线:处理一般数据。
- 向量流水线:处理矢量数据。
按流水线形状分类:
- 线性流水线:指各功能模块顺序串行连接,无反馈回路。
- 非线性流水线:带有反馈回路的流水线。
(三)关键步骤与实现方式
以经典的奔腾处理器为例,其整数流水线通常分为四级:指令预取、译码、执行和写回结果。每一级都对应一个专门的功能部件,负责完成相应的子任务。当第一条指令在执行某一阶段时,第二条指令可以同时进入流水线的下一个阶段,以此类推,实现了指令的并行处理。
流水线技术主要通过硬件电路来实现。在CPU中,通过设计多个并行工作的功能部件和相应的控制逻辑,来支持指令的并行处理。此外,软件层面的优化也是实现流水线技术的重要手段。编译器可以通过重新组织代码、优化指令序列等方式,来减少指令间的依赖关系,提高流水线的效率。
(四)性能指标
- 吞吐率:指的是计算机中的流水线在特定的时间内可以处理的任务或输出数据的结果的数量。流水线的吞吐率可以进一步分为最大吞吐率和实际吞吐率,它们主要和流水段的处理时间、缓存寄存器的延迟时间有关。
- 效率:表示流水线的设备利用率。在时空图上,流水线的效率定义为有效时间与总时间之比。
- 加速比:用S表示,若一个任务在单功能部件上顺序执行需n个时间单位,在m段流水线上执行需(m+n-1)个时间单位,则流水线对该任务的加速比为S=n/(m+n-1)。
(五)优势与挑战
- 提高执行速度:通过并行处理多条指令的不同阶段,流水线技术显著提高了计算机的执行速度。
- 资源利用率高:各个功能部件在同一时间内可以处理不同的指令子任务,从而提高了硬件资源的利用率。
- 简化设计复杂度:将复杂的指令分解为简单的子任务,有助于简化计算机体系结构的设计和实现。
然而,流水线技术也面临着一些挑战,如资源冲突、数据冒险等问题。为了解决这些问题,设计者们采取了多种措施,如增加缓存、优化指令调度等,以确保流水线的顺畅运行。
(六)应用与影响
流水线技术在现代计算机系统中得到了广泛应用,从个人电脑到大型服务器,从嵌入式系统到云计算平台,都可以看到流水线技术的身影。它显著提高了CPU的运算速度,使得计算机能够更快地处理数据。此外,流水线技术还促进了计算机硬件和软件的发展,为计算机性能的不断提升提供了有力支持。
结语
人生路上步步未知
正是这些铸就精彩
!!!

相关文章:
网络工程师 (3)指令系统基础
一、寻址方式 (一)指令寻址 顺序寻址:通过程序计数器(PC)加1,自动形成下一条指令的地址。这是计算机中最基本、最常用的寻址方式。 跳跃寻址:通过转移类指令直接或间接给出下一条指令的地址。跳…...
第4章 神经网络【1】——损失函数
4.1.从数据中学习 实际的神经网络中,参数的数量成千上万,因此,需要由数据自动决定权重参数的值。 4.1.1.数据驱动 数据是机器学习的核心。 我们的目标是要提取出特征量,特征量指的是从输入数据/图像中提取出的本质的数 …...
【Python】第五弹---深入理解函数:从基础到进阶的全面解析
✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】【MySQL】【Python】 目录 1、函数 1.1、函数是什么 1.2、语法格式 1.3、函数参数 1.4、函数返回值 1.5、变量作用域 1.6、函数…...
【MQ】如何保证消息队列的高性能?
零拷贝 Kafka 使用到了 mmap 和 sendfile 的方式来实现零拷贝。分别对应 Java 的 MappedByteBuffer 和 FileChannel.transferTo 顺序写磁盘 Kafka 采用顺序写文件的方式来提高磁盘写入性能。顺序写文件,基本减少了磁盘寻道和旋转的次数完成一次磁盘 IO࿰…...
RAG是否被取代(缓存增强生成-CAG)吗?
引言: 本文深入研究一种名为缓存增强生成(CAG)的新技术如何工作并减少/消除检索增强生成(RAG)弱点和瓶颈。 LLMs 可以根据输入给他的信息给出对应的输出,但是这样的工作方式很快就不能满足应用的需要: 因…...
用C++编写一个2048的小游戏
以下是一个简单的2048游戏的实现。这个实现使用了控制台输入和输出,适合在终端或命令行环境中运行。 2048游戏的实现 1.游戏逻辑 2048游戏的核心逻辑包括: • 初始化一个4x4的网格。 • 随机生成2或4。 • 处理玩家的移动操作(上、下、左、…...
为何SAP S4系统中要设置MRP区域?MD04中可否同时显示工厂级、库存地点级的数据?
【SAP系统PP模块研究】 一、物料主数据的MRP区域设置 SAP ECC系统中想要指定不影响MRP运算的库存地点,是针对库存地点设置MRP标识,路径为:SPRO->生产->物料需求计划->计划->定义每一个工厂的存储地点MRP,如下图所示: 另外,在给物料主数据MMSC扩充库存地点时…...
Windows10官方系统下载与安装保姆级教程【U盘-官方ISO直装】
Windows 10 官方系统安装/重装 制作启动盘的U盘微软官网下载Win10安装包创建启动盘U盘 安装Win10 本文采用U盘安装Windows10官方系统。 制作启动盘的U盘 微软官网下载Win10安装包 微软官网下载Win10安装包链接:https://www.microsoft.com/zh-cn/software-downloa…...
第05章 07 切片图等值线代码一则
绘制脑部切面图的阈值等值线是一个常见的任务,通常涉及使用VTK(Visualization Toolkit)库来处理医学图像数据。以下是一个基于VTK/C的示例代码,展示如何读取脑部DICOM图像数据,应用阈值过滤器来提取特定组织的等值线&a…...
【深度学习】线性回归的简洁实现
线性回归的简洁实现 在过去的几年里,出于对深度学习强烈的兴趣,许多公司、学者和业余爱好者开发了各种成熟的开源框架。 这些框架可以自动化基于梯度的学习算法中重复性的工作。 目前,我们只会运用: (1)通…...
渗透测试技法之口令安全
一、口令安全威胁 口令泄露途径 代码与文件存储不当:在软件开发和系统维护过程中,开发者可能会将口令以明文形式存储在代码文件、配置文件或注释中。例如,在开源代码托管平台 GitHub 上,一些开发者由于疏忽,将包含数据…...
【R语言】数学运算
一、基础运算 R语言中能实现加、减、乘、除、求模、取整、取绝对值、指数、对数等运算。 x <- 2 y <- 10 # 求模 y %% x # 整除 y %/% x # 取绝对值 abs(-x) # 指数运算 y ^x y^1/x #对数运算 log(x) #log()函数默认情况下以 e 为底 双等号“”的作用等同于identical(…...
小游戏源码开发搭建技术栈和服务器配置流程
近些年各种场景小游戏开发搭建版本层出不穷,山东布谷科技拥有多年海内外小游戏源码开发经验,现为从事小游戏源码开发或游戏运营的朋友们详细介绍小游戏开发及服务器配置流程。 一、可以对接到app的小游戏是如何开发的 1、小游戏源码开发的需求分析: 明…...
深度学习|表示学习|卷积神经网络|输出维度公式|15
如是我闻: 在卷积和池化操作中,计算输出维度的公式是关键,它们分别可以帮助我们计算卷积操作和池化操作后的输出大小。下面分别总结公式,并结合解释它们的意义: 1. 卷积操作的输出维度公式 当我们对输入图像进行卷积时…...
cpp智能指针
普通指针的不足 new和new[]的内存需要用delete和deletel]释放。 程序员的主观失误,忘了或漏了释放。 程序员也不确定何时释放。 普通指针的释放 类内的指针,在析构函数中释放。 C内置数据类型,如何释放? new出来的类,本身如…...
【面试题】 Java 三年工作经验(2025)
问题列表 为什么选择 spring boot 框架,它与 Spring 有什么区别?spring mvc 的执行流程是什么?如何实现 spring 的 IOC 过程,会用到什么技术?spring boot 的自动化配置的原理是什么?如何理解 spring boot 中…...
MOS的体二极管能通多大电流
第一个问题:MOS导通之后电流方向可以使任意的,既可以从D到S,也可以从S到D。 第二个问题:MOS里面的体二极管电流可以达到几百安培,这也就解释了MOS选型的时候很少考虑体二极管的最大电流,而是考虑DS之间电流…...
Node.js下载安装及环境配置教程 (详细版)
Node.js:是一个基于 Chrome V8 引擎的 JavaScript 运行时,用于构建可扩展的网络应用程序。Node.js 使用事件驱动、非阻塞 I/O 模型,使其非常适合构建实时应用程序。 Node.js 提供了一种轻量、高效、可扩展的方式来构建网络应用程序࿰…...
嵌入式MCU面试笔记2
目录 串口通信 概论 原理 配置 HAL库代码 1. 初始化函数 2. 数据发送和接收函数 3. 中断和DMA函数 4. 中断服务函数 串口通信 概论 我们知道,通信桥接了两个设备之间的交流。一个经典的例子就是使用串口通信交换上位机和单片机之间的数据。 比较常见的串…...
代码随想录算法【Day34】
Day34 62.不同路径 思路 第一种:深搜 -> 超时 第二种:动态规划 第三种:数论 动态规划代码如下: class Solution { public:int uniquePaths(int m, int n) {vector<vector<int>> dp(m, vector<int>(n,…...
使用VSCode开发Django指南
使用VSCode开发Django指南 一、概述 Django 是一个高级 Python 框架,专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。 本文将创建一个简单的 Django 应用,其中包含三个使用通用基本模板的页面。在此…...
【磁盘】每天掌握一个Linux命令 - iostat
目录 【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景 注意事项 【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat(I/O Statistics)是Linux系统下用于监视系统输入输出设备和CPU使…...
学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1
每日一言 生活的美好,总是藏在那些你咬牙坚持的日子里。 硬件:OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写,"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...
NLP学习路线图(二十三):长短期记忆网络(LSTM)
在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...
CRMEB 框架中 PHP 上传扩展开发:涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云
目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展 扩展入口文件 文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...
RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文全面剖析RNN核心原理,深入讲解梯度消失/爆炸问题,并通过LSTM/GRU结构实现解决方案,提供时间序列预测和文本生成…...
如何在网页里填写 PDF 表格?
有时候,你可能希望用户能在你的网站上填写 PDF 表单。然而,这件事并不简单,因为 PDF 并不是一种原生的网页格式。虽然浏览器可以显示 PDF 文件,但原生并不支持编辑或填写它们。更糟的是,如果你想收集表单数据ÿ…...
LangFlow技术架构分析
🔧 LangFlow 的可视化技术栈 前端节点编辑器 底层框架:基于 (一个现代化的 React 节点绘图库) 功能: 拖拽式构建 LangGraph 状态机 实时连线定义节点依赖关系 可视化调试循环和分支逻辑 与 LangGraph 的深…...
MyBatis中关于缓存的理解
MyBatis缓存 MyBatis系统当中默认定义两级缓存:一级缓存、二级缓存 默认情况下,只有一级缓存开启(sqlSession级别的缓存)二级缓存需要手动开启配置,需要局域namespace级别的缓存 一级缓存(本地缓存&#…...
华为OD最新机试真题-数组组成的最小数字-OD统一考试(B卷)
题目描述 给定一个整型数组,请从该数组中选择3个元素 组成最小数字并输出 (如果数组长度小于3,则选择数组中所有元素来组成最小数字)。 输入描述 行用半角逗号分割的字符串记录的整型数组,0<数组长度<= 100,0<整数的取值范围<= 10000。 输出描述 由3个元素组成…...
