当前位置: 首页 > news >正文

【汇编】思考汇编中的两个基本问题

1. 若干年前的疑问

几年前还在大学学习汇编时,不管是考试还是课程设计,其实都很顺利。但是心里一直对什么时候使用哪个寄存器存在疑惑,编写汇编时,没有十足的把握,都是抱着试一试的心态去完成了课程任务。

工作八年有余,已走在向linux内核进发的路上。在学习linux内核之前,心里存有一些侥幸,认为汇编可以跳过去。别人封装好,只管使用即可,反正自己又不一定写。在学习过程中,涉及到汇编的部分都是大致看一下设计思路。但是逐渐地,跳过的细节越来越多,导致书慢慢的越来越看不懂了。问题积少成多,窟窿越来越大,量变产生了质变。

汇编中的指令还是挺好理解的,就是一些功能函数,我相信大多数人理解起来问题都不大。

我认为汇编中最大的问题在于寄存器和内存的使用。CPU中寄存器的数量有限,引发了两个问题:

  1. 何时该用哪个寄存器
  2. 哪些数据存在寄存器哪些放在内存

这两个问题一直困扰着我,由于工作中用汇编比较少,所以这个问题一直没有得到深入地思考和解决。今天我们就尝试解决这两个汇编问题。

2. 汇编指令与高级语言中函数的相同点和不同点

我们直入主题,汇编指令与高级语言中函数的相同点是:

  • 汇编指令和函数一样,都是为了完成某个操作的功能单元,他们都有输入和输出,说白了,你可以把汇编指令也看成是一种函数。

不同点是:

  • 单个汇编指令不能嵌套调用,可以组合调用;成对搭配的汇编指令,可以嵌套调用,比如CALL和RET。
  • 单个函数可以嵌套调用,也可以组合调用

3. 单个指令的“独占性原理”

寄存器的个数是很有限的,但是指令确有很多很多,寄存器够用吗?

答案是,对单个指令来说,肯定是够用的。因为单个指令不能嵌套,所以我们可以确定,一个指令在被CPU核执行的时候,是“独占”所有它可以操作的寄存器的,因为此刻一个CPU核中不会有其他指令执行。这样一来,我们可以确定,对一条指令来说,寄存器虽然很少,但肯定是足够的。CPU厂家在设计指令时,不会设计使用超额寄存器数量的指令。

单条指令的“独占性原理”,保证了CPU中即使只有有限数量的寄存器,也能正确执行任何单个指令。

4. 多指令协同与优化

从单个指令执行过程看,单个指令执行有“独占性原理”。

从多个指令执行过程看,寄存器还能够用吗?设想一下,如果前一个指令执行后,有很多重要的数据存在于寄存器中保存,而当前的指令又需要独占寄存器,很有可能会把存在于寄存器中重要的数据给“覆盖”、“破坏”了,从而导致重要数据丢失。这种情形下,程序将无法正确执行。出现这种问题的根本原因还是在于寄存器数量有限,如果寄存器数量很多很多,那么只要合理分配和释放,数据就不会被覆盖。

所以,在多指令角度,因为寄存器数量有限,又出现了新的问题。怎么解决这个问题呢?

通过将下一条指令需要的数据留在寄存器中,将下一条指令不需要的数据放到内存中,这个问题迎刃而解。下一条指令需要的数据,其实就是指令的输入参数。前后指令配合的过程,我起个名字,叫“多指令协同”。

其实把下一条指令的输入参数留下,不需要的数据放入内存,是一种简单粗暴的做法。细想之下,如果寄存器数量还有空余,其实可以多留一些数据在寄存器中,给下下条指令,下n条指令传参,这样可以减少内存的访问,提高执行效率。但是这种预留是不确定的,是动态的,是具体的,必须根据具体的指令,使用的参数个数,返回值个数,进行专门优化。这个过程,我称之为“多指令协同优化”。

在编译高级语言的过程中,编译器会在生成汇编语言时,根据编译参数,自动进行优化。在编译程序时,不同的编译优化等级,优化的算法和力度是不同的。如果考虑上CPU的多级缓存,其实优化过程还是很复杂的。这里我们暂时不做深入研究。

5. 汇编编程套路

工作做到最后,都是套路。套路换一个词,就是经验。如何能够把汇编程序写得又快又好,那就需要学习套路。

我们上面说了,当写多条指令的时候需要注意优化寄存器和内存的使用。这个优化太自由了,你可以这么优化,我可以那么优化,自由的东西一定程度上,是没有标准没有把握的东西。我们平时写代码,如何更多的关注于业务呢?这里讲一种方法。

程序都是由一小块一小块功能模块的代码组成的,汇编也是一样。汇编程序是由很多汇编代码段组成的。这里用代码段来讲,而不是用函数来讲,是因为函数也有可能是由几个代码段组成。所以代码段是比函数更小的代码模块。

有了代码段的概念之后,我们可以把“指令独占性原理”,扩展到代码段,变成“汇编代码段独占性原理”。我们可以认为一个代码段执行过程中,独占所有寄存器,代码段执行完成后,可以通过某几个寄存器向接下来的代码段传递参数,剩下的寄存器,默认将成为空闲寄存器,里面的数据可以被覆盖。如果有的寄存器需要延长生命期,可以把寄存器中的数据保存到内存中,从而将寄存器释放出来。

这样,下一个代码段也将独占所有寄存器。这样就不用时刻担心,这个寄存器能不能用,会不会覆盖已有的数据了。

本质上,这是通过控制作用域与生命期,来调整软件架构的方法,这个方法在编程中很常用。

6. 结论

通过一步步推导“单指令独占性”原理,“多指令协同”,“多指令协同优化”,“汇编编程套路-代码段独占性原理”,可以很好的解答本文开始提出来的疑问。寄存器,内存的使用是有章可循的,大致的原则和方法要心中有数,才能算是对汇编有一定的掌握,编写或者阅读代码时,才能更有信心。

我的学习习惯就是这样,基本的思路逻辑必须先梳理清晰,而不是一头扎进细节里。重要的细节,我在后面的文章中会进行专门探讨。

相关文章:

【汇编】思考汇编中的两个基本问题

1. 若干年前的疑问 几年前还在大学学习汇编时,不管是考试还是课程设计,其实都很顺利。但是心里一直对什么时候使用哪个寄存器存在疑惑,编写汇编时,没有十足的把握,都是抱着试一试的心态去完成了课程任务。 工作八年有…...

Nest Dynamic modules 笔记

Nest Dynamic modules 文档地址👈 记录Dynamic modules是因为确实抽象,文档并没有很详细的指出不同方式创建动态模块的区别 两种不同的动态模块创建方式 静态模块传统动态模块方式实现三种不同的方法命名使用ConfigurableModuleBuilder异步动态模块如果…...

生成式AI、大模型、多模态技术开发与应用学习清单

学习目的: 了解AIGC发展现状与核心技术。 掌握Transformer核心开发技术。掌握向量数据库的工作原理、检索算法、主要开源数据库。掌握大模型调用、微调方法。掌握以GPT大语言模型为基础的工作原理。 掌握AIGC技术在跨模态领域的应用技术。了解GPT提示工程和AIGC的安…...

STM32 CubeMx HAL库 独立看门狗IWDG配置使用

看门狗这里我就不多介绍了,能搜到这篇文章说明你了解 总之就是一个单片机重启程序,设定好超时时间,在超时时间内没有喂狗,单片机就会复位 主要应用在单片机异常重启方面,比如程序跑飞(注意程序跑飞时你就…...

网络安全渗透测试概论

渗透测试,也称为渗透攻击测试是一种通过模拟恶意攻击者的手段来评估计算机系统、网络或应用程序安全性的方法。 目的 旨在主动发现系统中可能存在的安全漏洞、脆弱点以及潜在风险,以便在被真正的恶意攻击者利用之前,及时进行修复和加固&…...

【大数据技术基础】【记录Ubuntu 16.04升级到18.04】Ubuntu的一个版本升级到另一个版本

在 Ubuntu 操作系统中进行软件更新和系统升级 Ubuntu Kylin 16.04 LTS 系统进行系统升级到 Ubuntu 18.04.6 LTS 版本 升级提示:系统弹出提示框,告知用户有新版本的 Ubuntu 可用,询问用户是否想要升级。 认证窗口:显示了一个认证…...

知识库系统,集成neo4j,集成activiti工作流,集成es全文检索,知识图谱血缘关系,nlp知识库

一、项目介绍 一款全源码,可二开,可基于云部署、私有部署的企业级知识库云平台,一款让企业知识变为实打实的数字财富的系统,应用在需要进行文档整理、分类、归集、检索、分析的场景。 为什么建立知识库平台? 助力企业…...

批量合并多个Excel到一个文件

工作中,我们经常需要将多个Excel的数据进行合并,很多插件都可以做这个功能。但是今天我们将介绍一个完全免费的独立软件【非插件】,来更加方便的实现这个功能。 准备Excel 这里我们准备了两张待合并的Excel文件 的卢易表 打开的卢易表软件…...

CNCF云原生生态版图-项目和产品综合分析

CNCF云原生生态版图-项目和产品综合分析 CNCF云原生生态版图-项目和产品综合分析整体统计分析中国研发人员贡献项目和产品其中,纳入 CNCF 管理的开源项目 链接 CNCF云原生生态版图-项目和产品综合分析 整体统计分析 在对云原生技术选型时,优先选择经过 …...

MySQL生产环境备份脚本

全量备份脚本,其中BakDir,ZlbakDir,LogFile需要自己创建 #!/bin/bash export LANGen_US.UTF-8# 指定备份目录 BakDir/root/beifen/data/mysqlbak/data/allbak # 指定增量备份目录 ZlbakDir/root/beifen/data/mysqlbak/data/zlbak # 备份日志…...

leetcode 3224. 使差值相等的最少数组改动次数

题目链接:3224. 使差值相等的最少数组改动次数 题目: 给你一个长度为 n 的整数数组 nums ,n 是偶数 ,同时给你一个整数 k 。 你可以对数组进行一些操作。每次操作中,你可以将数组中任一元素替换为 0 到 k 之间的任一…...

多线程动态库里面调用静态库分配内存函数导致的崩溃cltp汇编指令导致

1、概述 有这样的一个场景,我有一个动态库myso.so里面有函数start_crash(),用到静态库的内存分配函数,其实静态库里面的static.a 里面就封装了一个函数叫system_malloc(),函数返回的是分配的内存地址,然后发现,我在测试demo里面创…...

力扣刷题TOP101: 31.BM38 在二叉树中找到两个节点的最近公共祖先

目录: 目的 思路 复杂度 记忆秘诀 python代码 目的: 给定一棵二叉树(保证非空)以及这棵树上的两个节点对应的val值 o1 和 o2,请找o1 和 o2 的最近公共祖先节点。 思路 这个任务目和上一题在二叉搜索树中找到两个节点的最近公共祖先有点类…...

前端项目打包部署

打包和部署前端项目是将开发环境中的代码转化为生产环境可直接运行的静态文件,并将其部署到服务器上的过程。 # 项目打包 pnpm run build# 上传文件至远程服务器 将本地打包生成的 dist 目录下的所有文件拷贝至服务器的 /usr/share/nginx/html 目录。# nginx.cofig…...

《CSS 知识点》大屏卡片布局思路:弹性布局 flex-grow

思路 大屏左右两侧高宽一致,内部卡片可按比例设置! 使用弹性布局和属性 flex-grow 设置比例;间隔使用 margin-bottom 设置,最后一个卡片不设置; 效果如图 代码说明 CSS代码 26 - 30,左右两侧设置弹性布…...

nVisual 登录页页面配置说明

一、概述 nVisual登录页面可根据具体客户需要通过public\config\access.js文件进行自定义配置。页面可以大致分为4个部分,头部、底部、可移动区域以及页面中间的信息填写区域。其中头部和底部又包含头部左侧、头部中间、头部右侧、底部左侧、底部中间、底部右侧六个…...

后端接受前端传递数组进行批量删除

问题描述:当我们需要做批量删除功能的时候,我们循环单次删除的接口也能进行批量删除,但要删除100条数据就要调用100次接口,或者执行100次sql,这样系统开销是比较大的,那么我们直接采用接收的数组格式数据sq…...

拍频实例 - 一组恒力矩电流采样数据

这是一组功率电机的感应电流波形。加载了重载恒力矩设备。你能看到什么? 首先,时间轴的坐标是对的,9.9~10.0秒,单位是秒,100ms有5个波形,所以是20ms一个波形。这是50Hz的信号。频差就体现为幅度的周期起伏…...

Jvm之NativeMemoryTracking 使用

开启 Native Memory Tracking 通过 -XX:NativeMemoryTracking 开启: -XX:NativeMemoryTrackingoff:这是默认值,即关闭 Native Memory Tracking -XX:NativeMemoryTrackingsummary: 开启 Native Memory Tracking,但是仅仅按照各个 JVM 子系统…...

PKCS#7、Bit padding(位填充)、Byte padding(字节填充)、Zero padding(零填充)

PKCS#7、Bit padding(位填充)、Byte padding(字节填充)、Zero padding(零填充)是密码学常见的填充方式。 Bit padding(位填充): 位填充可以应用于任意长度的消息。在消息…...

免费获取网络资源

我理解您想寻找免费获取网络资源的方法,但需要明确告知:没有任何合法网站能将所有收费内容变为免费,因为这会侵犯版权。不过,有很多合法途径可以免费获取大量优质资源,以下是几种推荐方案: 1. 公共图书馆数…...

SEO_本地商家必备的SEO实战方法

SEO对本地商家的重要性 在当今数字化时代,为了在竞争激烈的市场中脱颖而出,本地商家必须掌握一些SEO(搜索引擎优化)技巧。SEO不仅可以提升网站的搜索引擎排名,还能够有效地吸引更多的本地客户。本文将详细探讨本地商家…...

MusePublic画质增强教程:后处理超分+色彩分级提升艺术表现力

MusePublic画质增强教程:后处理超分色彩分级提升艺术表现力 1. 项目简介 MusePublic是一款专门为艺术感时尚人像创作设计的轻量化文本生成图像系统。这个项目的核心基于MusePublic专属大模型,采用安全高效的safetensors格式封装,特别针对艺…...

14 - SVM的用户态API接口

难度: 🟡🔴 中级 预计学习时间: 2小时 前置知识: 第4章(核心数据结构)、第6章(范围管理) 📋 概述 SVM(Shared Virtual Memory)的用户态接口是上层框架(ROCm runtime、HSA runtime)与内核驱动之间的唯一公开契约。整个SVM用户态API只有一个IOCTL命令 AMDKFD_IOC_…...

算法——bfs/dfs

Find The Multiple 给定一个正整数 n,编写一个程序找出 n 的一个非零倍数 m,其十进制表示只包含数字 0 和 1。可以假设 n 不大于 200,并且存在一个 m,其十进制表示不超过 100 位。 输入 输入文件可能包含多个测试用例。每一行包含…...

Simulink电力电子主电路设计指南:从基础模块到桥臂搭建

1. Simulink电力电子主电路设计入门 第一次接触Simulink做电力电子设计时,我被它丰富的模块库震撼到了。作为一个从硬件电路转战仿真的工程师,我发现用Simulink搭建主电路比实际焊接电路板方便太多。比如设计一个简单的AC-DC转换器,在实验室可…...

Paimon数据湖避坑指南:sink-upsert配置与三种Merge Engine选型对比

Paimon数据湖实战:Merge Engine选型与sink-upsert优化全解析 当订单数据以每秒万条的速率涌入系统时,我们团队曾因错误配置导致下游报表出现诡异的"订单复活"现象——已取消的订单反复出现在统计结果中。这次事故让我们深刻认识到,…...

改进无人机三维路径规划(蜣螂优化算法)Matlab程序

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。👇 关注我领取海量matlab电子书和数学建模资料🍊个人信条:格物致知,完整Matl…...

SIGMOD 2024论文解读:5篇向量检索新研究,从混合查询到Serverless数据库的实战启示

SIGMOD 2024向量检索技术实战指南:从混合查询到Serverless架构的工程化思考 当我们在构建下一代智能应用时,向量检索技术已经从实验室走向了生产环境的核心位置。今年SIGMOD会议上发布的几篇重量级论文,为这个快速发展的领域注入了新的活力。…...

私有化视频会议系统/私有化视频会议解决方案EasyDSS技术架构解析与应用实践

在数字化转型的浪潮中,视频会议已成为政企日常协作的核心纽带,但公有云会议平台的数据安全隐患、合规性短板,始终是政务、金融、军工等涉密领域的心头之患。EasyDSS私有化视频会议系统,以数据自主可控为核心,融合全场景…...