当前位置：首页 > news >正文

实现8086虚拟机（四）——mov 和 jmp 指令解码

news 2026/2/9 1:45:27

文章目录

- mov 指令解码
- jmp 指令解码

这篇文章举例来讲讲 mov 指令和 jmp 指令解码函数的实现，其他的指令解码函数都与这些类似。

mov 指令解码

以 mov 指令中的一类：寄存器/内存到/从寄存器，来详细说明解码函数的实现。

机器指令格式如下：
在这里插入图片描述
各字段的含义如下：

w 1 bit  w=0表示数据宽度是字节，w=1表示数据宽度是字
d 1 bit   d=0表示reg是源操作数，d=1表示reg是目的操作数
reg 3 bitsREG W=0 W=1000 AL AX001 CL CX010 DL DX011 BL BX100 AH SP101 CH BP110 DH SI111 BH Dl
mod 2 bits00 MemoryMode,nodisplacement follows01 MemoryMode,8-bit displacementfollows10 MemoryMode,16-bit displacementfollows11 RegisterMode(no displacement)
rm 3 bitsMOD=11              EFFECTIVE ADDRESS CALCULATIONR/M w=0 w=1   R/M  MOD=00        MOD=01          MOD=10000 AL AX     000 (BX)+(SI)     (BX)+(SI)+D8    (BX)+(SI)+D16001 CL CX     001 (BX)+(DI)     (BX)+(DI)+D8    (BX)+(DI)+D16010 DL DX     010 (BP)+(SI)     (BP)+(SI)+D8    (BP)+(SI)+D16011 BL BX     011 (BP)+(DI)     (BP)+(DI)+D8    (BP)+(DI)+D16100 AH SP     100 (SI)          (SI)+D8         (SI)+D16101 CH BP     101 (DI)          (DI)+D8         (DI)+D16110 DH SI     110 DIRECTADDRESS (BP)+D8         (BP)+D16111 BH DI     111 (BX)          (BX)+D8         (BX)+D16

解码函数 decodeMovRegOrMemoryToFromReg 的目的就是将它转换为如下形式的中间指令格式：

指令类型，指令详细类型，[源操作数]，[目的操作数]

decodeMovRegOrMemoryToFromReg 函数首先检测输入的机器指令的长度：

func decodeMovRegOrMemoryToFromReg(instructions []byte) []byte {/* 0b100010dw,mod reg r/m, (DISP-LO ), (DiSP-HI)*/decodegth := len(instructions)if decodegth < 2 {return nil}dispLen := lenDisplacement(instructions[1])if decodegth < 2+dispLen {return nil}....
}

由上文机器指令格式可知，这个指令至少有 2 字节长。如果长度达到 2 字节，再调用 lenDisplacement 获取偏移量的长度。如果指令长度达不到指令格式的要求，说明不是一条完整的指令，那就返回 nil。

lenDisplacement 的实现如下：

/* mod xxx r/m, (DISP-LO ), (DiSP-HI) */
func lenDisplacement(secondByte byte) int {mod := (secondByte & 0b11000000) >> 6rm := secondByte & 0b111if mod == 0b11 {return 0}if mod == 0b00 { /* mov bx, [1]*/if rm == 0b110 {return 2}return 0}if mod == 0b01 {return 1}return 2
}

就是根据 mod 和 rm 字段的含义返回偏移量的长度。

然后就是根据 d、w、mod、rm、reg 字段的含义，确定指令详细类型和操作数，将中间形式的指令格式返回：

	decodedInstructions := []byte{InstructionMov}// return 2 + dispLend := (instructions[0] & 0b10) >> 1w := instructions[0] & 0b1mod := (instructions[1] & 0b11000000) >> 6reg := (instructions[1] & 0b111000) >> 3rm := instructions[1] & 0b111switch mod {case 0b11: //RegisterMode(no displacement)if w == 0 {decodedInstructions = append(decodedInstructions, MovReg8ToReg8)} else {decodedInstructions = append(decodedInstructions, MovReg16ToReg16)}if d == 0 { //reg是源操作数decodedInstructions = append(decodedInstructions, reg)decodedInstructions = append(decodedInstructions, rm)} else {decodedInstructions = append(decodedInstructions, rm)decodedInstructions = append(decodedInstructions, reg)}default:if d == 0 {if w == 0 {decodedInstructions = append(decodedInstructions, MovReg8ToMemory)} else {decodedInstructions = append(decodedInstructions, MovReg16ToMemory)}decodedInstructions = append(decodedInstructions, reg)decodedInstructions = append(decodedInstructions,decodeMemoryOperand(mod, rm, instructions[2:])...)} else {if w == 0 {decodedInstructions = append(decodedInstructions, MovMemoryToReg8)} else {decodedInstructions = append(decodedInstructions, MovMemoryToReg16)}decodedInstructions = append(decodedInstructions,decodeMemoryOperand(mod, rm, instructions[2:])...)decodedInstructions = append(decodedInstructions, reg)}}return decodedInstructions

比如，当 mod 字段为 0b11 时，表示两个操作数都是寄存器，如果 d 为 0，那么 reg 字段就是源操作数，rm 字段就是目的操作数。如果 w 为1，那么操作数的宽度就是16位。这时候生成的中间指令格式为：

InstructionMov，MovReg16ToReg16 ，reg ， rm

如果 reg 的值是 0，rm 的值是 1，这条指令的源汇编指令就是：

mov ax，cx

就是这么简单。

再看下解码 mov 立即数到内存/寄存器解码函数 decodeMovImmediateToRegOrMemory 的实现：

func decodeMovImmediateToRegOrMemory(instructions []byte) []byte {/*1100011w, mod 000 rm, [disp-lo] [disp-hi] data [data]*/decodegth := len(instructions)if decodegth < 2 {return nil}w := instructions[0] & 0x1dispLen := lenDisplacement(instructions[1])dataLen := 1if w == 1 {dataLen = 2}if decodegth < 2+dispLen+dataLen {return nil}decodedInstructions := []byte{InstructionMov}mod := (instructions[1] & 0b11000000) >> 6rm := instructions[1] & 0b111if w == 0 {if mod == 0b11 {decodedInstructions = append(decodedInstructions, MovImmediateToReg8)decodedInstructions = append(decodedInstructions, instructions[2])decodedInstructions = append(decodedInstructions, rm)} else {decodedInstructions = append(decodedInstructions, MovImmediate8ToMemory)decodedInstructions = append(decodedInstructions, instructions[decodegth-1])decodedInstructions = append(decodedInstructions,decodeMemoryOperand(mod, rm, instructions[2:decodegth-1])...)}} else {if mod == 0b11 {decodedInstructions = append(decodedInstructions, MovImmediateToReg16)decodedInstructions = append(decodedInstructions, instructions[2])decodedInstructions = append(decodedInstructions, instructions[3])decodedInstructions = append(decodedInstructions, rm)} else {decodedInstructions = append(decodedInstructions, MovImmediate16ToMemory)decodedInstructions = append(decodedInstructions, instructions[decodegth-2])decodedInstructions = append(decodedInstructions, instructions[decodegth-1])decodedInstructions = append(decodedInstructions,decodeMemoryOperand(mod, rm, instructions[2:decodegth-2])...)}}return decodedInstructions
}

其他的都类似。

jmp 指令解码

jmp 指令包含直接转移和条件转移。
decode_jmp.go 中先把所有的指令详细类型定义出来：

const (//非条件转移JmpNotShort           uint8 = iota //16位IP偏移量JmpShort                           //8位IP偏移量JmpDirectIntersegment              //cs 16位，IP 16位JmpReg16                           //IP的值在寄存器中JmpIndirectWithinsegmentJmpIndirectIntersegment//条件转移JmpJoJmpjnoJmpJbJmpJnbJmpJeJmpJneJmpJbeJmpJnbeJmpJsJmpJnsJmpJpJmpJnpJmpJlJmpJnlJmpJleJmpJnleJmpJcxz
)

初始化函数，注册所有的 jmp 指令与它的解码函数：

func init() {//jmpAddDecodeInstruction(0xE9, decodeJmpDirectWithinsegment)AddDecodeInstruction(0xEA, decodeJmpDirectIntersegment)AddDecodeInstruction(0xEB, decodeJmpDirectWithinsegmentShort)AddDecodeInstruction2(0xFF, 0b100, decodeJmpIndirectWithinsegment)AddDecodeInstruction2(0xFF, 0b101, decodeJmpIndirectIntersegment)var firstByte bytefor firstByte = 0x70; firstByte <= 0x7F; firstByte++ {AddDecodeInstruction(firstByte, decodeJmpConditional)}//jcxzAddDecodeInstruction(0xE3, decodeJmpConditional)}

以段内间接转移为例，它的机器指令格式如下：
在这里插入图片描述
对应的解码函数 decodeJmpIndirectWithinsegment 代码如下：

func decodeJmpIndirectWithinsegment(instructions []byte) []byte {/*11111111,mod 1 0 0 r/m,(DISP-LO ) (DISP-HI)*/decodegth := len(instructions)if decodegth < 2 {return nil}dispLen := lenDisplacement(instructions[1])if decodegth < 2+dispLen {return nil}decodedInstructions := []byte{InstructionJmp}mod := (instructions[1] & 0b11000000) >> 6rm := instructions[1] & 0b111if mod == 0b11 {decodedInstructions = append(decodedInstructions, JmpReg16)decodedInstructions = append(decodedInstructions, rm)} else {decodedInstructions = append(decodedInstructions, JmpIndirectWithinsegment)decodedInstructions = append(decodedInstructions,decodeMemoryOperand(mod, rm, instructions[2:])...)}return decodedInstructions
}

如果 mod 是 0b11，则返回的中间形式机器指令为：

InstructionJmp，JmpReg16，rm

条件转移的解码函数就更简单，因为条件转移的机器指令固定 2 个字节：
在这里插入图片描述
只需根据第一个字节确定详细指令类型即可，它的实现如下：

func decodeJmpConditional(instructions []byte) []byte {/*xxxxxxxx,IP-INC8*/if len(instructions) < 2 {return nil}table := map[uint8]uint8{0x70: JmpJo,0x71: Jmpjno,0x72: JmpJb,0x73: JmpJnb,0x74: JmpJe,0x75: JmpJne,0x76: JmpJbe,0x77: JmpJnbe,0x78: JmpJs,0x79: JmpJns,0x7A: JmpJp,0x7B: JmpJnp,0x7C: JmpJl,0x7D: JmpJnl,0x7E: JmpJle,0x7F: JmpJnle,0xE3: JmpJcxz,}return []byte{InstructionJmp, table[instructions[0]], instructions[1]}
}

其他指令的解码函数实现都类似。

后续文章讲解 EU 如何实现执行 mov，jmp 以及一些算数运算指令。

实现8086虚拟机（四）——mov 和 jmp 指令解码

文章目录mov 指令解码jmp 指令解码这篇文章举例来讲讲 mov 指令和 jmp 指令解码函数的实现，其他的指令解码函数都与这些类似。mov 指令解码以 mov 指令中的一类：寄存器/内存到/从寄存器，来详细说明解码函数的实现。机器指令格式如下&am…...

编程日记 2023/4/28 16:40:39

数据库技术-函数依赖、键与约束、范式

一、函数依赖给定一个x，能唯一确定一个Y，就称x确定Y，或者说Y依赖于x，例如YX*X函数。函数依赖又可扩展以下两种规则: 部分函数依赖:A可确定C，(A,B)也可确定C,(A,B)中的一部分（即A）可以确定C&a…...

编程日记 2023/3/21 0:02:18

shiro CVE-2020-1957

0x00 前言在之前只是单纯的复现了漏洞，没有记笔记，所以补充了这篇分析笔记。影响版本：shiro < 1.5.2 0x01 环境搭建环境用的是：https://github.com/lenve/javaboy-code-samples/tree/master/shiro/shiro-basic 0x02 漏…...

编程日记 2023/5/3 22:14:36

6.更多应用 6.1.AmqpAdmin 工具类可以通过Spring的Autowired 注入 AmqpAdmin 工具类 , 通过这个工具类创建队列, 交换机及绑定 import org.springframework.amqp.core.AmqpAdmin; import org.springframework.amqp.core.Binding; import org.springframework.amqp.core.Di…...

编程日记 2023/5/1 2:24:37

部署dapr的辛酸历程

前言dapr大概的了解，个人理解他就是一个分布式服务的管理，把微服务常用的组件(缓存，消息中间件、分布式锁、安全id4等)和监控以及服务注册、发现等等一系列功能以一个很抽象的方式管理起来。可能我们部署微服务用consul、ocelot、polly套件、…...

编程日记 2023/2/20 8:47:14

golang入门笔记——内存管理

文章目录自动内存管理概念自动内存管理-相关概念：追踪垃圾回收：分代GC（Generational GC）引用计数内存分配Go内存分配-分块Go内存分配——多级缓存Go内存管理优化Balanced GC自动内存管理概念 1.动态内存程序在运行时根据需求…...

编程日记 2023/5/6 13:53:48

97. 约数之和

Powered by:NEFU AB-IN Link 文章目录97. 约数之和题意思路代码97. 约数之和题意假设现在有两个自然数 A和 B，S是 A^B的所有约数之和。请你求出 S mod 9901的值是多少。思路 ABA^BAB的约数之和为：sumAB(1p1p12...p1Ba1)(1p2p22...p2Ba2)...sum_{A^B…...

编程日记 2023/4/1 8:27:22

想和20岁的自己说

男生床头千万不要放卫生纸不要叫自己的女朋友早睡，更不能叫她早起，否则有你好受的。成年人的默契：和异性单独出去旅游，如果没有明确拒绝开一间房，那基本上默认后面会发生的事情不要去考验人性，世上99%的人经…...

编程日记 2023/4/28 12:13:28

Unit Test and Integration Test

Unit Test and Integration Test Background It is the first time that I try to write an article in English. In the past, I didn’t write test code. Just thinking QA is responsible for testing. As a developer, I don’t need to care about tests. Although I …...

编程日记 2023/4/24 23:03:09

2022年全国职业院校技能大赛（中职组）网络安全竞赛试题（3）

目录模块A 基础设施设置与安全加固 （本模块20分） 一、项目和任务描述： 假定你是某企业的网络安全工程师，对于企业的服务器系统，根据任务要求确保各服务正常运行，并通过综合运用用户安全管理与密码策略、…...

编程日记 2023/5/7 17:25:59

智慧城市应急指挥中心数字化及城市驾驶舱建设方案

目录第一章项目概述 1.1 项目背景 1.2 项目范围第二章建设内容 2.1 三维可视化平台 2.1.1 多源数据接入 2.1.2 可视化编排 2.1.3 三维可视化编辑 2.1.4 空间数据可视化 2.1.5 集成框架支持 2.2 可视化场景定制开发 2.2.1 城市驾驶总舱 2.2.2 城市安全分舱 2.…...

编程日记 2023/5/10 7:42:45

HSCSEC 2023 个人练习

😋 大家好，我是YAy_17，是一枚爱好网安的小白。本人水平有限，欢迎各位大佬指点，欢迎关注😁，一起学习 💗 ，一起进步 ⭐ 。⭐ 此后如竟没有炬火，我便是唯一的光。…...

编程日记 2023/5/8 21:56:33

Android 基础知识4-2.7 RelativeLayout（相对布局）

一、RelativeLayout的概述 RelativeLayout（相对布局）是一种根据父容器和兄弟控件作为参照来确定控件位置的布局方式。在很多时候，线性布局还不能满足我们的需求，比如，我们在一行（列）上显示多个控…...

编程日记 2023/5/7 7:07:43

关于云计算，我们问了ChatGPT 10个问题

ChatGPT懂云计算吗？前些天，我们问了ChatGPT（非Plus收费版）一些问题。1. 什么是云计算？2. 云计算行业的护城河是什么？3. 什么是云原生？4. 微软Azure与亚马逊AWS的主要区别是什么？5. 为…...

编程日记 2023/4/29 5:20:53

Netty学习笔记1

Netty学习笔记（一） 在的互联网环境下，分布式系统大行其道，而分布式系统的根基在于网络编程，而 Netty 恰恰是 Java 领域网络编程的王者。如果要致力于开发高性能的服务器程序、高性能的客户端程序，必须掌握…...

编程日记 2023/5/9 11:55:17

RISK-V品牌的中国化历程（中）

目录 1.技术优势出道即巅峰 2.生态布道品牌根植中国 3.应用场景加速品牌的商业化运作生态布道品牌根植中国 2015年成立非盈利组织RISC-V基金会，目前已吸引全球28个国家327家会员，包括英伟达、联发科、苹果、特斯拉、谷歌、高通、IBM、三星、麻省理…...

编程日记 2023/4/17 19:31:43

2023.02.19 学习周报

文章目录摘要文献阅读1.题目2.摘要3.介绍4.本文贡献5.方法5.1 Local Representation Learning5.2 Global Representation Learning5.3 Item Similarity Gating6.实验6.1 数据集6.2 结果7.结论深度学习1.对偶问题1.1 拉格朗日乘数法1.2 强对偶性2.SVM优化3.软间隔3.1 解决问题3.…...

编程日记 2023/4/25 14:28:24

枚举类的使用方法

一、理解枚举类型枚举类型是Java 5中新增特性的一部分，它是一种特殊的数据类型，之所以特殊是因为它既是一种类(class)类型却又比类类型多了些特殊的约束，但是这些约束的存在也造就了枚举类型的简洁性、安全性以及便捷性。下面先来看看如何写…...

编程日记 2023/4/26 7:30:01

.NET3.5安装步骤及相关问题。

.NET3.5全称 Microsoft.NETFramework3.5 最新版本-.NET4.8 第一步打开控制面板 windows系统打开控制面板选择程序选择.NET3.5安装。可能会出现问题。解决方案： 报错代码80240438的常用解决办法： 方法一：检测windows update servic…...

编程日记 2023/4/14 1:19:46

联想M7268激光打印机开机红绿灯双闪报错不打印

故障现象：一台联想M7268激光打印机开机后电源键、复印键一起双闪，电源键闪红灯、复印键闪绿灯；检测维修：根据闪灯故障判断如果无卡纸异常情况下可能是激光器故障，因为以前曾经维修过一台一模一样的机器故障基本相同，先打开机器吧，把硒鼓拿出来先看看有没有卡纸，进纸…...

编程日记 2023/2/20 8:28:33

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/8/23 5:51:08

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2026/1/21 9:20:07

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能，包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

编程新知 2025/11/14 9:31:35

Debian系统简介

目录 Debian系统介绍 Debian版本介绍 Debian软件源介绍软件包管理工具dpkg dpkg核心指令详解安装软件包卸载软件包查询软件包状态验证软件包完整性手动处理依赖关系 dpkg vs apt Debian系统介绍 Debian 和 Ubuntu 都是基于 Debian内核的 Linux 发行版&#xff…...

编程新知 2026/2/1 13:41:09

Nuxt.js 中的路由配置详解

Nuxt.js 通过其内置的路由系统简化了应用的路由配置，使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...

编程新知 2026/2/6 16:52:42

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

蓝桥杯冶炼金属

原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V，是一个正整数，表示每 V V V 个普通金属 O O O 可以冶炼出 …...

编程新知 2026/2/4 10:54:26

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

前言： 最近在做行为检测相关的模型，用的是时空图卷积网络（STGCN），但原有kinetic-400数据集数据质量较低，需要进行细粒度的标注，同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...

编程新知 2026/2/6 5:04:18

uniapp 开发ios， xcode 提交app store connect 和 testflight内测

uniapp 中配置配置manifest 文档：manifest.json 应用配置 | uni-app官网 hbuilderx中本地打包下载IOS最新SDK 开发环境 | uni小程序SDK hbulderx 版本号：4.66 对应的sdk版本 4.66 两者必须一致本地打包的资源导入到SDK 导入资源 | uni小程序SDK …...

编程新知 2026/1/31 8:35:07

Ubuntu系统多网卡多相机IP设置方法

目录 1、硬件情况 2、如何设置网卡和相机IP 2.1 万兆网卡连接交换机，交换机再连相机 2.1.1 网卡设置 2.1.2 相机设置 2.3 万兆网卡直连相机 1、硬件情况 2个网卡n个相机电脑系统信息，系统版本：Ubuntu22.04.5 LTS；内核版本…...

编程新知 2026/2/4 16:40:55

实现8086虚拟机（四）——mov 和 jmp 指令解码

文章目录

mov 指令解码

jmp 指令解码

相关文章：

实现8086虚拟机（四）——mov 和 jmp 指令解码

数据库技术-函数依赖、键与约束、范式

shiro CVE-2020-1957

RabbitMQ 入门到应用 ( 五 ) 基本应用

部署dapr的辛酸历程

golang入门笔记——内存管理

97. 约数之和

想和20岁的自己说

Unit Test and Integration Test

2022年全国职业院校技能大赛（中职组）网络安全竞赛试题（3）

智慧城市应急指挥中心数字化及城市驾驶舱建设方案

HSCSEC 2023 个人练习

Android 基础知识4-2.7 RelativeLayout（相对布局）

关于云计算，我们问了ChatGPT 10个问题

Netty学习笔记1

RISK-V品牌的中国化历程（中）

2023.02.19 学习周报

枚举类的使用方法

.NET3.5安装步骤及相关问题。

联想M7268激光打印机开机红绿灯双闪报错不打印

SkyWalking 10.2.0 SWCK 配置过程

工业安全零事故的智能守护者：一体化AI智能安防平台

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

Debian系统简介

Nuxt.js 中的路由配置详解

Python爬虫（二）：爬虫完整流程

蓝桥杯冶炼金属

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

uniapp 开发ios， xcode 提交app store connect 和 testflight内测

Ubuntu系统多网卡多相机IP设置方法