当前位置: 首页 > article >正文

rbpf虚拟机-汇编和反汇编器

文章目录

  • 一、概述
  • 二、主要功能
  • 三、关键函数解析
    • 3.1 汇编器
      • 3.1.1 `parse` -转换为Instruction列表
      • 3.1.2 `assemble_internal`-转换为Insn
    • 3.2 反汇编器
      • 3.2.1 `to_insn_vec`-转换为机器指令
  • 四、总结

Welcome to Code Block's blog

本篇文章主要介绍了
[rbpf虚拟机-汇编和反汇编器]
❤博主广交技术好友,喜欢我的文章的可以关注一下❤


一、概述

该篇文章是rbpf汇编器和反汇编器代码块功能的整理。

(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

汇编器的作用是将机器指令转换为二进制操作码,反汇编器将二进制操作码数据转换为机器指令的形式进行显示。

二、主要功能

汇编和反汇编器主要实现以下功能:

  1. 机器指令转二进制
    • 机器指令到初始指令结构体(Instruction)
    • 初始指令类到指令结构体(Insn)
    • 指令列表通过切片转换为二进制
  2. 二进制转机器指令
    • 循环解析到机器指令

三、关键函数解析

3.1 汇编器

3.1.1 parse -转换为Instruction列表

pub fn parse(input: &str) -> Result<Vec<Instruction>, String> {//1.跳过零个或多个空格//2.这里的with 不关心((), ["mov", "add", "sub"]) 里的()let mut with = spaces().with(many(instruction()).skip(eof()));#[cfg(feature = "std")]{//根据with解析器去解析指令match with.easy_parse(position::Stream::new(input)) {Ok((insts, _)) => Ok(insts),Err(err) => Err(err.to_string()),}}#[cfg(not(feature = "std"))]{match with.parse(position::Stream::new(input)) {Ok((insts, _)) => Ok(insts),Err(err) => Err(err.to_string()),}}
}

在parse方法中,会将机器指令如:"move r1, 0"格式转换为:

[Instruction { name: "mov", operands: [Register(1), Integer(0)] }]

主要使用的是combine 转换库,在这里是根据空格和换行分割后,使用instruction()进行封装,instruction()方法内容如下:

n instruction<I>() -> impl Parser<I, Output = Instruction>
whereI: Stream<Token = char>,I::Error: ParseError<I::Token, I::Range, I::Position>,
{//解析以特定分隔符分隔的多个元素。let operands = sep_by(operand(), char(',').skip(spaces()));(ident().skip(spaces()), operands, spaces()).map(|t| Instruction {name: t.0,operands: t.1,})
}

什么是combine?
combine 是一个基于解析器组合子(parser combinators)的库,它允许开发者通过组合简单的解析器来构建复杂的解析器。解析器组合子是一种函数式编程技术,通过将小的解析器组合起来,形成更大、更复杂的解析器。

combine文档

3.1.2 assemble_internal-转换为Insn

fn assemble_internal(parsed: &[Instruction]) -> Result<Vec<Insn>, String> {let instruction_map = make_instruction_map();let mut result: Vec<Insn> = vec![];//循环parsed列表 (parsed来自parse方法返回值)for instruction in parsed {//获取命令名称let name = instruction.name.as_str();//匹配类型和opcodematch instruction_map.get(name) {Some(&(inst_type, opc)) => {match encode(inst_type, opc, &instruction.operands) {//匹配成功后返在结果内添加命令Ok(insn) => result.push(insn),//发生错误时,返回错误Err(msg) => return Err(format!("Failed to encode {name}: {msg}")),}// Special case for lddw.// 当类型是imm类型时,对命令取高32位进行拼接if let LoadImm = inst_type {if let Integer(imm) = instruction.operands[1] {result.push(insn(0, 0, 0, 0, imm >> 32).unwrap());}}}None => return Err(format!("Invalid instruction {name:?}")),}}Ok(result)
}

assemble_internal()作用是将parse()处理完成后的数据进行进一步的处理,处理成以下数据格式:

[Insn { opc: 183, dst: 1, src: 0, off: 0, imm: 0 }]

Insn数据为ebpf的指令格式.

  31      24 23     16 15      8 7       0
+--------+--------+--------+--------+
|    dst  |    src  |  offset  |  opcode |
+--------+--------+--------+--------+
|           immediate / address          |
+----------------------------------------+

然后通过切片extend_from_slice的方式将其转换为二进制格式。完整的转换代码如下:

pub fn assemble(src: &str) -> Result<Vec<u8>, String> {let parsed = (parse(src))?;//Ok([Instruction { name: "mov", operands: [Register(0), Integer(0)] }, Instruction { name: "add", operands: [Register(1), Integer(2)] }])let insns = (assemble_internal(&parsed))?;let mut result: Vec<u8> = vec![];for insn in insns {result.extend_from_slice(&insn.to_array());}Ok(result)
}

3.2 反汇编器

3.2.1 to_insn_vec-转换为机器指令

pub fn to_insn_vec(prog: &[u8]) -> Vec<HLInsn> {//验证程序是规定的8位if prog.len() % ebpf::INSN_SIZE != 0 {panic!("[Disassembler] Error: eBPF program length must be a multiple of {:?} octets",ebpf::INSN_SIZE);}//验证是否为空if prog.is_empty() {return vec![];}let mut res = vec![];let mut insn_ptr: usize = 0;//循环遍历指令while insn_ptr * ebpf::INSN_SIZE < prog.len() {let insn = ebpf::get_insn(prog, insn_ptr);let name;let desc;let mut imm = insn.imm as i64;match insn.opc {ebpf::LD_ABS_B => {name = "ldabsb";desc = ldabs_str(name, &insn);},......}res
}

to_insn_vec方法代码中使用循环的方式对每个二进制指令(8位),根据每条指令的opcode码进行转换,转换为字符串格式的机器指令(desc),其中包括对指令长度、是否为空进行检查。

四、总结

通过上述对源码进行解读,可以看到汇编器和反汇编器在虚拟机中起着重要的作用,允许开发者直接编写与 eBPF 架构兼容的指令。通过汇编器,这些指令被翻译成内核能够理解和执行的二进制形式。

代码来源:rbpf虚拟机
鸣谢: qmonnet 提供的开源代码.

当然,我也会将带有中文注释和自己理解的一些代码上传的我的github页面,感兴趣的朋友可以进行clone查看.

我的GitHub:forked


感谢您的点赞、关注、收藏!
在这里插入图片描述

相关文章:

rbpf虚拟机-汇编和反汇编器

文章目录 一、概述二、主要功能三、关键函数解析3.1 汇编器3.1.1 parse -转换为Instruction列表3.1.2 assemble_internal-转换为Insn 3.2 反汇编器3.2.1 to_insn_vec-转换为机器指令 四、总结 Welcome to Code Blocks blog 本篇文章主要介绍了 [rbpf虚拟机-汇编和反汇编器] ❤…...

虚拟现实--->unity学习

前言&#xff1a;这学期劳动课选了虚拟现实&#xff0c;其中老师算挺认真的&#xff0c;当然对一些不感兴趣的同学来说是一种折磨&#xff0c;我对这个unity的学习以及后续的虚幻引擎刚开始连基础的概念都没有&#xff0c;后面渐渐也是滋生了一些兴趣&#xff0c;用这篇博客记录…...

一文详解QT环境搭建:ubuntu20.4安装配置Qt5

随着软件开发技术的不断进步&#xff0c;跨平台应用程序的需求日益增长&#xff0c;开发者们面临着如何在不同操作系统之间保持代码的一致性和效率的问题。Qt作为一个成熟的跨平台C框架&#xff0c;在这方面提供了卓越的支持&#xff0c;不仅简化了GUI应用程序的创建过程&#…...

Gateway实战(三)、断言-时间、Cookie信息

spring cloud-Gateway实战三、断言 断言一)、时间断言相关1、适用场景2、Demo案例二)、断言- Cookie信息1、用户身份验证与会话管理场景及Demo案例2、A/B测试及Demo案例断言 简单了解: 断言是一种在程序设计中用于检查程序状态或条件的机制,在gateway网关里,断言的作用是…...

PyTorch中的Tensor

PyTorch中的Tensor‌ 是核心数据结构&#xff0c;类似于 NumPy 的多维数组&#xff0c;但具备 GPU 加速和自动求导等深度学习特性。 一、基本概念 ‌核心数据结构‌ Tensor 是存储和操作数据的基础单元&#xff0c;支持标量&#xff08;0D&#xff09;、向量&#xff08;1D&am…...

C++11大数加减

C11大数加减 // 20190412.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。 //#include "pch.h" #include <iostream> #include <algorithm> // sort find find_if #include <string> #include <vector> using names…...

OpenGL —— 基于Qt的视频播放器 - ffmpeg硬解码,QOpenGL渲染yuv420p或nv12视频(附源码)

🔔 OpenGL 相关技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…) 运行效果...

【IDEA的个性化配置】

目录&#xff1a; 一&#xff1a;隐藏项目路径二&#xff1a;禁用斜体注释三&#xff1a;重新Maven构建未完待续... 一&#xff1a;隐藏项目路径 &#x1f60a;在IDEA左侧的Project目录中&#xff0c;项目名称后面显示了项目的文件路径地址&#xff0c;如果不喜欢可以隐藏&…...

Vue 类与样式

数据绑定的一个常见需求场景是操纵元素的 CSS class 列表和内联样式。因为 class 和 style 都是 attribute&#xff0c;我们可以和其他 attribute 一样使用 v-bind 将它们和动态的字符串绑定。但是&#xff0c;在处理比较复杂的绑定时&#xff0c;通过拼接生成字符串是麻烦且易…...

【Kafka】分布式消息队列的核心奥秘

文章目录 一、Kafka 的基石概念​主题&#xff08;Topic&#xff09;​分区&#xff08;Partition&#xff09;​生产者&#xff08;Producer&#xff09;​消费者&#xff08;Consumer&#xff09;​ 二、Kafka 的架构探秘​Broker 集群​副本机制​ 三、Kafka 的卓越特性​高…...

自动化发布工具CI/CD实践Jenkins部署与配置教程

1. 前言背景 其实一直想把jenkins 的笔记整理下&#xff0c;介于公司这次升级jenkins2.0 &#xff0c;根据自己部署的一些经验&#xff0c;我把它整理成笔记。 之前我们的jenkins1.0 时代 还一直停留在 free style 或者 maven 风格的项目&#xff0c;随着项目的日益增多&#x…...

python中的demjson包介绍

demjson是Python中的一个第三方模块库&#xff0c;专门用于编码和解码JSON数据。以下是关于demjson包的详细介绍&#xff1a; 一、主要功能 编码与解码&#xff1a; demjson提供了将Python对象&#xff08;如字典、列表等&#xff09;编码成JSON字符串的功能。同时&#xff0c…...

什么是SQL作业

SQL作业是在数据库服务器上按特定时间或间隔自动执行的计划任务或流程&#xff0c;这些作业由Microsoft SQL Server中的SQL Server代理管理&#xff0c;对于自动执行日常任务&#xff08;如数据库系统中的备份、数据导入和报告生成&#xff09;以及确保及时准确地处理和更新数据…...

Android实践开发制作小猴子摘桃小游戏

Android实践制作小猴子摘桃小游戏 实践素材项目源文件获取&#xff1a;Android可能存在版本差异项目如果不能正确运行&#xff0c;可以使用里面的素材自己构建项目Android实践制作小猴子摘桃小游戏Android实践制作小猴子摘桃小游戏https://mp.weixin.qq.com/s/jNU_hVfj9xklsil…...

springboot整合couchbase(集群)

springboot整合couchbase 1、Couchbase1.1、介绍1.2、Bucket1.3、Couchbase SDK 2、(key,value)写入couchbase集群2.1、总体图2.2、依赖2.3、CouchbaseConfig 配置文件2.4、代码使用 1、Couchbase 1.1、介绍 1.2、Bucket 在 Couchbase 中&#xff0c;bucket 是一个重要的概念…...

VsCode启用右括号自动跳过(自动重写) - 自录制gif演示

VsCode启用右括号自动跳过(自动重写) - 自录制gif演示 前言 不知道大家在编程时候的按键习惯是怎样的。输入完左括号后编辑器一般会自动补全右括号&#xff0c;输入完左括号的内容后&#xff0c;是按→跳过右括号还是按)跳过右括号呢&#xff1f; for (int i 0; i < a.s…...

[Linux]在vim中批量注释与批量取消注释

1.在vim中批量注释的步骤&#xff1a; 1.在normal模式下按Ctrl v &#xff0c;进入V-BLOCK模式 2.按 J 键 或 K 键选择要注释的内容&#xff0c;J向上K向下 我们给第5&#xff0c;6&#xff0c;7行进行注释 3.按住shift i进入插入模式&#xff0c;输入 // 4.点击ESC键&…...

NC,GFS、ICON 数据气象信息可视化--降雨量的实现

随着气象数据的快速发展和应用&#xff0c;气象信息的可视化成为了一项不可或缺的技术手段。它不仅能帮助气象专家快速解读数据&#xff0c;还能为公众提供直观的天气预报信息。今天&#xff0c;我们将从降雨量的可视化出发&#xff0c;带大家一起了解如何实现气象数据的可视化…...

LLM之RAG实战(五十二)| 如何使用混合搜索优化RAG 检索

在RAG项目中&#xff0c;大模型生成的参考内容&#xff08;专业术语称为块&#xff09;来自前一步的检索&#xff0c;检索的内容在很大程度上直接决定了生成的效果&#xff0c;因此检索对于RAG项目至关重要&#xff0c;最常用的检索方法是关键字搜索和语义搜索。本文将分别介绍…...

探索Scala基础:融合函数式与面向对象编程的强大语言

Scala作为一门在现代编程领域备受瞩目的编程语言&#xff0c;融合了函数式编程和面向对象编程的特性&#xff0c;运行于Java虚拟机&#xff08;JVM&#xff09;之上&#xff0c;与Java有着良好的互操作性。它简洁、高效且表达力强&#xff0c;适用于各种规模和类型的软件开发项…...

Selenium文件上传

在 Web 自动化测试中,文件上传是一项常见的任务。不同的网站和前端技术可能导致上传方式有所不同,因此需要采用不同的方法进行处理。 方法 1:使用 send_keys() 直接上传(最常用) 适用场景: 页面中 有标准的 <input type="file"> 标签。 不需要弹出 Wind…...

Java多线程与高并发专题——Condition 和 wait/notify的关系

引入 上一篇关于Condition&#xff0c;我们对Condition有了进一步了解&#xff0c;在之前生产/消费者模式一文&#xff0c;我们讲过如何用 Condition 和 wait/notify 来实现生产者/消费者模式&#xff0c;其中的精髓就在于用Condition 和 wait/notify 来实现简易版阻塞队列&am…...

mysql-分区和性能

mysql自身只支持表的横向分区。 常听到开发人员说“”对表做个分区“&#xff0c;然后数据的查询就会快了。这是真的吗&#xff1f;实际上可能跟根本感觉不到查询速度的提升&#xff0c;甚至会发现查询速度急剧下降。因此&#xff0c;在合理使用分区之前&#xff0c;必须了解分…...

使用matlab进行分位数回归

对于使用MATLAB、R语言或者STATA执行带有虚拟变量的分位数回归&#xff0c;这三个工具都带有强大的分析功能。在核心观点上&#xff0c;首先需要理解分位数回归的基本原理、其次要掌握如何在各个统计软件中实现该分析、最后&#xff0c;需要熟悉虚拟变量在模型中的应用并合理加…...

[操作系统,学习记录]3.进程(2)

1.fork(); 玩法一&#xff1a;通过返回值if&#xff0c;else去执行不同的代码片段 玩法二&#xff1a;if&#xff0c;else然后调用execve函数去执行新的程序 2.进程终止&#xff1a; 退出码&#xff0c;子进程通过exit/return返回&#xff0c;父进程wait/waitpid等待而得&am…...

26考研——排序_选择排序_选择排序的基本思想 简单选择排序(8)

408答疑 文章目录 四、选择排序选择排序的基本思想简单选择排序定义算法思想性能分析空间效率时间效率稳定性 适用性 九、参考资料鲍鱼科技课件26王道考研书 四、选择排序 选择排序的基本思想 每一趟&#xff08;如第 i i i 趟&#xff09;在剩下 n − i 1 n-i1 n−i1&…...

StarRocks BE宕机排查

StarRocks BE宕机排查 排查是否OOM dmesg -T|grep -i oom #排查是否oom原因&#xff1a; 2.X版本OOM原因 BE 的配置文件 (be.conf) 中 mem_limit 配置不合理&#xff0c;需要配置mem_limit(机器总内存-其他服务占用内存-1~2g(系统预留)) 比如机器内存40G&#xff0c;上面有…...

PPT——组合SCI论文图片

SCI论文中对于图的排版常常是最头疼的事情&#xff0c;通常需要几个图组合在一起&#xff0c;并且如何控制图中的字体一致也是麻烦事。 保持这个大图里面的一致&#xff0c;转头一看跟其他图又不一致了。最近跟我的博导学了一手&#xff0c;今天就来记录一下吧。主要用到的软件…...

Tabby 一:如何在Mac配置保姆级教程(本地模型替换hugging face下载)

1. brew安装 mac需要先安装brew&#xff0c;如果本地已经安装过brew这一步可以忽略&#xff0c;遇到问题可以自己ai问 /bin/bash -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)" 可能遇到source .zprofile失败&#xff0c;因为…...

03 相机标定图像采集

学完本文,您将获取一下技能: 1:如何提升标定质量,如选择标定板,标定图像采集的注意事项, 2:实现标定图像自动筛选的代码 3:量产场景如何通过一张图像来标定相机 为了实现良好的标定效果,以下因素在标定数据采集前必须设置得当。 标定板选择 标定板尺寸准确材料平…...