HarmonyOS Next 方舟字节码文件格式介绍
在开发中,可读的编程语言要编译成二进制的字节码格式才能被机器识别。在HarmonyOS Next开发中,arkts会编译成方舟字节码。方舟字节码长什么样呢?我们以一个demo编译出的abc文件:
![![[HarmonyOS Next 方舟字节码文件格式介绍.png]]](https://i-blog.csdnimg.cn/direct/e163ca5dbb4a4fc2bf7a8dcb01dc4e7b.png)
二进制就是长这样,怎么去理解呢?就需要理解方舟字节码的文件格式。
字节码文件布局
上面图中看到有个可以认识的几个字母PANDA,什么意思呢?先了解下字节码文件布局。
字节码文件起始于Header结构。文件中的所有结构均可以从Header出发,直接或间接地访问到。字节码文件中结构的引用方式包括偏移量和索引。偏移量是一个32位长度的值,表示当前结构的起始位置在字节码文件中相对于文件头的距离,从0开始计算。索引是一个16位长度的值,表示当前结构在索引区域中的位置。
Header
先来看看Header结构:
| 名称 | 格式 | 说明 |
|---|---|---|
| magic | uint8_t[8] | 文件头魔数,值必须是’P’ ‘A’ ‘N’ ‘D’ ‘A’ ‘\0’ ‘\0’ ‘\0’。 |
| checksum | uint32_t | 字节码文件除文件头魔数和本校验字段之外的内容的adler32校验和。 |
| version | uint8_t[4] | 字节码文件的版本号 (Version) 。 |
| file_size | uint32_t | 字节码文件的大小,以字节为单位。 |
| foreign_off | uint32_t | 一个偏移量,指向外部区域。外部区域中仅包含类型为ForeignClass或ForeignMethod的元素。foreign_off指向该区域的第一个元素。 |
| foreign_size | uint32_t | 外部区域的大小,以字节为单位。 |
| num_classes | uint32_t | ClassIndex结构中元素的数量,即文件中定义的Class的数量。 |
| class_idx_off | uint32_t | 一个偏移量,指向ClassIndex。 |
| num_lnps | uint32_t | LineNumberProgramIndex结构中元素的数量,即文件中定义的Line number program的数量。 |
| lnp_idx_off | uint32_t | 一个偏移量,指向LineNumberProgramIndex。 |
| reserved | uint32_t | 方舟字节码文件内部使用的保留字段。 |
| reserved | uint32_t | 方舟字节码文件内部使用的保留字段。 |
| num_index_regions | uint32_t | IndexSection结构中元素的数量,即文件中IndexHeader的数量。 |
| index_section_off | uint32_t | 一个偏移量,指向IndexSection。 |
- magic:最开始的0x50、0x41、0x4e、0x44、0x41对应的就是PANDA的ASCII码,接下来是三个0
- checksum:四个字节的校验位0x5d、0xe8、0xde、0xdf
- version:自个字节的版本号0x0C、0x00、0x06、0x00
- …
Version
字节码版本号由4个部分组成,格式为:主版本号.次版本号.特性版本号.编译版本号。
| 名称 | 格式 | 说明 |
|---|---|---|
| 主版本号 | uint8_t | 标识整体架构调整引入的字节码文件格式变更。 |
| 次版本号 | uint8_t | 标识局部架构调整或者重大特性调整引入的字节码文件格式变更。 |
| 特性版本号 | uint8_t | 标识中小特性引入的字节码文件格式变更。 |
| 编译版本号 | uint8_t | 标识缺陷修复引入的字节码文件格式变更。 |
ForeignClass
描述字节码文件中的外部类。外部类在其他文件中声明,并在当前字节码文件中被引用。
| 名称 | 格式 | 说明 |
|---|---|---|
| name | String | 外部类的名称,命名遵循TypeDescriptor语法。 |
ForeignMethod
描述字节码文件中的外部方法。外部方法在其他文件中声明,并在当前字节码文件中被引用。
| 名称 | 格式 | 说明 |
|---|---|---|
| class_idx | uint16_t | 一个指向该方法所从属的类的索引,指向一个在ClassRegionIndex中的位置,该位置的值是一个指向Class或ForeignClass的偏移量。 |
| reserved | uint16_t | 方舟字节码文件内部使用的保留字段。 |
| name_off | uint32_t | 一个偏移量,指向字符串,表示方法名称。 |
| index_data | uleb128 | 方法的MethodIndexData数据。 |
| 通过ForeignMethod的偏移量,可以找到适当的IndexHeader以解析class_idx。 |
此外还有Class、Class、ClassAccessFlag、ClassTag、Field、FieldTag、Method、MethodIndexData、MethodTag、Code、TryBlock、CatchBlock、Annotation、AnnotationElementTag、AnnotationElement、Value formats、LineNumberProgramIndex、DebugInfo、IndexSection、IndexHeader、ClassRegionIndex、Type、MethodStringLiteralRegionIndex、LiteralArray、Literal,这里不一一介绍。
接下来介绍下字节码文件数据类型。
字节码文件数据类型
整型
| 名称 | 说明 |
|---|---|
| uint8_t | 8-bit无符号整数。 |
| uint16_t | 16-bit无符号整数,采用小端字节序。 |
| uint32_t | 32-bit无符号整数,采用小端字节序。 |
| uleb128 | leb128编码的无符号整数。 |
| sleb128 | leb128编码的有符号整数。 |
字符串
| 名称 | 格式 | 说明 |
|---|---|---|
| utf16_length | uleb128 | 值为len << 1 | is_ascii,其中len是字符串在UTF-16编码中的大小,is_ascii标记该字符串是否仅包含ASCII字符,可能的值是0或1。 |
| data | uint8_t[] | 以’\0’结尾的MUTF-8编码字符序列。 |
TaggedValue
| 名称 | 格式 | 说明 |
|---|---|---|
| tag | uint8_t | 表示数据种类的标记。 |
| data | uint8_t[] | 根据不同的标记,data是不同类型的数据或者为空。 |
字节码文件中所有的多字节值均采用小端字节序。
相关文章:
HarmonyOS Next 方舟字节码文件格式介绍
在开发中,可读的编程语言要编译成二进制的字节码格式才能被机器识别。在HarmonyOS Next开发中,arkts会编译成方舟字节码。方舟字节码长什么样呢?我们以一个demo编译出的abc文件: 二进制就是长这样,怎么去理解呢&…...
iOS主要知识点梳理回顾-2-多线程
iOS的多线程主要有三种方式,NSThread、GCD(Grand Central Dispatch)NSOperationQueue 开始,在iOS2发布的时候,苹果同步推出了NSthread和NSOperation。其中NSthread比较简单,仅提供了创建队列、开始、取消、…...
WPS如何接入DeepSeek(通过JS宏调用)
WPS如何接入DeepSeek 一、文本扩写二、校对三、翻译 本文介绍如何通过 WPS JS宏调用 DeepSeek 大模型,实现自动化文本扩写、校对和翻译等功能。 一、文本扩写 1、随便打开一个word文档,点击工具栏“工具”。 2、点击“开发工具”。 3、点击“查看代码”…...
【课程设计参考】迷宫小游戏 :基于 Python+Pygame+AI算法
一、内容 实现走迷宫 (1)游戏界面显示:迷宫地图、上下左右移动的特效。 (2)动作选择:上下左右键对应于上下左右的移动功能,遇到障碍的处理。 (3)得分统计功能ÿ…...
sa8295 qnx ais_camare如何支持一个摄像头两路vc输出?
当一个摄像头有两个vc输出的时候,如何更改驱动配置呢? 当一个摄像头可以输出两路vc,并且格式不同。根据每一路的vc图像数据格式修改串行器中maxxxx_mode_t里面的数组mode参数(以下仅为例子) struct maxxxx_mode_t ma…...
通过类加载和初始化的一些题目理解Java类加载过程
通过题目重点理解:Class加载流程和运行时区域 目录 子类和父类static变量父子类加载顺序2class.forName初始化 子类和父类static变量 class Parent {static int a 1;static int b 2;static int c;static {c 3;System.out.println("parent static block&quo…...
Coze(扣子)+ Deepseek:多Agents智能体协作开发新范式
前言 在当今数字化浪潮中,人工智能(AI)技术的迅猛发展正深刻改变着我们的生活和工作方式。从智能语音助手到自动化流程机器人,AI 的应用无处不在,为我们提供了更加便捷、高效的服务。然而,对于非专业人士来…...
浅析Ruby类污染及其在Sinatra框架下的利用
和JavaScript中的原型链污染类似,Ruby中也存在类似的概念——类污染,两者都是对象进行不安全的递归合并导致的。 网上也没有相关的分析文章,只有下面这篇文章应该是第一次谈到这个问题 Class Pollution in Ruby: A Deep Dive into Exploiti…...
【NLP251】Transformer API调用
1. nn.Transformer nn.Transformer封装了Transformer中的包含编码器(Encoder)和解码器(Decoder)。如下图所示,它对Encoder和Decoder两部分的包装,它并没有实现输入中的Embedding和Positional Encoding和最…...
ubuntu下迁移docker文件夹
在 Ubuntu 系统中迁移 Docker 文件夹(如 Docker 数据存储文件夹 /var/lib/docker)到另一个磁盘或目录,通常是为了释放系统盘空间。以下是迁移过程的详细步骤: 1. 停止 Docker 服务 在进行迁移之前,必须停止 Docker 服…...
为AI聊天工具添加一个知识系统 之93 详细设计之34 Derivation 之 8 实现和平台
本文要点 要点 插入话题:实现 “实现”作为一个普通名词(一般术语)应该遵循第一性第二性第三性原则。其 第一性第二性第三性 分别是:完整性/鲁棒性/健壮性 ,三者 分别注重 性能/功能/能力。即 首先是 实现完整性的性…...
idea 如何使用deepseek 保姆级教程
1.安装idea插件codegpt 2.注册deepseek并生成apikey deepseek 开发平台: DeepSeek 3.在idea进行codegpt配置 打开idea的File->Settings->Tools->CodeGPT->Providers->Custom OpenAI Chat Completions的URL填写 https://api.deepseek…...
python实现情绪识别模块,并将模块封装成可执行文件
目录: 1.源码:2.情绪识别模型运行流程:3.模型封装需要注意的地方:4.未解决问题: 1.源码: https://gitcode.com/xyint/deep_learning.git 2.情绪识别模型运行流程: 需要获取用户摄像头权限&…...
AH比价格策略源代码
用python 获取在A股和香港上市的公司和在A股和香港上市的公司股票代码和名称并且选出港股和A股涨幅相差比较大的股票 import akshare as akdef get_ah_stocks():# 获取A股股票列表a_stock_list ak.stock_zh_a_spot_em()print(a_stock_list)a_stock_list a_stock_list[[&quo…...
trimesh 加载obj mesh处理
目录 trimesh 加载obj trimesh入门 主要功能 安装 基本用法 1. 加载和保存 3D 模型 2. 几何操作 3. 网格分析 4. 可视化 5. 布尔运算 6. 碰撞检测 trimesh 加载obj template_mesh trimesh.load_mesh(r"E:\project\3d\lilpotat--pytorch3d\pixie_data\smplx_te…...
常见数据结构的C语言定义---《数据结构C语言版》
文章目录 1. 静态分配的顺序表2. 动态分配的顺序表3. 单 链 表4. 双 链 表5. 静态链表6. 顺序栈7. 链栈8. 顺序存储的队列9. 链式存储的队列10. 链式存储的二叉树11. 线索二叉树12. 树的双亲表示法13. 树的孩子兄弟表示法12. 图的邻接矩阵法13. 图的邻接表法1-13集合版本 #defi…...
C++小知识记录,不定时更新
1. 普通函数不能在头文件中定义: 当多个.cpp调用时,在编译链接时会在.o文件中重复定义报错 2. 为什么内联函数可以在头文件中定义:适用短小函数 当.cpp调用时,编译器只会在当前文件展开该函数,相当于每个.cpp会重新定…...
python--sqlite
1. 连接到数据库 使用 sqlite3.connect() 方法可以创建一个到SQLite数据库的连接。如果指定的数据库文件不存在,它会自动创建一个新的数据库文件。 import sqlite3# 连接到数据库,如果数据库文件不存在则会创建一个新的 conn sqlite3.connect(example…...
使用 Axios ——个人信息修改与提示框实现
目录 详细介绍:个人信息设置与修改页面实现 1. HTML 结构 2. CSS 样式 3. JavaScript 核心逻辑 a. 信息渲染与表单提交 b. 头像上传与预览 4. 功能详解 5. 总结 提示: 这段代码展示了如何创建一个简单的个人信息设置页面,包含用户个…...
群晖安装Gitea
安装Docker Docker运行Gitea 上传gitea包,下载地址:https://download.csdn.net/download/hmxm6/90360455 打开docker 点击印象,点击新增,从文件添加 点击启动 可根据情况,进行高级设置,没有就下一步 点击应…...
LabVIEW商业软件开发
在商业软件开发和仪器自动测试领域,LabVIEW以其图形化编程方式、高效的数据采集能力和强大的硬件集成优势,成为众多工程项目的核心开发工具。然而,商业软件的开发远不止编写代码和实现功能那么简单,尤其是在仪器自动测试领域&…...
内容中台赋能人工智能技术提升业务创新能力
内容概要 在当今快速变化的市场环境中,企业需要不断寻求创新以保持竞争力。内容中台作为一种新型的内容管理架构,能够极大地提升企业在内容创建、管理和分发方面的效率。通过与人工智能技术的深度融合,企业能够将海量的数据和信息转化为有价…...
spring 基于构造方法实例化对象
在 spring 中,对象的实例化创建都在 AbstractAutowireCapableBeanFactory#createBeanInstance 方法中完成,其中定义了不少实例化策略,如:Supplier、工厂方法、构造方法、无参构造。其中无参构造,即 AbstractAutowireCa…...
生成式聊天机器人 -- 基于Pytorch + Global Attention + 双向 GRU 实现的SeqToSeq模型 -- 下
生成式聊天机器人 -- 基于Pytorch Global Attention 双向 GRU 实现的SeqToSeq模型 -- 下 训练Masked 损失单次训练过程迭代训练过程 测试贪心解码(Greedy decoding)算法实现对话函数 训练和测试模型完整代码 生成式聊天机器人 – 基于Pytorch Global Attention 双向 GRU 实…...
Vue.js 与第三方插件的集成
Vue.js 与第三方插件的集成 今天我们来聊聊如何在 Vue 项目中集成第三方插件。随着项目功能不断增多,我们常常需要引入各种第三方库和插件,比如国际化、图表、日期处理等,来提升开发效率和用户体验。下面就跟大家分享一下集成第三方插件的常…...
Netty初学九 心跳与空闲检测
一、网络问题 1.连接假死: 连接假死的现象是:在某一端看来,底层的Tcp连接已经断开,但是应用程序没有捕获到,会认为这条连接仍然是存在的。从TCP层面来说,只有收到四次握手数据包或者一个RST数据包才可以表示…...
数据分析如何做EDA
探索性数据分析(EDA,Exploratory Data Analysis)是数据分析过程中至关重要的一步,其目的是通过统计和可视化技术对数据进行初步分析,从而揭示数据的潜在模式、特征和异常值,并为后续的数据预处理、特征工程…...
AD域控粗略了解
一、前提 转眼大四,目前已入职上饶一公司从事运维工程师,这与我之前干的开发有着很大的差异,也学习到了许多新的知识。今天就写下我对于运维工作中常用的功能——域控的理解。 二、为什么要有域控,即域控的作用 首先我们必须要…...
【计算机网络】TCP/IP 网络模型有哪几层?
目录 应用层 传输层 网络层 网络接口层 总结 为什么要有 TCP/IP 网络模型? 对于同一台设备上的进程间通信,有很多种方式,比如有管道、消息队列、共享内存、信号等方式,而对于不同设备上的进程间通信,就需要网络通…...
使用 Typora 编写 MD 文档:从入门到精通(附赠百度网盘下载地址)
引言 Markdown(简称 MD)是一种轻量级标记语言,广泛应用于技术写作、博客撰写、文档管理等领域。Typora 是一款功能强大且易于使用的 Markdown 编辑器,支持实时预览、语法高亮、主题切换等功能,深受开发者和写作者的喜…...
