当前位置：首页 > article >正文

鸿蒙进阶——Mindspore Lite AI框架源码解读之模型加载详解(一)

article 2026/2/8 18:36:44

文章大纲

引言
一、模型加载概述
二、核心数据结构
三、模型加载核心流程

引言

Mindspore 是一款华为开发开源的AI推理框架，而Mindspore Lite则是华为为了适配在移动终端设备上运行专门定制的版本，使得我们可以在OpenHarmony快速实现模型加载和推理等功能，模型加载则是利用 Mindspore Lite 进行推理任务的首要步骤，它犹如打开智能应用大门的钥匙，精准且高效地将预训练模型导入到运行环境中，为后续的推理计算奠定坚实基础。无论是在移动端的智能应用开发，还是边缘计算设备的智能任务处理，Mindspore Lite 加载模型的能力都直接影响着整个系统的运行效率与智能化表现，值得我们深入探究其原理、流程与优化策略，接下来就重点解读核心API 及其流程。

本文非Mindspore入门科普文，需要具备一定的Mindspore 知识。

一、模型加载概述

加载的本质就是把模型从文件Buffer 转为Mindspore 后续推理时所需要的模型的相关对象。
CPU 方式直接加载的话就是直接通过本地设备的CPU完成这些工作，这些作为推理的输入直接使用；而通过NNRT 的话就是在CPU完成这第一步加载后，再把转换完成后的输出作为输入通过Delegate 模式再次进行转换，转为NNRT 所需要的模型的相关对象，再把这些NNRT的对象通过NNRT传递到NNRT HOST 进而传递到NPU中进行运算。

二、核心数据结构

Model 由LiteGraph 呈现，LiteGraph 保存着所有的Tensor列表、Node列表、SubGrapha列表和输出、输入的索引，LiteGraph 包含着Node、和SubGrapha，相当于所有的子结构信息都保存到LiteGraph中，每个子结构只保存各自的索引数据，计算后再通过索引从LiteGraph中获取得到对应的数据。图由多个Node构成，每一个Node 承担一个运算操作。比如一个计算图有两个节点NodeA（执行加法操作）和NodeB（执行乘法操作，输入来自NodeA的输出），NodeA 输出张量生成的索引将被记录在output_indices_ 表示这个节点的输出Tensor,NodeB 就使用NodeA 的输出索引作为输入以便获取计算所需的数据。

struct MS_API LiteGraph {struct Node {std::string name_;std::string op_type_;int node_type_;const void *primitive_ = nullptr;std::shared_ptr<void> base_operator_ = nullptr;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;int quant_type_;int device_type_ = -1;};struct SubGraph {std::string name_;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;std::vector<uint32_t> node_indices_;std::vector<uint32_t> tensor_indices_;};std::string name_;std::string version_;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;std::vector<mindspore::schema::Tensor *> all_tensors_;std::vector<Node *> all_nodes_;std::vector<SubGraph *> sub_graphs_;std::string ToString() const;
};struct MS_API Model {LiteGraph graph_;char *buf = nullptr;size_t buf_size_ = 0;LiteModelType model_type_ = mindspore::lite::ModelType_MSLite;void *deobf = nullptr;/// \brief Static method to create a Model pointer.static Model *Import(const char *model_buf, size_t size);/// \brief Static method to create a Model pointer.static Model *Import(const char *filename);/// \brief  method to export model to file.static int Export(Model *model, const char *filename);/// \brief  method to export model to buffer.static int Export(Model *model, char *buf, size_t *size);/// \brief Free meta graph temporary buffervirtual void Free() = 0;/// \brief Free all temporary buffer.EG: nodes in the model.virtual void Destroy() = 0;/// \brief Model destruct, free all memoryvirtual ~Model() = default;
};
Struct LiteGraph{struct Node {std::string name_;std::string op_type_;int node_type_;const void *primitive_ = nullptr;std::shared_ptr<void> base_operator_ = nullptr;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;int quant_type_;int device_type_ = -1;};struct SubGraph {std::string name_;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;std::vector<uint32_t> node_indices_;std::vector<uint32_t> tensor_indices_;};std::string name_;std::string version_;std::vector<uint32_t> input_indices_;std::vector<uint32_t> output_indices_;std::vector<mindspore::schema::Tensor *> all_tensors_;std::vector<Node *> all_nodes_;std::vector<SubGraph *> sub_graphs_;std::string ToString() const;
}
class MS_API LiteModel : public Model {...
}

三、模型加载核心流程

在这里插入图片描述未完待续…

鸿蒙进阶——Mindspore Lite AI框架源码解读之模型加载详解(一)

文章大纲引言一、模型加载概述二、核心数据结构三、模型加载核心流程引言 Mindspore 是一款华为开发开源的AI推理框架，而Mindspore Lite则是华为为了适配在移动终端设备上运行专门定制的版本，使得我们可以在OpenHarmony快速实现模型加载和推理等功能&…...

编程日记 2026/2/1 21:27:52

【数据结构】图论核心算法解析：深度优先搜索（DFS）的纵深遍历与生成树实战指南

深度优先搜索导读：从广度到深度，探索图的遍历奥秘一、深度优先搜索二、算法思路三、算法逻辑四、算法评价五、深度优先生成树六、有向图与无向图结语：深潜与回溯，揭开图论世界的另一面导读：从广度到深度，…...

编程日记 2026/2/8 1:25:05

Mysql数据库索引，事务

Mysql数据库索引，事务一.索引简介索引是数据库中用于提高查询效率的一种数据结构，它通过预先排序和存储特定列的值，帮助数据库快速定位符合条件的数据行，避免全表扫描。以下是关于索引的核心简介： 1. 核心作用…...

编程日记 2025/10/17 1:27:52

RESTful APInahamcon Fuzzies-write-up

RESTful API 路径详解 RESTful API（Representational State Transfer）是一种基于 HTTP 协议的 API 设计风格，它通过 URL 路径和 HTTP 方法（GET、POST、PUT、DELETE 等）来定义资源的访问方式。它的核心思想是将数据…...

编程日记 2026/2/3 14:05:14

安装DockerDocker-Compose

Docker 1、换掉关键文件 vim /etc/yum.repos.d/CentOS-Base.repo ▽ [base] nameCentOS-$releasever - Base - Mirrors Aliyun baseurlhttp://mirrors.aliyun.com/centos/$releasever/os/$basearch/ gpgcheck1 enabled1 gpgkeyhttp://mirrors.aliyun.com/centos/RPM-GPG-KEY-C…...

编程日记 2026/1/23 5:46:39

2025年机械化设计制造与计算机工程国际会议（MDMCE 2025）

2025年机械化设计制造与计算机工程国际会议（MDMCE 2025） 2025 International Conference on Mechanized Design, Manufacturing, and Computer Engineering 一、大会信息会议简称：MDMCE 2025 大会地点：中国贵阳审稿通知&#…...

编程日记 2026/2/1 21:46:50

Java生态中的NLP框架

Java生态系统中提供了多个强大的自然语言处理(NLP)框架，以下是主要的NLP框架及其详细说明： 1、Apache OpenNLP 简介：Apache OpenNLP是Apache软件基金会的开源项目，提供了一系列常用的NLP工具。主要功能： …...

编程日记 2026/2/1 5:59:04

NVM,Node.Js 管理工具

node_mirror: https://npmmirror.com/mirrors/node/ npm_mirror: https://npmmirror.com/mirrors/npm/ 一、什么是 NVM？ NVM 是一个命令行工具，允许你在同一台机器上安装、切换和管理多个 Node.js 版本，解决项目间版本冲突问题。二、安装 …...

编程日记 2026/1/27 6:48:47

Jmeter逻辑控制器、定时器

目录一、Jmeter逻辑控制器 ①IF(如果)控制器作用： 位置： 参数介绍： 步骤： ②循环控制器作用： 位置： 步骤： 线程组属性VS循环控制器 ③ForEach控制器作用： 位置&am…...

编程日记 2026/2/2 1:17:21

每日八股文6.2

每日八股-6.2 Go1.GMP调度原理（这部分多去看看golang三关加深理解）2.GC（同样多去看看golang三关加深理解）3.闭包4.go语言函数是一等公民是什么意思5.sync.Mutex和sync.RWMutex6.sync.WaitGroup7.sync.Cond8.sync.Pool9.panic和rec…...

编程日记 2026/1/21 15:34:33

R3GAN利用配置好的Pytorch训练自己的数据集

简介简介：这篇论文挑战了"GANs难以训练"的广泛观点，通过提出一个更稳定的损失函数和现代化的网络架构，构建了一个简洁而高效的GAN基线模型R3GAN。作者证明了通过合适的理论基础和架构设计，GANs可以稳定训练并达到优异性能。论文题目：The GAN is dead; long l…...

编程日记 2026/2/1 9:22:38

吴恩达机器学习笔记（1）—引言

目录一、欢迎二、机器学习是什么三、监督学习四、无监督学习一、欢迎机器学习是当前信息技术领域中最令人兴奋的方向之一。在这门课程中，你不仅会学习机器学习的前沿知识，还将亲手实现相关算法，从而深入理解其内部机理。事实上&…...

编程日记 2026/1/29 19:21:00

信贷风控规则策略累计增益lift测算

在大数据风控业务实践过程中，目前业内主要还是采用规则叠加的办法做策略，但是会遇到一些问题： 1.我们有10条规则，我上了前7条后，后面3条的绝对风险增益是多少？ 2.我的规则之间应该做排序吗，最重…...

编程日记 2025/12/13 22:41:57

【笔记】Windows 部署 Suna 开源项目完整流程记录

#工作记录因篇幅有限，所有涉及处理步骤的详细处理办法请参考文末资料。 Microsoft Windows [Version 10.0.27868.1000] (c) Microsoft Corporation. All rights reserved.(suna-py3.12) F:\PythonProjects\suna>python setup.py --admin███████╗██╗…...

编程日记 2026/2/2 0:12:52

【Elasticsearch】Elasticsearch 核心技术（一）：索引

Elasticsearch 核心技术（一）：索引 1.索引的定义2.索引的命名规范3.索引的增、删、改、查3.1 创建索引3.1.1 创建空索引 3.2 删除索引3.3 文档操作3.3.1 添加/更新文档（指定ID）3.3.2 添加文档（自动生成ID&am…...

编程日记 2026/2/5 4:18:13

AudioTrack的理解

采样率说的是一秒钟采样多少点波形频率说的是一个采样周期内有多少个波形 pcm编码说的是 16 还是8 直接决定write的时候使用short还是byte ‌一、初始化配置 ‌参数设定‌ 需定义音频格式、采样率及缓冲区大小，确保符合硬件支持范围 // 音频参数配置 int sample…...

编程日记 2025/12/21 6:53:36

HTTP请求与HTTP响应介绍及其字段

HTTP请求请求行：请求行主要包含请求方法、请求URI（统一资源标识符）和HTTP协议版本。例如： GET /index.html HTTP/1.1 请求头（Headers）：包含客户端的元数据，为服务器提供了额外信息…...

编程日记 2025/11/27 2:38:12

Fullstack 面试复习笔记：操作系统 / 网络 / HTTP / 设计模式梳理

Fullstack 面试复习笔记：操作系统 / 网络 / HTTP / 设计模式梳理面试周期就是要根据JD调整准备内容（挠头），最近会混合复习针对全栈这块的内容，目前是根据受伤的JD，优先选择一些基础的操作系统、Java、Nod…...

编程日记 2026/2/5 4:36:26

中科院报道铁电液晶：从实验室突破到多场景应用展望

2020年的时候，相信很多关注科技前沿的朋友都注意到，中国科学院一篇报道聚焦一项有望改写显示产业格局的新技术 —— 铁电液晶（FeLC）。这项被业内称为 "下一代显示核心材料" 的研究，究竟取得了哪些实质性进展…...

编程日记 2026/2/5 4:31:28

智慧政务标准规范介绍：构建高效、协同的政务信息体系

在当今信息化快速发展的时代，智慧政务作为政府数字化转型的重要方向，正逐步改变着政府管理和服务的方式。为了确保智慧政务系统的建设能够有序、高效地进行，国家制定了一系列标准规范，其中GB∕T 21062系列标准《政务信息资源交换体…...

编程日记 2026/2/5 4:22:00

6个月Python学习计划 Day 12 - 字符串处理文件路径操作

第一周 Day 1 - Python 基础入门 & 开发环境搭建 Day 2 - 条件判断、用户输入、格式化输出 Day 3 - 循环语句 range 函数 Day 4 - 列表 & 元组基础 Day 5 - 字典（dict）与集合（set） Day 6 - 综合实战：学生信息…...

编程日记 2025/11/15 15:03:06

CSS篇-3

1. CSS 中哪些样式可以继承？哪些不可以继承？可继承的样式：与字体相关的样式，如：font-size、font-family、color 列表样式：list-style（如 UL、OL 的 list-style-type）不可继承的样式：与布局和尺寸相关的样式，如：border、padding、margin、width、height 总结： …...

编程日记 2025/10/9 17:57:59

Unity使用Lua框架和C#框架开发游戏的区别

在Unity中使用Lua框架和C#框架开发游戏有显著的区别，主要体现在性能、开发效率、热更新能力、维护成本等方面。 1. 语言类型与设计目标维度LuaC#类型动态类型、解释型脚本语言静态类型、编译型面向对象语言设计初衷轻量级嵌入、配置和扩展宿主程序通用开发&#…...

编程日记 2025/12/26 13:55:54

Go开发简历优化指南

一、简历格式与排版 （一）简洁至上去除多余装饰：在 Go 后台开发简历中，应摒弃那些花哨却无实际作用的元素，比如复杂的封面、页眉、页脚等。设想招聘人员每日要处理大量简历，若你的简历有繁杂的封面设计&a…...

编程日记 2026/1/11 12:32:48

手机照片太多了存哪里？

手机相册里塞满了旅行照片、生活碎片，每次清理都舍不得删？NAS——一款超实用的存储方案，让你的回忆安全又有序～ 1️⃣自动备份解放双手手机 / 电脑 / 相机照片全自动同步到 NAS，再也不用手动传文件 2️⃣远程访问像…...

编程日记 2026/2/7 11:19:46

【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization

论文信息论文标题：SecAlign: Defending Against Prompt Injection with Preference Optimization - CCS 25 论文作者： Sizhe Chen - UC Berkeley ；Meta, FAIR 论文链接：https://arxiv.org/abs/2410.05451 代码链接：h…...

编程日记 2025/11/28 3:14:01

IP Search Performance Tests dat/db/xdb/mmdb 结构性能差异对比

IP Search Performance Tests qqzeng-ip by 2025-06-01 测试环境： BenchmarkDotNet v0.15.0 macOS Sequoia 15.5 (24F74) [Darwin 24.5.0] Apple M4 Max, 1 CPU, 14 logical and 14 physical cores .NET SDK 10.0.100-preview.4.25258.110 [Host]: .NET…...

编程日记 2025/11/14 6:35:13

OpenRouter使用指南

OpenRouter 是一个专注于大模型（LLM）API 聚合和路由的服务平台，旨在帮助开发者便捷地访问多种主流大语言模型（如 GPT-4、Claude、Llama 等），并提供统一的接口、成本优化和智能路由功能。以下是它的核心功能…...

编程日记 2026/2/5 13:40:24

Linux 中 m、mm、mmm 函数和 make 的区别

在 Linux 内核开发和 Android 开发中，构建系统通常使用 make 命令来编译和构建项目。而在 Android 开发环境中，还有 m、mm 和 mmm 等命令，这些命令是 Android 构建系统的一部分，提供了更高效和便捷的构建方式。以下将详细介绍这些…...

编程日记 2026/1/4 13:33:21

【MAC】YOLOv8/11/12 转换为 CoreML 格式并实现实时目标检测

在本文中，我们将详细介绍如何将 YOLOv8/11/12 模型转换为 CoreML 格式，并使用该模型在摄像头实时检测中进行目标检测。主要适用于M1、M2、M3、M4芯片的产品。以下教程在YOLOv8/11/12均适用，此处就以 YOLOv11 举例目录前提条件YOLOv8/11/12 转换为 CoreML实时目标检测结论…...

编程日记 2026/2/4 6:11:30

文章大纲

引言

一、模型加载概述

二、核心数据结构

三、模型加载核心流程

相关文章：