当前位置：首页 > news >正文

使用MMDeploy（预编译包）转换MMxx(MMDeploy支持库均可)pth权重到onnx，并使用python SDK进行部署验证

news 2025/7/18 7:38:04

MMDeploy使用python部署实践记录

准备工作空间
所需环境配置
使用MMDeploy得到onnx
使用MMDeploy加载onnx模型对单张图片进行推理
使用python SDK对onnx模型进行验证

注意
mmdeploy C++ SDK的使用部署和实际操作过程请看本人另外一篇博文使用MMDeploy（预编译包）转换MMxx(MMDeploy支持库均可)pth权重到onnx，并使用C++ SDK加载onnx得到dll动态链接库，实现在windows平台中调用（linux也适用）

准备工作空间

为了更好地说明本文需要的环境配置等，现指出一个具体的工作空间和其中包含的各种文件

# 一个具体的工作空间目录构成如下
工作空间根目录
--------work_space
包含的子目录和文件
----------------checkpoints(保存使用MMxx系列仓库训练得到的pth权重)
----------------configs(保存使用MMxx系列仓库训练使用的pipeline对应的configs配置文件)
----------------images(保存用于测试onnx推理是否成功的图片文件夹)
----------------mmdeploy(使用git clone xxx命令得到的mmdeploy源码仓库，主要为了使用其中的mmdeploy)
----------------mmdeploy-0.14.0-windows-amd64-cuda11.3(下载的预编译版本的mmdeploy包)
----------------work_dir(用于保存mmdeploy生成的onnx文件及其他文件，相当于结果文件夹)
----------------python_torch2onnx.py(用于将pth权重文件转换为onnx文件的py脚本，自己创建，后续会有demo代码示例)
----------------python_onnx_inference.py(用于测试onnx的推理py脚本，自行创建，后续会有demo代码示例)

所需环境配置

安装anaconda，并创建虚拟环境，本文所需环境均已通过测试

# ----------------安装conda基础环境
conda create -n your_env_name python=3.7 
conda activate your_env_name# ---------------查看本机cuda版本（nvidia-smi显卡驱动中cuda版本）
nvidia-smi （打印出来的表格右上方可见）
example:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 527.54       Driver Version: 527.54       CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ... WDDM  | 00000000:01:00.0  On |                  N/A |
| N/A   52C    P8    18W / 136W |    119MiB / 16384MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
+-----------------------------------------------------------------------------+# -----注意安装的cuda运行时版本应当小于或等于显卡驱动中cuda版本
# -----本机显卡驱动版本为12.0，我安装的是pytorch1.10.1_cudan11.3_cudnn8这个版本
conda install pytorch==1.10.1 torchvision==0.11.2 torchaudio==0.10.1 cudatoolkit=11.3 -c pytorch -c conda-forge

准备MMDeploy环境

# 首先，安装MMCV-FULL，通过MIM安装MMCV
pip install -U openmim
mim install mmcv-full# 然后，下载预编译版本的mmdeploy，这里我选择了“mmdeploy-0.14.0-windows-amd64-cuda11.3” release来安装
# 对应网址为：https://github.com/open-mmlab/mmdeploy/releases/tag/v0.14.0
# 或者直接访问该链接启动下载：https://github.com/open-mmlab/mmdeploy/releases/download/v0.14.0/mmdeploy-0.14.0-windows-amd64-cuda11.3.zip# ---------在当前工作空间下的windows power shell中运行命令：git clone https://github.com/open-mmlab/mmdeploy.git，将mmdeploy仓库源码保存到工作空间（主要是为了使用其中的configs文件夹下的配置文件，后面会有介绍）# 然后，安装mmdeploy 0.14.0版本
pip install mmdeploy==0.14.0# 安装mmdeploy_python 0.14.0版本
pip install mmdeploy-python==0.14.0# 安装onnxruntime
pip install onnxruntime# 进入刚刚下载好的mmdeploy预编译包目录/path/to/mmdeploy-0.14.0-windows-amd64-cuda11.3/下
将路径：path/to/mmdeploy-0.14.0-windows-amd64-cuda11.3/thirdparty/onnxruntime/lib添加到本机系统环境变量# 然后，重启windows power shell使环境变量生效，可以通过 echo $env:PATH 来检查环境变量是否设置成功。

使用MMDeploy得到onnx

准备MMxx系列仓库的configs和pth文件（举例：使用mmdetection中configs下面的配置文件“faster-rcnn_r50_fpn_2x_coco.py”，然后经过训练之后得到的权重为latest.pth，分别将其放入到上述工作空间的configs文件夹和checkpoints文件夹中）；
然后，创建“python_torch2onnx.py”文件，示例代码如下：

from mmdeploy.apis import torch2onnx
from mmdeploy.backend.sdk.export_info import export2SDK# 需要在转换pth到onnx时传入一张图片
img = 'images/demo.jpg'# 保存结果路径的文件夹
work_dir = 'work_dir/onnx/your_model_name'# 注意这里尽量使用mmdeploy原始文档中推荐的end2end.onnx名称，后续加载onnx时，避免一些错误出现
save_file = 'end2end.onnx'# 使用mmdeploy源码仓库中的mmdet对应config文件（如果你使用的mmcls，那么就需要到mmcls下面找到合适的deploy config文件）
deploy_cfg = 'mmdeploy/configs/mmdet/detection/detection_onnxruntime_dynamic.py'# 加载你训练好的模型的config配置文件（这里以“faster-rcnn_r50_fpn_2x_coco.py”举例）
model_cfg = 'configs/faster-rcnn_r50_fpn_2x_coco.py'# 加载使用上述模型配置文件得到的训练权重latest.pth
model_checkpoint = 'checkpoints/latest.pth'# 设置device为cpu
device = 'cpu'# 1. convert model to onnx
torch2onnx(img, work_dir, save_file, deploy_cfg, model_cfg,model_checkpoint, device)# 2. extract pipeline info for sdk use (dump-info)
export2SDK(deploy_cfg, model_cfg, work_dir, pth=model_checkpoint, device=device)

如果一切顺利，你会在/path/to/your/work_space/work_dir/onnx/your_model_name得到如下文件：

deploy.json
detail.json
end2end
pipeline.json

使用MMDeploy加载onnx模型对单张图片进行推理

在工作空间work_space下创建文件“python_onnx_inference.py”，示例代码如下：

from mmdeploy.apis import inference_model# 加载使用git clone 下载的mmdeploy中相关的deploy config文件
deploy_cfg = 'mmdeploy/configs/mmdet/detection/detection_onnxruntime_dynamic.py'# 加载模型权重对应的config文件
model_cfg = 'configs/faster-rcnn_r50_fpn_2x_coco.py'# 设置后端推理使用的onnx模型路径
backend_files = ['work_dir/onnx/your_model_name/end2end.onnx']# 设置后端推理所需的demo图片
img = ['images/demo.jpg']# 设置使用cpu设备
device = 'cpu'# 调用mmdeploy中推理函数接口得到result结果
result = inference_model(model_cfg, deploy_cfg, backend_files, img, device)# 控制台打印得到的results结果
print("result: {}".format(result))

如果一切顺利的话，最后的print()会正常输出。

使用python SDK对onnx模型进行验证

在工作空间work_space下运行如下命令：

python .\mmdeploy\demo\python\object_detection.py cpu .\work_dir\onnx\your_model_name\ .\images\demo.jpg

之后在work_space工作空间目录下会得到demo.jpg对应的推理结果图。

参考资料

https://gitee.com/open-mmlab/mmdeploy/blob/master/docs/zh_cn/02-how-to-run/prebuilt_package_windows.md#python-sdk
https://gitee.com/open-mmlab/mmdeploy/blob/master/docs/zh_cn/get_started.md
MMDeploy

2023.4.22 于西安

使用MMDeploy（预编译包）转换MMxx(MMDeploy支持库均可)pth权重到onnx，并使用python SDK进行部署验证

MMDeploy使用python部署实践记录准备工作空间所需环境配置使用MMDeploy得到onnx使用MMDeploy加载onnx模型对单张图片进行推理使用python SDK对onnx模型进行验证注意 mmdeploy C SDK的使用部署和实际操作过程请看本人另外一篇博文使用MMDeploy（预编译包&#xff09…...

编程日记 2023/4/23 9:05:51

Shiro安全框架简介

一、权限管理 1.1 什么是权限管理基本上只要涉及到用户参数的系统都要进行权限管理，使用权限管理实现了对用户访问系统的控制，不同的用户访问不同的资源。按照安全规则或者安全策略控制用户访问资源，而且只能访问被授权的资源权限管理包括认…...

编程日记 2023/5/30 5:56:13

三行Python代码，让数据处理速度提高2到6倍

本文可以教你仅使用 3 行代码，大大加快数据预处理的速度。 Python 是机器学习领域内的首选编程语言，它易于使用，也有很多出色的库来帮助你更快处理数据。但当我们面临大量数据时，一些问题就会显现…… 在默认情况下，…...

编程日记 2023/4/23 8:55:49

// 空间向量模长 #include <stdio.h> #include <stdlib.h> #include <math.h> int main(int argc, char **argv) { float x, y, z; float mochang 0.0; x y z 0.0; if (argc ! 4) { printf("usage:%s x y z\n", argv[1]); …...

编程日记 2023/5/30 5:24:42

活动需求中灵活使用Redis提升生产力

抽奖一堆用户参与进来，然后随机抽取几个幸运用户给予实物/虚拟的奖品；此时，开发人员就需要写上一个抽奖的算法，来实现幸运用户的抽取；其实我们完全可以利用Redis的集合（Set），就能轻…...

编程日记 2023/5/30 5:30:51

Java知识点学习（第16天）

Innodb是如何实现事务的？ innodb通过Buffer Pool，LogBuffer，Redo Log，Undo Log来实现事务，以一个update语句为例： innodb在收到一个update语句后，会先根据条件找到数据所在的页，并…...

编程日记 2023/5/29 20:24:19

ORA-1688: unable to extend table AUDSYS.AUD$UNIFIED

昨晚正在外滩玩，有个客户发过来一段报错，已经影响到业务了。一看就是12C以后版本才有的问题，，赶紧在手机中收到临时解决办法报错如下 ORA-1688: unable to extend table AUDSYS.AUD$UNIFIED partition SYS_P42549 by 1024 in t…...

编程日记 2023/5/30 5:43:13

抖音滑块以及轨迹分析

声明本文以教学为基准、本文提供的可操作性不得用于任何商业用途和违法违规场景。本人对任何原因在使用本人中提供的代码和策略时可能对用户自己或他人造成的任何形式的损失和伤害不承担责任。如有侵权，请联系我进行删除。我们在web端打开用户主页的时候，时不时的会出现滑…...

编程日记 2023/5/30 5:49:20

C#生成单色bmp图片，转为单色bmp图片任意语言完全用字节拼一张单色图，LCD取模其它格式图片转为单色图

最终效果： V1.8.2 20230419 文字生成单色BMP图片4.exe 默认1280*720 如果显示不全，请把宽和高加大字体加大。首先，用windows画板生成一张1*1白色单色图作为标准，数据如下： 数据解析参考：BMP图像文件完…...

编程日记 2023/5/30 3:44:48

【瑞吉外卖】002 -- 后台登录功能开发

本文章为对黑马程序员Java项目实战《瑞吉外卖》的学习记录目录一、需求分析 1、页面原型展示 2、登录页面展示 3、查看登录请求信息 4、数据模型二、代码开发 1、创建实体类Employee，和employee表进行映射 2、创建包结构：（Controller、Se…...

编程日记 2023/5/30 0:40:05

$\lambda _{0}$

【电动汽车充电站有序充电调度的分散式优化】基于蒙特卡诺和拉格朗日的电动汽车优化调度（分时电价调度）（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程日记 2023/5/30 4:54:03

java IO流_1

目录分类字节流 InputStream OutputStream 文件拷贝字符流 FileReader FileWriter 处理流 BufferedReader BufferedWriter 文本拷贝流是从起源到接受的有序数据，通过流的方式允许程序使用相同的方式来访问不同的输入/输出源。分类按数据…...

编程日记 2023/5/30 4:59:35

【回忆总结】我的大学四年

大学四年关键词速览如果穿越回大一，你想对大一的你提什么最重要的建议？同样是上网课，我为何能比大多数同学学的更好？回到学校，我的大二似乎一帆风顺？在不断的迷茫和徘徊中，大三的我做出的决定&…...

编程日记 2023/5/30 5:04:16

深度解析OEKO

【深度解析OEKO】什么是OEKO-TEX Standard 100？ OEKO-TEX Standard 100现在是使用最为广泛的纺织品生态标志。OEKO-TEX Standard 100规定的标准是根据最新的科学知识，对纱线、纤维以及各类纺织品的有害物质含量规定限度。只有按照严格检测和检查程序提供…...

编程日记 2023/5/30 5:09:04

Golang gorm

GORM 指南 | GORM - The fantastic ORM library for Golang, aims to be developer friendly. 一对多入门比如要开发cmdb的系统，无论是硬件还是软件。硬件对应的就是对应的哪个开发在用。或者服务对应的是哪个业务模块在使用，或者应用谁在使用。那么这…...

编程日记 2023/5/30 5:14:07

rk3568 适配摄像头 (CIF协议)

rk3568 适配摄像头 (CIF协议) 在RK3568处理器中，支持CIF协议的摄像头可以通过CSI接口连接到处理器，实现视频数据的采集和处理。同时，RK3568还支持多种图像处理算法和编解码器，可以对采集到的视频数据进行实时处理和压缩&#xff…...

编程日记 2023/5/30 5:19:08

今天面试招了个25K的测试员，从腾讯出来的果然都有两把刷子···

公司前段时间缺人，也面了不少测试，前面一开始瞄准的就是中级的水准，也没指望来大牛，提供的薪资在15-25k，面试的人很多，但平均水平很让人失望。看简历很多都是4年工作经验，但面试中，不…...

编程日记 2023/4/23 7:45:23

Redis---集群环境准备

一、redis集群环境准备 1、部署Redis集群的目的： 多台服务器一起提供数据存储服务； 实现数据的分布式存储； 可以实现服务的高可用； 可用实现数据自动备份； 2、服务器IP地址及端口： 主机名 IP地…...

编程日记 2023/4/23 7:40:21

数据结构考研版——队列的配置问题

一、正常配置下的情况队空状态 frontrear;入队操作出队操作队满状态在正常配置下元素的个数（rear>front） 当rear<front 综上所述用一个表达式表示：(rear-frontmaxSize)%maxSize 二、非正常配置下的情况1 队空状态入队操作…...

编程日记 2023/5/30 9:43:50

【SOAP-WebService系列】SOAP学习笔记

目录 1、SOAP是什么？ 2、SOAP特性 3、SOAP消息组成 4、SOAP调用 5、SOAP和HTTP 1、SOAP是什么？ SOAP(Simple Object Access Protocol，即简单对象访问协议) ，是一个轻量级协议，用于在分散的分布式环境中使用XML在对…...

编程日记 2023/5/30 4:36:36

React 第五十五节 Router 中 useAsyncError的使用详解

前言 useAsyncError 是 React Router v6.4 引入的一个钩子，用于处理异步操作（如数据加载）中的错误。下面我将详细解释其用途并提供代码示例。一、useAsyncError 用途处理异步错误：捕获在 loader 或 action 中发生的异步错误替…...

编程新知 2025/6/18 6:31:56

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2025/7/16 16:43:14

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/7/7 16:55:31

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

强化学习（Reinforcement Learning, RL）是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程，然后使用强化学习的Actor-Critic机制（中文译作“知行互动”机制），逐步迭代求解…...

编程新知 2025/7/16 16:39:17

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

一.自适应梯度算法Adagrad概述 Adagrad（Adaptive Gradient Algorithm）是一种自适应学习率的优化算法，由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率，适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...

编程新知 2025/7/16 5:15:36

ESP32读取DHT11温湿度数据

芯片：ESP32 环境：Arduino 一、安装DHT11传感器库红框的库，别安装错了二、代码注意，DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

编程新知 2025/7/17 22:22:18

P3 QT项目----记事本（3.8）

3.8 记事本项目总结项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

编程新知 2025/7/15 15:37:56

蓝桥杯3498 01串的熵

问题描述对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798， 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

编程新知 2025/7/15 7:51:20