当前位置：首页 > news >正文

Windows系统下MMDeploy预编译包的使用

news 2025/12/23 7:01:00

Windows系统下MMDeploy预编译包的使用

MMDeploy步入v1版本后安装/使用难度大幅下降，这里以部署MMDetection项目的Faster R-CNN模型为例，将PyTorch模型转换为ONNX进而转换为Engine模型，部署到TensorRT后端，实现高效推理，主要参考了官方文档。

说明：制作本教程时，MMDeploy版本是v1.2.0

本机环境

Windows 11
Powershell 7
Visual Studio 2019
CUDA版本：11.7
CUDNN版本：8.6
Python版本：3.8
PyTorch版本：1.13.1
TensorRT版本：v8.5.3.1
mmdeploy版本：v1.2.0
mmdet版本：v3.0.0

1. 准备环境

每一步网上教程比较多，不多描述

安装Visual Studio 2019，勾选C++桌面开发，一定要选中Win10 SDK，貌似现在还不支持VS2022
安装CUDA&CUDNN
- 注意版本对应关系
- 一定要先安装VS2019，否则visual studio Integration无法安装成功，后面会报错
- 默认安装选项即可，如果不是默认安装，一定要勾选visual studio Integration

Anaconda3/MiniConda3

安装完毕后，创建一个环境

conda create -n faster-rcnn-deploy python=3.8 -y
conda activate faster-rcnn-deploy

安装GPU版本的PyTorch

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

安装OpenCV-Python
```
pip install opencv-python
```

2. 安装TensorRT

登录官网下载即可，这里直接给出我用的链接

https://developer.nvidia.com/downloads/compute/machine-learning/tensorrt/secure/8.5.3/zip/TensorRT-8.5.3.1.Windows10.x86_64.cuda-11.8.cudnn8.6.zip

下载完成后，解压，进入解压的文件夹

新建一个用户/系统变量TENSORRT_DIR，值为当前目录
然后重启powershell，激活环境，此时可用$env:TENSORRT访问TensorRT安装目录
将$env:TENSORRT_DIR\lib加入PATH路径
然后重启powershell，激活环境

安装对应python版本的wheel包

pip install $env:TENSORRT_DIR\python\tensorrt-8.5.3.1-cp38-none-win_amd64.whl

安装pycuda
```
pip install pycuda
```

3. 安装mmdeploy及runtime

mmdeploy：模型转换API

runtime：模型推理API

pip install mmdeploy==1.2.0
pip install mmdeploy-runtime-gpu==1.2.0

4. 克隆MMDeploy仓库

新建一个文件夹，后面所有的仓库/文件均放在此目录下

克隆mmdeploy仓库主要是需要用到里面的配置文件

git clone -b main https://github.com/open-mmlab/mmdeploy.git

5. 安装MMDetection

需要先安装MMCV：

pip install -U openmim
mim install "mmcv>=2.0.0rc2"

克隆并编译安装mmdet：

git clone https://github.com/open-mmlab/mmdetection.git
cd mmdetection
git checkout v3.0.0
pip install -v -e .
cd ..

4. 进行转换

文件目录如下：

./faster-rcnn-deploy/
├── app.py
├── checkpoints
├── convert.py
├── infer.py
├── mmdeploy
├── mmdeploy_model
├── mmdetection
├── output_detection.png
└── tmp.py

部署配置文件：mmdeploy/configs/mmdet/detection/detection_tensorrt-fp16_dynamic-320x320-1344x1344.py
模型配置文件：mmdetection/configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py
模型权重文件：checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth，这里是用的openmmlab训练好的权重，粘贴到浏览器，或者可以通过windows下的 wget 下载：
```
wget -P checkpoints https://download.openmmlab.com/mmdetection/v2.0/faster_rcnn/faster_rcnn_r50_fpn_1x_coco/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth
```
测试图片文件：mmdetection/demo/demo.jpg
保存目录：mmdeploy_model/faster-rcnn-deploy-fp16

convert.py内容如下：

from mmdeploy.apis import torch2onnx
from mmdeploy.apis.tensorrt import onnx2tensorrt
from mmdeploy.backend.sdk.export_info import export2SDK
import osimg = "mmdetection/demo/demo.jpg"
work_dir = "mmdeploy_model/faster-rcnn-deploy-fp16"
save_file = "end2end.onnx"
deploy_cfg = "mmdeploy/configs/mmdet/detection/detection_tensorrt-fp16_dynamic-320x320-1344x1344.py"
model_cfg = "mmdetection/configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py"
model_checkpoint = "checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth"
device = "cuda"# 1. convert model to IR(onnx)
torch2onnx(img, work_dir, save_file, deploy_cfg, model_cfg, model_checkpoint, device)# 2. convert IR to tensorrt
onnx_model = os.path.join(work_dir, save_file)
save_file = "end2end.engine"
model_id = 0
device = "cuda"
onnx2tensorrt(work_dir, save_file, model_id, deploy_cfg, onnx_model, device)# 3. extract pipeline info for sdk use (dump-info)
export2SDK(deploy_cfg, model_cfg, work_dir, pth=model_checkpoint, device=device)

运行结果：

[08/30/2023-17:36:13] [TRT] [I] [MemUsageChange] TensorRT-managed allocation in building engine: CPU +84, GPU +109, now: CPU 84, GPU 109 (MiB)

5. 推理测试

infer.py内容如下：

from mmdeploy.apis import inference_modeldeploy_cfg = "mmdeploy/configs/mmdet/detection/detection_tensorrt-fp16_dynamic-320x320-1344x1344.py"
model_cfg = "mmdetection/configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py"
backend_files = ["mmdeploy_model/faster-rcnn-fp16/end2end.engine"]
img = "mmdetection/demo/demo.jpg"
device = "cuda"
result = inference_model(model_cfg, deploy_cfg, backend_files, img, device)print(result)

运行结果：

08/30 17:42:43 - mmengine - INFO - Successfully loaded tensorrt plugins from F:\miniconda3\envs\faster-rcnn-deploy\lib\site-packages\mmdeploy\lib\mmdeploy_tensorrt_ops.dll
08/30 17:42:43 - mmengine - INFO - Successfully loaded tensorrt plugins from F:\miniconda3\envs\faster-rcnn-deploy\lib\site-packages\mmdeploy\lib\mmdeploy_tensorrt_ops.dll
...
...

inference_model每调用一次就会加载一次模型，效率很低，只是用来测试模型可用性，不能用在生产环境。要高效使用模型，可以集成Detector到自己的应用程序里面，一次加载，多次推理。如下：

6. 集成检测器到自己的应用中

app.py内容如下：

from mmdeploy_runtime import Detector
import cv2# 读取图片
img = cv2.imread("mmdetection/demo/demo.jpg")# 创建检测器
detector = Detector(model_path="mmdeploy_model/faster-rcnn-deploy-fp16",device_name="cuda",device_id=0,
)
# 执行推理
bboxes, labels, _ = detector(img)
# 使用阈值过滤推理结果，并绘制到原图中
indices = [i for i in range(len(bboxes))]
for index, bbox, label_id in zip(indices, bboxes, labels):[left, top, right, bottom], score = bbox[0:4].astype(int), bbox[4]if score < 0.3:continuecv2.rectangle(img, (left, top), (right, bottom), (0, 255, 0))cv2.imwrite("output_detection.png", img)

调用这个API可以将训练的深度学习模型无缝集成到web后端里面，一次加载，多次推理

原图：

demo
推理检测后：

Windows系统下MMDeploy预编译包的使用

Windows系统下MMDeploy预编译包的使用 MMDeploy步入v1版本后安装/使用难度大幅下降，这里以部署MMDetection项目的Faster R-CNN模型为例，将PyTorch模型转换为ONNX进而转换为Engine模型，部署到TensorRT后端，实现高效推理&#xff0c…...

编程日记 2023/8/31 6:47:30

yolov5自定义模型训练二

前期准备好了用于训练识别是否有火灾的数据集后就可以开始修改yolo相关文件来进行训练数据集放到yolov5目录里在data目录下新建yaml文件设置数据集信息如下在model文件夹下新增新的model文件开始训练训练出错确认后是对训练数据集文件夹里的文件名字有要求，原…...

编程日记 2023/8/31 6:46:28

Spring框架获取用户真实IP（注解式）

文章目录一、最终使用效果（ClientIp 注解获取）二、实现代码1.注解2.方法参数解析器（Resolver）3.全局增加Resolver配置 Spring 框架没有现成工具可以方便提取客户端的IP地址，普遍做法就是通过 HttpServletRequest 的 g…...

编程日记 2023/8/31 6:45:26

利用 IDEA IDE 的轻量编辑模式快速查看和编辑工程外的文本文件

作为程序员, 我们都知道 IDE 的很好用的, 它的文本编辑器功能也非常的强大, 用起来非常便捷. 在长年累月的使用中, 我们也变得对其非常熟悉, 以致于使用起其它简单地轻量级的文本编辑器来, 比如什么记事本, Notepad, UltraEdit 等等呀, 觉得既不方便又不熟悉. 关键是很多的操作…...

编程日记 2023/8/31 6:44:25

MyBatisx代码生成 1.创建数据库表 CREATE TABLE sys_good (good_id int(11) NOT NULL,good_name varchar(255) COLLATE utf8mb4_general_ci DEFAULT NULL,good_desc varchar(255) COLLATE utf8mb4_general_ci DEFAULT NULL,PRIMARY KEY (good_id) ) ENGINEInnoDB DEFAULT CHA…...

编程日记 2023/8/31 6:43:23

【日记】文章更新计划

首发博客地址[1] 状态这两天也没加班，也没干什么活。不知道怎么回事，到家就想睡觉。所以这两天睡得很早，基本上 11 点之前就睡了，文章也就鸽了两天。计划今早起来感觉还是要自律，我写文章的初衷是为了学习。基于这个…...

编程日记 2023/8/31 6:42:23

UML用例图三种关系（重点）-架构真题（十七）

某项目包括A、B、C、D四道工序，各道工序之间的衔接关系、正常进度下各工序所需的时间和直接费用、赶工进度下所需的时间和直接费用如下表所示。该项目每天需要间接费用为4.5万元，根据此表，最低成本完成需要（）天。&…...

编程日记 2023/8/31 6:41:21

分层解耦介绍

三层架构 Controller：控制层，接受前端发送的请求，对请求进行处理，并响应数据 service：业务逻辑层，处理具体业务逻辑 dao：数据访问层，负责数据访问操作，包括数据的增、删、…...

编程日记 2023/8/31 6:40:21

Nginx百科之gzip压缩、黑白名单、防盗链、零拷贝、跨域、双机热备

引言早期的业务都是基于单体节点部署，由于前期访问流量不大，因此单体结构也可满足需求，但随着业务增长，流量也越来越大，那么最终单台服务器受到的访问压力也会逐步增高。时间一长，单台服务器性能无法跟上业…...

编程日记 2023/8/31 6:39:20

git通过fork-merge request实现多人协同

一、问题对于一个项目，如果需要多人协同开发，大家都在原始仓库中进行修改提交，经常会发生冲突，而且一不小心会把别人的代码内容覆盖掉。为了避免这样的问题，git提供了fork-merge request这样的协同方式。二、仓库框…...

编程日记 2023/8/31 6:38:19

元素居中的方法总结

目录垂直居中行内元素垂直居中单行文本垂直居中 1.line-height: 200px; 多行文本垂直居中 1.tablevertical-align:middle 块级元素垂直居中 1.display: flex;align-items: center; 2.使用position top margin-top 水平居中行内元素水平居中 1.text-align:cente…...

编程日记 2023/8/31 6:37:17

后端面试话术集锦第一篇：spring面试话术

这是后端面试集锦第一篇博文——spring面试话术❗❗❗ 1. 介绍一下spring 关于spring，我们平时做项目一直都在用，不管是使用ssh还是使用ssm，都可以整合。 Spring主要就三点，也就是核心思想： IOC控制反转 DI依赖注入 AOP切面编程我先说说IOC吧，IOC就是spring里的控制反…...

编程日记 2023/8/31 6:36:16

elasticsearch8.9.1集群搭建

目录 1.官网文档 2.安装步骤 2.1 环境准备 2.2 添加用户 2.3 修改文件profile文件 2.4 修改elasticsearch.yml 2.5 修改 sysctl.conf 3.启动 3.1 切换到kibana 3.2 启动elasticsearch 3.3 启动kibana 3.4 验证节点情况 1.官网文档 elasticsearch文档：ht…...

编程日记 2023/8/31 6:35:14

前端调用电脑摄像头

项目中需要前端调用，所以做了如下操作先看一下效果吧主要是基于vue3，通过canvas把画面转成base64的形式，然后是把base64转成 file文件，最后调用了一下上传接口以下是代码进入页面先调用一下摄像头 navigator.mediaDevices.ge…...

编程日记 2023/8/31 6:34:14

网络编程day1——进程间通信-socket套接字

基本特征：socket是一种接口技术，被抽象了一种文件操作，可以让同一计算机中的不同进程之间通信，也可以让不同计算机中的进程之间通信(网络通信) 本地进程间通信编程模型： 进程A …...

编程日记 2023/8/31 6:33:13

Android-关于页面卡顿的排查工具与监测方案

作者：一碗清汤面前言关于卡顿这件事已经是老生常谈了，卡顿对于用户来说是敏感的，容易被用户直接感受到的。那么究其原因，卡顿该如何定义，对于卡顿的发生该如何排查问题，当线上用户卡顿时，在线…...

编程日记 2023/8/31 6:32:12

VueX 与Pinia 一篇搞懂

VueX 简介 Vue官方：状态管理工具状态管理是什么需要在多个组件中共享的状态、且是响应式的、一个变，全都改变。例如一些全局要用的的状态信息：用户登录状态、用户名称、地理位置信息、购物车中商品、等等这时候我们就需要这么一个工…...

编程日记 2023/8/31 6:31:11

指针与空间按钮的交互

文章目录原理案例：“直线指针”和“点击按钮”的交互1、效果2、步骤原理指针不能直接和空间按钮交互，得借助一个中间层——分发器——它分发指针的进入、退出、选择事件，空间按钮自动监听这些事件案例：“直线指针”和“点击…...

编程日记 2023/8/31 6:30:10

java八股文面试[数据库]——慢查询优化

编程日记 2023/8/31 6:29:09

《Flink学习笔记》——第十章容错机制

10.1 检查点（Checkpoint） 为了故障恢复，我们需要把之前某个时间点的所有状态保存下来，这份“存档”就是“检查点” 遇到故障重启的时候，我们可以从检查点中“读档”，恢复出之前的状态，这样就可以…...

编程日记 2023/8/31 6:28:08

Mac软件卸载指南，简单易懂！

刚和Adobe分手，它却总在Library里给你写"回忆录"？卸载的Final Cut Pro像电子幽灵般阴魂不散？总是会有残留文件，别慌！这份Mac软件卸载指南，将用最硬核的方式教你"数字分手术"&#xff0…...

编程新知 2025/12/14 10:18:18

DBAPI如何优雅的获取单条数据

API如何优雅的获取单条数据案例一对于查询类API，查询的是单条数据，比如根据主键ID查询用户信息，sql如下： select id, name, age from user where id #{id}API默认返回的数据格式是多条的，如下： {&qu…...

编程新知 2025/12/16 5:19:07

让AI看见世界：MCP协议与服务器的工作原理

让AI看见世界：MCP协议与服务器的工作原理 MCP（Model Context Protocol）是一种创新的通信协议，旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天，MCP正成为连接AI与现实世界的重要桥梁。…...

编程新知 2025/12/12 7:41:41

Yolov8 目标检测蒸馏学习记录

yolov8系列模型蒸馏基本流程，代码下载：这里本人提交了一个demo:djdll/Yolov8_Distillation: Yolov8轻量化_蒸馏代码实现在轻量化模型设计中，**知识蒸馏（Knowledge Distillation）**被广泛应用，作为提升模型…...

编程新知 2025/12/14 3:26:26

C#学习第29天：表达式树（Expression Trees）

目录什么是表达式树？ 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持： 3.性能优化 4.元数据处理 5.代码转换和重写适用场景代码复杂性…...

编程新知 2025/10/20 9:03:01

LRU 缓存机制详解与实现（Java版） + 力扣解决

📌 LRU 缓存机制详解与实现（Java版） 一、📖 问题背景在日常开发中，我们经常会使用缓存（Cache） 来提升性能。但由于内存有限，缓存不可能无限增长，于是需要策略决定&am…...

编程新知 2025/11/28 20:47:33

HubSpot推出与ChatGPT的深度集成引发兴奋与担忧

上周三，HubSpot宣布已构建与ChatGPT的深度集成，这一消息在HubSpot用户和营销技术观察者中引发了极大的兴奋，但同时也存在一些关于数据安全的担忧。许多网络声音声称，这对SaaS应用程序和人工智能而言是一场范式转变。但向任何技…...

编程新知 2025/12/22 16:33:18

从“安全密码”到测试体系：Gitee Test 赋能关键领域软件质量保障

关键领域软件测试的"安全密码"：Gitee Test如何破解行业痛点在数字化浪潮席卷全球的今天，软件系统已成为国家关键领域的"神经中枢"。从国防军工到能源电力，从金融交易到交通管控，这些关乎国计民生的关键领域…...

编程新知 2025/12/22 10:49:37

华为OD机试-最短木板长度-二分法(A卷,100分)

此题是一个最大化最小值的典型例题， 因为搜索范围是有界的，上界最大木板长度补充的全部木料长度，下界最小木板长度； 即left0,right10^6; 我们可以设置一个候选值x(mid)，将木板的长度全部都补充到x，如果成功…...

编程新知 2025/12/22 9:00:10

SQL注入篇-sqlmap的配置和使用

在之前的皮卡丘靶场第五期SQL注入的内容中我们谈到了sqlmap，但是由于很多朋友看不了解命令行格式，所以是纯手动获取数据库信息的接下来我们就用sqlmap来进行皮卡丘靶场的sql注入学习，链接：https://wwhc.lanzoue.com/ifJY32ybh6vc…...

编程新知 2025/12/22 17:52:30

Windows系统下MMDeploy预编译包的使用

本机环境

1. 准备环境

2. 安装TensorRT

3. 安装mmdeploy及runtime

4. 克隆MMDeploy仓库

5. 安装MMDetection

4. 进行转换

5. 推理测试

6. 集成检测器到自己的应用中

相关文章：