当前位置：首页 > news >正文

记录pytorch实现自定义算子并转onnx文件输出

news 2025/12/29 1:49:26

概览：记录了如何自定义一个算子，实现pytorch注册，通过C++编译为库文件供python端调用，并转为onnx文件输出

整体大概流程：

定义算子实现为torch的C++版本文件
注册算子
编译算子生成库文件
调用自定义算子

一、编译环境准备

1，在pytorch官网下载如下C++的libTorch package，下载完成后解压文件，是一个libtorch文件夹。

2，提前准备好python，以及pytorch

3，本示例使用了opencv库，所以需要提前安装好opencv。

二、自定义算子的实现

1，实现自定义算子函数

在解压后的libtorch文件夹统计目录，实现自定义算子，用opencv库实现的图像投射函数：warp_perspective。warp_perspective函数后面几行就是实现自定义算子的注册

warpPerspective.cpp文件：

#include "torch/script.h"
#include "opencv2/opencv.hpp"torch::Tensor warp_perspective(torch::Tensor image, torch::Tensor warp) {// BEGIN image_matcv::Mat image_mat(/*rows=*/image.size(0),/*cols=*/image.size(1),/*type=*/CV_32FC1,/*data=*/image.data_ptr<float>());// END image_mat// BEGIN warp_matcv::Mat warp_mat(/*rows=*/warp.size(0),/*cols=*/warp.size(1),/*type=*/CV_32FC1,/*data=*/warp.data_ptr<float>());// END warp_mat// BEGIN output_matcv::Mat output_mat;cv::warpPerspective(image_mat, output_mat, warp_mat, /*dsize=*/{ image.size(0),image.size(1) });// END output_mat// BEGIN output_tensortorch::Tensor output = torch::from_blob(output_mat.ptr<float>(), /*sizes=*/{ image.size(0),image.size(1) });return output.clone();// END output_tensor
}
//static auto registry = torch::RegisterOperators("my_ops::warp_perspective", &warp_perspective);  // torch.__version__: 1.5.0torch.__version__ >= 1.6.0  torch/include/torch/library.h
TORCH_LIBRARY(my_ops, m) {m.def("warp_perspective", warp_perspective);
}

2，同级目录创建CMakeList.txt文件

里面需要修改你自己的python下torch的路径，以及你对应安装python版pytorch是cpu还是gpu的。

cmake_minimum_required(VERSION 3.10 FATAL_ERROR)
project(warp_perspective)set(CMAKE_VERBOSE_MAKEFILE ON)
# >>> build type 
set(CMAKE_BUILD_TYPE "Release")				# 指定生成的版本
set(CMAKE_CXX_FLAGS_DEBUG "$ENV{CXXFLAGS} -O0 -Wall -g2 -ggdb")
set(CMAKE_CXX_FLAGS_RELEASE "$ENV{CXXFLAGS} -O3 -Wall")set(TORCH_ROOT "/home/xxx/anaconda3/lib/python3.10/site-packages/torch")   
include_directories(${TORCH_ROOT}/include)
link_directories(${TORCH_ROOT}/lib/)# Opencv
find_package(OpenCV REQUIRED)# Define our library target
add_library(warp_perspective SHARED warpPerspective.cpp)# Enable C++14
target_compile_features(warp_perspective PRIVATE cxx_std_17)# libtorch库文件
target_link_libraries(warp_perspective # CPUc10 torch_cpu# GPU# c10_cuda # torch_cuda)# opencv库文件
target_link_libraries(warp_perspective${OpenCV_LIBS}
)add_definitions(-D _GLIBCXX_USE_CXX11_ABI=0)

3，编译生成库文件

同级目录创建build文件夹，进入build文件夹利用CMakeList.txt进行编译，生成libwarp_perspective.so库文件

mkdir build
cd build
cmake ..
make

4，python版pytorch进行自定义算子的测试

注意我的以上代码都是放在了/data/xxx/mylib路径下，所以torch.ops.load_library("/data/xxx/mylib/build/libwarp_perspective.so")就找到库文件的位置。

这里我随便找了一张图片，和直接用python版的opencv做投射变换的结果作为golden对比。如下分别是原图，golden, 自定义pytorch算子的输出。自定义算子的输出不太对，但是图像轮廓和投射效果是对的，后面有时间我再检查一下是什么原因。

测试代码：

import torch
import cv2
import numpy as nptorch.ops.load_library("/data/xxx/mylib/build/libwarp_perspective.so")im=cv2.imread("/data/xxx/mylib/cat.jpg",0)pst1 = np.float32([[56,65], [368,52], [28,387], [389,390]])
pst2 = np.float32([[100,145], [300,100], [80,290], [310,300]])
#2.2获取透视变换矩阵
T = cv2.getPerspectiveTransform(pst1, pst2)in_data =torch.from_numpy(np.float32(im))
in2_data = torch.Tensor(T)out1=torch.ops.my_ops.warp_perspective(in_data,in2_data)
dst0=np.uint8(out1.numpy())
cv2.imwrite("/data/xxx/mylib/cat_warp.jpg",dst0)dst = cv2.warpPerspective(im, np.float32(T), (im.shape[1], im.shape[0]))
cv2.imwrite("/data/xxx/mylib/cat_warp_gold.jpg",dst)

三、自定义算子导出为onnx文件

将注册的pytorch的自定义算子导出为onnx文件查看，效果图如下：

导出代码文件如下

import torch
import numpy as nptorch.ops.load_library("/data/xxx/mylib/build/libwarp_perspective.so")
class MyNet(torch.nn.Module):def __init__(self, name):super(MyNet, self).__init__()self.model_name = namedef forward(self, in_data, warp_data):return torch.ops.my_ops.warp_perspective(in_data, warp_data)def my_custom(g, in_data, warp_data):return g.op("cus_ops::warp_perspective", in_data, warp_data)
torch.onnx.register_custom_op_symbolic("my_ops::warp_perspective", my_custom, 9)if __name__ == "__main__":net = MyNet("my_ops")in_data = torch.randn((32, 32))warp_data = torch.rand((3, 3))out = net(in_data, warp_data)print("out: ", out)# export onnxtorch.onnx.export(net,(in_data, warp_data),"./my_ops_export_model2.onnx",input_names=["img_data", "warp_mat"],output_names=["out_img"],custom_opsets={"cus_ops": 11},)

记录pytorch实现自定义算子并转onnx文件输出

概览：记录了如何自定义一个算子，实现pytorch注册，通过C编译为库文件供python端调用，并转为onnx文件输出整体大概流程： 定义算子实现为torch的C版本文件注册算子编译算子生成库文件调用自定义算子一、编译环境准备…...

编程日记 2023/11/14 9:59:48

ARPG----C++学习记录04 Section8 角色类，移动

角色类输入新建一个角色C，继承建立蓝图,和Pawn一样，绑定输入移动和相机. 在构造函数中添加这段代码也能实现。打开UsePawnControlRotation就可以让人物不跟随鼠标旋转得到旋转后的向前向量使用旋转矩阵想要前进方向和旋转的方向对应。获取当前控制…...

编程日记 2023/11/14 9:58:46

拆解软件定义汽车：OS突围

软件作为智能汽车的核心组成部分，由于自身较为独立和复杂的IT学科体系，其技术链路、产业分工、价值分配、商业模式相对硬件产品（如域控、激光雷达、摄像头等硬件）而言，在汽车产业内探讨和传播相对较少。 11月3日&…...

编程日记 2023/11/14 9:57:45

并发线程使用介绍（二）

2.2.6 线程的强占 Thread的非静态方法join方法需要在某一个线程下去调用这个方法如果在main线程中调用了t1.join()，那么main线程会进入到等待状态，需要等待t1线程全部执行完毕，在恢复到就绪状态等待 CPU调度。如果在main线程中调用了t1.j…...

编程日记 2023/11/14 9:56:44

【Proteus仿真】【51单片机】多路温度控制系统

文章目录一、功能简介二、软件设计三、实验现象联系作者一、功能简介本项目使用Proteus8仿真51单片机控制器，使用按键、LED、蜂鸣器、LCD1602、DS18B20温度传感器、HC05蓝牙模块等。主要功能： 系统运行后，默认LCD1602显示前4路采集的温…...

编程日记 2023/11/14 9:55:43

一些可以参考的文档集合15

之前的文章集合: 一些可以参考文章集合1_xuejianxinokok的博客-CSDN博客一些可以参考文章集合2_xuejianxinokok的博客-CSDN博客一些可以参考的文档集合3_xuejianxinokok的博客-CSDN博客一些可以参考的文档集合4_xuejianxinokok的博客-CSDN博客一些可以参考的文档集合5…...

编程日记 2023/11/14 9:54:41

k8s的service自动发现服务：实战版

Service服务发现的必要性: 对于kubernetes整个集群来说，Pod的地址也可变的，也就是说如果一个Pod因为某些原因退出了，而由于其设置了副本数replicas大于1，那么该Pod就会在集群的任意节点重新启动，这个重新启动的Pod的I…...

编程日记 2023/11/14 9:53:40

项目笔记记录

一、node下载版本报错：npm install --legacy-peer-deps 二、Scheduled: 任务自动化调度 Scheduled 标记要调度的方法的注解，必须指定 cron，fixedDelay或fixedRate属性之一 fixedDelay：固定延迟延迟执行任务，任务在…...

编程日记 2023/11/14 9:52:39

【leetcode】1137. 第 N 个泰波那契数

题目泰波那契序列 Tn 定义如下： T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n，请返回第 n 个泰波那契数 Tn 的值。示例 1： 输入：n 4 输出：4 解释： T_3 0 1 1 2 …...

编程日记 2023/11/14 9:51:38

【解决】conda-script.py: error: argument COMMAND: invalid choice: ‘activate‘

运行conda activate base报错： 试了网上找到的解决方法都不行： 最后切换了一下terminal： 从powershell改回cmd（不知道为什么一开始手贱换成powershell） 就可以了...

编程日记 2023/11/14 9:50:37

Linux 性能调优之硬件资源监控

写在前面考试整理相关笔记博文内容涉及 Linux 硬件资源监控常见的命名介绍，涉及硬件基本信息查看查看硬件错误信息查看虚拟环境和云环境资源理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生&#x…...

编程日记 2023/11/14 9:49:35

Windows系统隐藏窗口启动控制台程序

背景上线项目有时候需要一些控制台应用作为辅助服务来协助UI应用满足实际需求，这时候如果一运行UI就冒出一系列的黑框，这将会导致客户被下的不起，生怕中了什么不知名病毒方案可以使用vbs来启动，这个是window系统自带的&#…...

编程日记 2023/11/14 9:48:34

FreeSWITCH fail2ban.lua

--[[ 部署:在vars.xml里面增加配置项目：<X-PRE-PROCESS cmd"set" data"api_on_startupluarun fail2ban.lua"/>或者在 lua.conf.xml 里面增加下面这个配置项目：<param name"startup-script" value"fail2ban.…...

编程日记 2023/11/14 9:47:33

Qt HTTP下载数据

添加头文件： #include <QNetworkAccessManager> #include <QNetworkReply> #include <QUrl> #include <QDesktopServices> 创建对象： QNetworkAccessManager networkManager;//网络管理QNetworkReply *reply; …...

编程日记 2023/11/14 9:46:32

8. 深度学习——NLP

机器学习面试题汇总与解析——NLP 本章讲解知识点什么是 NLP循环神经网络（RNN）RNN 变体Attention 机制RNN 反向传播推导LSTM 与 GRUTransformerBertGPT分词算法分类CBOW 模型与 Skip-Gram 模型本专栏适合于Python已经入门的学生或人士，有一定的编程基础。本专栏适合于算法…...

编程日记 2023/11/14 9:45:31

部署 KVM 虚拟化平台

虚拟化技术的演变过程分为软件模拟、虚拟化层翻译、容器虚拟化三个阶段 1 软件模拟的技术方式软件模拟是通过软件完全模拟CPU、网卡、芯片组、磁盘等计算机硬件，因为是软件模拟，所以理论上可以模拟任何硬件，甚至不存在的硬件。但是由于是软…...

编程日记 2023/11/14 9:44:31

------------------ 浮动静态路由 set routing-options static route 0.0.0.0/0 next-hop pp0.0 qualified-next-hop pp0.1 preference 10 ----------------- RPM测试的内容，包括从哪个接口发起测试，测试ping等等 #指定探针类型用ICMP请求 #探测的目标地址 #探测间隔 #探测阈…...

编程日记 2023/11/14 9:43:30

原生JS实现视频截图

视频截图效果预览利用Canvas进行截图要用原生js实现视频截图，可以利用canvas的绘图功能 ctx.drawImage，只需要获取到视频标签，就可以通过drawImage把视频当前帧图像绘制在canvas画布上。 const video document.querySelector(video) con…...

编程日记 2023/11/14 9:42:29

前端Rust二进制/wasm全平台构建流程简述

前言开门见山，现代前端 Rust 构建基本分三大类，即构建 .wasm 、构建 .node 二进制、构建 swc 插件。入门详见《前端Rust开发WebAssembly与Swc插件快速入门》。对于单独开发某一类的流程，在上述参考文章中已有介绍，但对于…...

编程日记 2023/11/14 9:41:28

加解密算法相关技术详解

文章目录简介工作机制加解密对称密钥算法非对称密钥算法数字信封数字签名数字证书技术对比推荐阅读简介随着网络技术的飞速发展，网络安全问题日益重要，加解密技术是网络安全技术中的核心技术，是最常用的安全保密手段。加密&#xff1…...

编程日记 2023/11/14 9:40:27

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2025/12/23 3:06:42

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2025/12/17 16:30:13

leetcodeSQL解题：3564. 季节性销售分析

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2025/10/5 19:58:27

汇编常见指令

汇编常见指令一、数据传送指令指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX（不访问内存）XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...

编程新知 2025/11/4 20:56:54

JVM虚拟机：内存结构、垃圾回收、性能优化

1、JVM虚拟机的简介 Java 虚拟机（Java Virtual Machine 简称：JVM）是运行所有 Java 程序的抽象计算机，是 Java 语言的运行环境，实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息，使得 Java 程序只需生成在 JVM 上运行的目标代码（字节码），就可以…...

编程新知 2025/12/28 17:43:45