当前位置：首页 > news >正文

BUGFix：onnx -＞ TensorRT转换过程失败

news 2026/2/10 0:59:53

先附上相关的onnx2trt的部分代码：

def onnx2trt(onnx_path):logger = trt.Logger(trt.Logger.ERROR)builder = trt.Builder(logger)network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))parser = trt.OnnxParser(network, logger)parser.parse_from_file(onnx_path)config = builder.create_builder_config()config.max_workspace_size=max_workspace_sizeconfig.set_flag(trt.BuilderFlag.FP16)op = builder.create_optimization_profile()# op.set_shape('model0/input', (1, )+shape, (batch_size[0], )+shape, (batch_size[1], )+shape)op.set_shape(network.get_input(0).name, (min_batch_size, )+input_shape, (opt_batch_size, )+input_shape, (max_batch_size, )+input_shape)config.add_optimization_profile(op)engine = builder.build_engine(network, config)# trt_path = onnx_path.replace('/onnx/', '/trt/').replace('.onnx', '.plan')trt_path = onnx_path.replace('.onnx', '.plan')with open(trt_path,'wb') as f:f.write(engine.serialize())

在onnx转换TensorRT的过程中，提示15行代码有错误：
config.max_workspace_size=max_workspace_size
其中，max_workspace_size = 1<<30
# 首先单位是字节，比如 builder.max_workspace_size = 1<< 30 就是 2^30 bytes 即 1 GB。
# 它的作用是给出模型中任一层能使用的内存上限。运行时，每一层需要多少内存系统分配多少，并不是每次都分 1 GB，但不会超过 1 GB。

具体报错信息如下：


TypeError: deserialize_cuda_engine(): incompatible function arguments. The following argument types are supported:1. (self: tensorrt.tensorrt.Runtime, serialized_engine: buffer) -> tensorrt.tensorrt.ICudaEngineInvoked with: <tensorrt.tensorrt.Runtime object at 0x7feecb3c6530>, None

上面这错误可能是由于max_workspace_size分配不够导致的错误，可试着将30放大，但是我这里不管用；
原因是构建nvidia-docker时候，设置 --shm-size =32，共享内存的太小，不支持onnx-TensorRT的操作，这里修改为64，问题得以解决；

有问题随时交流，欢迎一键三连~

参考：
https://www.cnblogs.com/mrlonely2018/p/14841562.html

BUGFix：onnx -＞ TensorRT转换过程失败

相关文章：

BUGFix：onnx -＞ TensorRT转换过程失败

FFMPEG小白常用命令行

个性定制还是纯粹简约：探寻界面选择背后的心理宇宙

【Java 高阶】一文精通 Spring MVC - 转发重定向（四）

嵌入式Linux开发实操（十）：ADC接口开发

精进语言模型：探索LLM Training微调与奖励模型技术的新途径

数据采集:selenium 提取 Cookie 自动登陆

[Go版]算法通关村第十三关黄金——数字数学问题之数论问题（最大公约数、素数、埃氏筛、丑数）

Qt双击某一文件通过自己实现的程序打开，并加载文件显示

硬件产品的量产问题------硬件工程师在产线关注什么

Vulnhub系列靶机--- Hackadmeic.RTB1

redis高级----------主从复制

posgresql通过PL/pgSQL脚本统一修改某字段大小写

iPhone卫星通信SOS功能如何在灾难中拯救生命

NOIP真题答案过河数的划分

图为科技-边缘计算在智慧医疗领域的作用

Linux配置nginx反向代理

随便记录记录

UbuntuDDE 23.04发布，体验DeepinV23的一个新选择

RabbitMQ 消费者

Chapter03-Authentication vulnerabilities

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

stm32G473的flash模式是单bank还是双bank？

智慧医疗能源事业线深度画像分析（上）

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

蓝牙 BLE 扫描面试题大全(2)：进阶面试题与实战演练

在四层代理中还原真实客户端ngx_stream_realip_module

Mac下Android Studio扫描根目录卡死问题记录

关键领域软件测试的突围之路：如何破解安全与效率的平衡难题

Netty从入门到进阶（二）