当前位置: 首页 > article >正文

【实战】从零构建onnxruntime:源码编译全流程与疑难解析

1. 环境准备搭建编译基础环境在开始编译onnxruntime之前我们需要先准备好基础环境。我选择的是Ubuntu 20.04 LTS系统这个版本长期支持且稳定性好实测下来各种依赖库的兼容性也最佳。如果你用的是其他Linux发行版大部分步骤也是类似的只是包管理器的命令可能需要调整。首先更新系统软件包是个好习惯可以避免很多潜在的版本冲突问题sudo apt update sudo apt upgrade -y接下来安装必备的编译工具链这里我列出的都是经过实际验证的版本sudo apt install -y \ build-essential \ cmake3.30.5 \ git \ python3.8 \ python3-pip \ libpython3.8-dev \ protobuf-compiler5.29.4 \ libprotobuf-dev特别要注意的是protobuf的版本我在第一次尝试时用了系统默认的3.x版本结果编译时出现了序列化兼容性问题。后来发现onnxruntime 1.19.2需要protobuf 5.x版本这个坑我帮你踩过了。Python环境建议用virtualenv隔离python3.8 -m pip install virtualenv python3.8 -m virtualenv venv source venv/bin/activate pip install numpy1.24.4 packaging25.02. 获取源码两种方式与避坑指南获取onnxruntime源码有两种主流方式各有优缺点我两种都试过下面详细说说方式一直接下载Release包这是最快捷的方式适合只想快速编译不想折腾Git历史的同学wget https://github.com/microsoft/onnxruntime/archive/refs/tags/v1.19.2.zip unzip v1.19.2.zip cd onnxruntime-1.19.2但这种方式有个潜在问题源码目录不是Git仓库后面编译时可能会报错这个坑后面会讲解决方案。方式二克隆Git仓库适合需要查看提交历史或打算做二次开发的同学git clone --recursive https://github.com/microsoft/onnxruntime.git cd onnxruntime git checkout v1.19.2 git submodule update --init --recursive用Git方式获取的代码更完整但要注意两点必须加--recursive参数因为onnxruntime有很多子模块国内访问GitHub可能较慢可以尝试配置镜像源3. 编译配置参数解析与性能优化进入源码目录后真正的挑战才开始。官方提供的build.sh脚本有二十多个参数我挑几个最关键的说说./build.sh \ --skip_tests \ # 跳过测试加快编译 --config Release \ # 用Release模式 --build_wheel \ # 生成Python wheel包 --build_shared_lib \ # 生成动态链接库 --parallel 8 \ # 用8个线程加速 --enable_pybind \ # 启用Python绑定 --allow_running_as_root # 允许root运行这里有几个经验之谈--parallel参数建议设为你CPU核心数的1.5-2倍我的16核机器设8反而最快如果只是本地调试可以加--cmake_extra_defines ONNXruntime_DEV_MODEON要启用GPU支持需要额外配置CUDA路径4. 常见报错与解决方案报错一Git仓库初始化问题如果看到fatal: not a git repository错误这是因为编译脚本会检查Git信息。解决方法很简单git init git config --global user.name Your Name git config --global user.email youremail.com git add . git commit -m initial commit报错二依赖下载失败这个问题最棘手因为要下载的依赖很多国内网络环境可能导致部分包下载超时。我的解决方案是先在cmake/deps.txt找到下载失败的URL用浏览器或wget手动下载修改deps.txt中的URL为本地路径例如abseil库的修改示例- abseil_cpp;https://github.com/abseil/abseil-cpp/archive/f46495ea96f68fc3f6c394f099b2992743f6ff7f.zip;0e2b6d1dc7f0a808d1e23f7dd985f7bc18d52cbc abseil_cpp;file:///home/user/downloads/abseil-cpp-f46495ea96f68fc3f6c394f099b2992743f6ff7f.zip;0e2b6d1dc7f0a808d1e23f7dd985f7bc18d52cbc报错三Python绑定问题如果遇到Python相关错误检查以下几点virtualenv是否激活python3.8-dev包是否安装尝试设置PYTHON_EXECUTABLE路径export PYTHON_EXECUTABLE$(which python)5. 安装与验证确保编译成功编译完成后产物主要在build/Linux/Release目录下。安装步骤如下安装Python wheel包pip install build/Linux/Release/dist/onnxruntime-1.19.2-cp38-cp38-linux_x86_64.whl安装C库cd build/Linux/Release sudo make install验证安装是否成功import onnxruntime as ort print(ort.get_available_providers()) # 应该看到[CPUExecutionProvider]如果要验证C接口可以运行./onnxruntime_test_all6. 高级技巧自定义编译选项如果你需要深度定制可以修改CMakeLists.txt。我常用的几个自定义选项启用调试符号set(CMAKE_BUILD_TYPE RelWithDebInfo)禁用不需要的Execution Provider--disable_mlops --disable_tvm --disable_dnnl开启详细日志--cmake_extra_defines ONNXRUNTIME_ENABLE_LOGGINGON静态链接protobuf--cmake_extra_defines ONNX_USE_PROTOBUF_SHARED_LIBSOFF7. 性能调优与生产部署编译出的onnxruntime性能可以做进一步优化启用AVX2指令集--cmake_extra_defines ONNXRT_ENABLE_EXTENSION_AVX2ON内存池优化--cmake_extra_defines ONNXRUNTIME_ENABLE_MEMLEAK_CHECKEROFF生产环境建议使用--config MinSizeRel减小二进制体积禁用所有调试选项用strip去除调试符号strip libonnxruntime.so最后提醒一点如果要在不同机器上部署最好保持编译环境一致特别是glibc版本。我在实际项目中遇到过因为glibc版本不一致导致的运行时错误这个坑相当隐蔽。

相关文章:

【实战】从零构建onnxruntime:源码编译全流程与疑难解析

1. 环境准备:搭建编译基础环境 在开始编译onnxruntime之前,我们需要先准备好基础环境。我选择的是Ubuntu 20.04 LTS系统,这个版本长期支持且稳定性好,实测下来各种依赖库的兼容性也最佳。如果你用的是其他Linux发行版,…...

5个高效步骤:Win11Debloat让Windows系统臃肿问题迎刃而解

5个高效步骤:Win11Debloat让Windows系统臃肿问题迎刃而解 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and…...

为什么你的GraalVM镜像比JVM运行时多占62%内存?20年HotSpot/Graal双栈专家首次公开12项静态编译内存压缩清单

第一章:GraalVM静态镜像内存膨胀的本质归因GraalVM 静态原生镜像(Native Image)在启动性能与资源占用方面具有显著优势,但实践中常观察到生成的二进制文件体积远超预期,且运行时堆外内存(尤其是元数据区、字…...

PHP网关偶发502/504?揭秘OpenResty+PHP-FPM在严苛工控环境下的8大超时耦合陷阱(附压测对比图表)

第一章:工业PHP网关的典型故障现象与诊断起点工业PHP网关作为边缘计算与传统OT系统间的关键协议转换节点,其运行稳定性直接影响产线数据采集的连续性。常见故障并非源于语法错误,而是由资源约束、时序敏感性及协议适配偏差引发的隐性异常。典…...

开源语音数据集全攻略:从技术架构到智能家居落地实践

开源语音数据集全攻略:从技术架构到智能家居落地实践 【免费下载链接】cv-dataset Metadata and versioning details for the Common Voice dataset 项目地址: https://gitcode.com/gh_mirrors/cv/cv-dataset 一、价值定位:重新定义语音数据获取…...

2026年AI标书工具哪个最好用?钛投标一周年感恩回馈

钛投标一周年感恩回馈:致敬20万老用户!生成标书即抽天猫卡与23万份免单券2026年AI标书工具哪个最好用?感谢20万企业的信赖,行业标杆钛投标迎来一周年庆典!为回馈老用户的一路相伴,4月3日起开启千万级宠粉狂…...

AI智能体开发:低代码构建自主决策型全栈应用的实践指南

AI智能体开发:低代码构建自主决策型全栈应用的实践指南 【免费下载链接】gemini-fullstack-langgraph-quickstart Get started with building Fullstack Agents using Gemini 2.5 and LangGraph 项目地址: https://gitcode.com/gh_mirrors/ge/gemini-fullstack-la…...

原神智能辅助工具BetterGI:革新游戏体验的开源解决方案

原神智能辅助工具BetterGI:革新游戏体验的开源解决方案 【免费下载链接】better-genshin-impact 📦BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动刷本 | 自动采集/挖矿/锄地 | 一条龙 | 全连音游 - …...

3个强力方案:FanControl风扇控制中文设置完全指南

3个强力方案:FanControl风扇控制中文设置完全指南 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/Fan…...

如何突破AI编程工具的设备限制:go-cursor-help开源工具深度解析

如何突破AI编程工具的设备限制:go-cursor-help开源工具深度解析 【免费下载链接】go-cursor-help 解决Cursor在免费订阅期间出现以下提示的问题: Your request has been blocked as our system has detected suspicious activity / Youve reached your trial reques…...

DeepMosaics完整教程:3步掌握AI智能马赛克处理技术

DeepMosaics完整教程:3步掌握AI智能马赛克处理技术 【免费下载链接】DeepMosaics Automatically remove the mosaics in images and videos, or add mosaics to them. 项目地址: https://gitcode.com/gh_mirrors/de/DeepMosaics 还在为图片视频中的隐私保护问…...

Bebas Neue:为什么这个开源字体能成为设计师的秘密武器?

Bebas Neue:为什么这个开源字体能成为设计师的秘密武器? 【免费下载链接】Bebas-Neue Bebas Neue font 项目地址: https://gitcode.com/gh_mirrors/be/Bebas-Neue 你是不是经常在设计标题时感到纠结?想要一种既现代又有冲击力的字体&a…...

NL2SQL的十字路口:大模型与传统方法,谁是复杂场景的最终答案?

1. 当自然语言遇上SQL:NL2SQL技术的前世今生 第一次听说"用大白话就能查数据库"这个概念时,我正被一堆复杂的SQL查询折磨得焦头烂额。那是2016年,我负责的电商后台系统需要频繁从几十张表中提取数据,每次写嵌套查询都要…...

破解网页资源提取难题:猫抓让视频音频下载效率提升10倍

破解网页资源提取难题:猫抓让视频音频下载效率提升10倍 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 网课视频无法保存、直播回放找不…...

大数据量的迁移,MySQL 5.x → 8.0 升级设计实施

MySQL 5.x 升级到 8.0 的场景,核心挑战是: 停机窗口控制(全量逻辑导出导入耗时极长) 数据一致性与回滚能力 8.0 新特性兼容性(如保留字、默认认证插件、排序组行为变化) 方案采用 主从复制 + 滚动升级 或 逻辑迁移(mydumper/并行备份) 两种路径,推荐优先使用前者(…...

深入解析cv2.dnn.NMSBoxes()在目标检测中的双重过滤机制

1. 从目标检测的"海选"到"决赛":为什么需要双重过滤? 当你用YOLOv3这类模型做目标检测时,神经网络会输出一大堆预测框——就像选秀节目的海选现场,有实力选手也有浑水摸鱼的。我刚开始做项目时,发…...

STM32 RS485远程固件升级实战:从Bootloader设计到C#上位机开发全流程

STM32 RS485远程固件升级实战:从Bootloader设计到C#上位机开发全流程 在工业物联网和野外设备部署场景中,固件升级一直是个令人头疼的问题。想象一下,当某个偏远地区的环境监测设备出现软件故障时,工程师需要驱车数小时前往现场&a…...

BUUCTF-BUU BURP COURSE

打开页面后提示我们只能本地访问(127.0.0.1)构造伪造ip头发现x-real-ip可行需要登录但账号密码已经给了在源代码中找到密码构造POST请求体usernameadmin&passwordwwoj2wio2jw93ey43eiuwdjnewkndjlwe成功登录找到flag...

用Unity和Game4Automation PRO,在家就能搭建你的第一条虚拟生产线(附PLC连接教程)

用Unity和Game4Automation PRO搭建虚拟生产线的全流程指南 想象一下,你坐在家里的书桌前,却能操控一条完整的自动化生产线——机械臂精准抓取零件,传送带有序运转,PLC控制器实时响应你的指令。这不再是工业巨头的专属能力&#xf…...

从Waymo到你的项目:拆解BEVFusion如何用‘统一鸟瞰图’让3D感知又快又准

BEVFusion:重塑自动驾驶3D感知的多模态融合范式 当Waymo的第五代自动驾驶系统在旧金山街头自如穿行时,29个高分辨率摄像头、6个毫米波雷达和5个激光雷达的豪华配置背后,隐藏着一个关键技术难题——如何让这些异构传感器像人类感官一样协同工…...

PCB焊盘与过孔匹配的核心标准与基础原理

Q:PCB 设计中,焊盘大小与过孔直径匹配的核心原则是什么?A:PCB 焊盘与过孔直径匹配的核心原则是保证足够的焊环宽度,这是实现可靠电气连接、机械强度与可制造性的基础。根据 IPC-2221 国际标准,焊盘直径必须…...

不只是命令:深入Android Camera HAL,揭秘高通平台YUV数据导出与Sensor Raw配置的底层逻辑

不只是命令:深入Android Camera HAL,揭秘高通平台YUV数据导出与Sensor Raw配置的底层逻辑 在移动影像技术快速迭代的今天,理解Camera HAL层的运作机制已成为算法工程师和系统开发者的必修课。当我们需要获取原始YUV数据验证降噪算法效果&…...

突破限制!无需模拟器的3种Windows APK安装方案

突破限制!无需模拟器的3种Windows APK安装方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer Windows APK安装一直是跨平台应用的痛点,传统模拟…...

如何轻松打造完美舰船配置:EVE Online终极离线助手Pyfa使用指南

如何轻松打造完美舰船配置:EVE Online终极离线助手Pyfa使用指南 【免费下载链接】Pyfa Python fitting assistant, cross-platform fitting tool for EVE Online 项目地址: https://gitcode.com/gh_mirrors/py/Pyfa 你是否在EVE Online中为舰船配置而烦恼&am…...

销售团队要实时看数据:智能问数能替代Dashboard吗?

不能一概而论——在简单、固定口径的场景下,智能问数可以部分替代传统Dashboard;但在复杂、动态、跨系统的业务环境中,是否能替代,取决于所采用的技术路径。截至2026年4月初,主流技术路线可分为四类:RAG召回…...

从CPU缓存到C#代码:图解volatile如何解决可见性问题

从CPU缓存到C#代码:图解volatile如何解决可见性问题 当你在调试一个多线程程序时,是否遇到过这样的困惑:明明某个变量已经被修改了,但其他线程却"视而不见"?这种看似灵异的现象背后,隐藏着现代计…...

VINS-Mono代码架构深度解析:从feature_tracker到pose_graph,搞懂每个模块在做什么

VINS-Mono代码架构深度解析:从feature_tracker到pose_graph,搞懂每个模块在做什么 当你第一次成功运行VINS-Mono并看到实时轨迹在RVIZ中流畅呈现时,那种成就感不言而喻。但作为追求技术深度的开发者,我们不会满足于"能跑通&q…...

R—实战指南:利用picante包高效计算Faith系统发育多样性(PD)

1. 什么是Faith系统发育多样性(PD) Faith系统发育多样性(Phylogenetic Diversity,简称PD)是生态学研究中一个非常重要的概念。简单来说,它衡量的是一个群落中所有物种在进化树上的"总枝长"——你可以想象成把这些物种在…...

ABAP RFC SQL 模糊查询与动态区间条件实战解析

1. ABAP RFC接口中的模糊查询实战技巧 在SAP系统开发中,RFC(Remote Function Call)接口是实现跨系统数据交互的核心技术。当外部系统需要从SAP获取数据时,模糊查询功能往往成为刚需。不同于选择屏幕的便捷操作,RFC接口…...

保姆级教程:在YOLOv8.yaml里手动添加P2层,让你的模型看清8x8像素的小目标

在YOLOv8中集成P2层的实战指南:从配置文件修改到性能优化 当面对监控摄像头中快速移动的蚂蚁群或是卫星图像里的小型车辆时,传统目标检测模型往往会力不从心。这些8x8像素级别的微小目标,恰恰是许多实际应用场景中的关键检测对象。本文将彻底…...