当前位置: 首页 > article >正文

Hailo8 Dataflow Compiler 模型转换指南--以 ONNX 模型为例

目录一、环境安装1.1 系统要求1.2 系统包安装二、模型转换2.1 ONNX 转 HEF 文件2.1.1 实例化 ClientRunner 解析ONNX模型2.2.2 加载/准备量化校准数据集2.2.3 参数配置并执行量化操作2.2.4 保存 HAR 文件并编译生成 HEF 板端文件2.2 模型可视化一、环境安装1.1 系统要求Hailo Dataflow Compiler 需要以下最低硬件和软件配置Ubuntu 20.04 / 22.0464 位在 Windows 上也支持通过 WSL2 运行16GB 以上内存推荐 32GB 以上Python 3.8 / 3.9 / 3.10包括 pip 和 virtualenvpython3.X-dev以及根据 Python 版本python3.X-distutils、python3-tk、libfuse2、graphviz、libgraphviz-dev 等软件包可使用如下命令进行安装sudo apt-get install PACKAGE以下是基于 GPU 的硬件仿真所需的额外要求Nvidia 的 Pascal / Turing / Ampere 架构 GPU例如 Titan X Pascal、GTX 1080 Ti、RTX 2080 Ti 或 RTX A4000GPU 驱动版本 525CUDA 11.8cuDNN 8.9注意事项 : 如果GPU不符合上述要求建议就不要仿真了终端虚拟环境中输入下述命令关闭GPU否则会报错export CUDA_VISIBLE_DEVICES-11.2 系统包安装安装包下载路径hailo dataflow compiler如图选择好算力卡版本以及操作系统后就可以下载了二、模型转换模型转换分为几个步骤1. 将 Pytorch 训练模型转换为 ONNX 模型2. 将 ONNX 模型转化为 HAR 文件HAR 是一种 tar.gz 归档文件包含部署到 Hailo 运行时的图结构表示和权重数据3. 将 HAR 文件转化为 Hailo 算力卡运行时 HEF 文件2.1 ONNX 转 HEF 文件实际转换时具体流程如下1. 实例化 ClientRunner 解析ONNX模型2. 加载/准备量化校准数据集3. 配置预处理参数均值、方差、缩放等4. 执行模型量化5. 保存HAR调试文件6. 生成最终HEF部署文件2.1.1 实例化 ClientRunner 解析ONNX模型from hailo_sdk_client import ClientRunner, InferenceContext import cv2 import numpy as np import os onnx_model_name best_ckpt onnx_path ./models/onnx/best_ckpt.onnx hw_arch hailo8 # 芯片类型 input_node_name image_arrays # 输出节点可通过 netron 查看 print( Step 1: 解析 ONNX 模型 ) runner ClientRunner(hw_archhw_arch) hn, npz runner.translate_onnx_model( onnx_path, onnx_model_name, start_node_names[input_node_name], ) print(ONNX 解析完成)补充translate_onnx_model 参数说明model_path模型路径model_name模型名称start_node_names字符串列表可选需要解析的第一个 ONNX 节点名称end_node_names字符串列表可选解析完成后可停止的 ONNX 节点列表net_input_shapes字典可选描述 start_node_names 中每个起始节点的输入形状字典键为节点名称值为对应输入形状仅当原始模型具有动态输入形状时使用通配符表示动态轴例如 [b, c, h, w]2.2.2 加载/准备量化校准数据集量化数据集不支持直接传入图片先对量化数据集进行处理处理要求数据前处理需要严格符合模型实际前处理如如果模型前处理是 LetterBox Yolo系列则量化数据集处理时也需要使用 LetterBox 进行缩放如果模型内部已经进行了归一化操作详见 2.2.3 部分则量化数据集处理就不需要进行归一化操作了反之亦然输入类型需严格匹配模型训练时的类型如模型训练时采用 RGB 格式进行训练则量化数据集也需要转换成 RGB 格式量化数据集数量推荐官方推荐量化数据集数量应该 1024 张# txt 中一行存放一张图片的地址 quant_txt_path ./quant_data/qunat.txt # 定义前处理函数以 LetterBox 为例 def letterbox_image(image_src, dst_size, pad_color(114, 114, 114)): src_h, src_w image_src.shape[:2] dst_h, dst_w dst_size scale min(dst_h / src_h, dst_w / src_w) pad_h, pad_w int(round(src_h * scale)), int(round(src_w * scale)) if image_src.shape[0:2] ! (pad_h, pad_w): image_dst cv2.resize(image_src, (pad_w, pad_h), interpolationcv2.INTER_LINEAR) else: image_dst image_src top int((dst_h - pad_h) / 2) down int((dst_h - pad_h 1) / 2) left int((dst_w - pad_w) / 2) right int((dst_w - pad_w 1) / 2) image_dst cv2.copyMakeBorder(image_dst, top, down, left, right, cv2.BORDER_CONSTANT, valuepad_color) return image_dst print( Step 2: 加载量化数据集 ) def load_quantization_images(txt_path, input_size(640, 640), max_images1200): image_paths [] with open(txt_path, r) as f: image_paths [line.strip() for line in f.readlines() if line.strip()] image_paths image_paths[:max_images] calib_data [] h_input, w_input input_size # (h, w) for path in image_paths: img cv2.imread(path) if img is None: continue # BGR - RGB具体取决于模型要求的输入类型 img cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img_processed letterbox_image(img, (h_input, w_input)) calib_data.append(img_processed.astype(np.float32)) return np.array(calib_data, dtypenp.float32) calib_dataset load_quantization_images(quant_txt_path, input_size) print(f加载 {len(calib_dataset)} 张量化图片)2.2.3 参数配置并执行量化操作Hailo 模型的参数配置是通过一个脚本实现的具体如下alls_lines [ normalization normalization([0.0, 0.0, 0.0], [255.0, 255.0, 255.0])\n, ] runner.load_model_script(.join(alls_lines)) print( Step 4: 模型量化中... ) runner.optimize(calib_dataset) print(模型量化完成)补充主要脚本配置参数说明normalization 归一化参数均值设置为 0 方差设置为 1 则代表归一化操作需由用户在模型外手动完成同时需注意量化参数数据集配置也需要手动归一化model_optimization_flavor设置optimization_level参数取值范围 [0, 4], 其中 level 4 精度损失最低但模型转化时间最长设置compression_level参数取值范围 [0, 5]默认使用 8-bit 权重提高 compression_level → 更多权重使用 4-bit → 压缩更强但可能降低精度change_output_activation对指定输出层仅限 Conv 层进行 Sigmoid 操作将输出结果的 Sigmoid 操作放在模型内部进行可以一定程度上增加模型准确率quantization_param 设置模型量化参数如可以通过下述方法配置 16 位输出quantization_param(output_layer1, precision_modea16_w16)其余配置参数不常用不做详细解释pre_quantization_optimization量化前优化post_quantization_optimization 量化后优化input_conversion输入格式转换transpose张量转置normalization归一化nms_postprocess非极大值抑制后处理change_output_activation修改输出激活函数logits_layer逻辑层 / 原始输出层set_seed设置随机种子resize尺寸调整2.2.4 保存 HAR 文件并编译生成 HEF 板端文件print( Step 5: 编译生成 HEF ) hef_data runner.compile() hef_path f{onnx_model_name}.hef with open(hef_path, wb) as f: f.write(hef_data) runner.save_har(f{onnx_model_name}_compiled.har) print(f\n成功生成 HEF{hef_path})2.2 模型可视化如果保存了 HAR 文件可以使用相关工具查看计算图模型结构用以调试查看命令如下hailo visualizer {hailo_model_har_name} --no-browser

相关文章:

Hailo8 Dataflow Compiler 模型转换指南--以 ONNX 模型为例

目录 一、环境安装 1.1 系统要求 1.2 系统包安装 二、模型转换 2.1 ONNX 转 HEF 文件 2.1.1 实例化 ClientRunner 解析ONNX模型 2.2.2 加载/准备量化校准数据集 2.2.3 参数配置并执行量化操作 2.2.4 保存 HAR 文件并编译生成 HEF 板端文件 2.2 模型可视化 一、环境安…...

用python解放右手系列(三) Excel自动化-告别复制粘贴的噩梦

Excel 自动化:告别复制粘贴的噩梦本文基于 Python 3.9,涉及库:pandas、openpyxl。阅读时间约 12 分钟。 安装依赖:pip install pandas openpyxl每月 1 号的"酷刑" 阿明刚用 Python 搞定文件重命名,还没高兴两…...

MusePublic Art Studio生成多样性控制:潜在空间探索技术

MusePublic Art Studio生成多样性控制:潜在空间探索技术 说实话,用AI生成艺术图片,最让人头疼的可能不是“画不出来”,而是“画得都一样”。你输入一段描述,比如“一个赛博朋克风格的武士”,模型确实能给你…...

COMSOL 超表面仿真:从入门到“光速”出图!

在系统讲解天线、超表面的物理原理、功能实现机制以及利用有限元法(Finite Element Method, FEM)进行建模与仿真设计的完整流程。通过理论讲授与仿真实践相结合的方式,帮助学员掌握从结构建模、物理场设置、网格划分、参数扫描到仿真后处理与…...

低分辨率图像修复难题的终极解决方案:Upscayl深度技术解析

低分辨率图像修复难题的终极解决方案:Upscayl深度技术解析 【免费下载链接】upscayl 🆙 Upscayl - #1 Free and Open Source AI Image Upscaler for Linux, MacOS and Windows. 项目地址: https://gitcode.com/GitHub_Trending/up/upscayl 面对模…...

《Hermes Agent 代码库安全漏洞分析与解决办法》

Hermes Agent 代码库安全漏洞分析与解决办法 Hermes Agent 作为跨平台自改进型 AI 智能体框架,涉及配置管理、多端通信、工具调用、容器部署等核心环节,以下从配置安全、部署安全、代码执行风险、数据隐私、网络通信、依赖管理、权限控制七大维度&#x…...

计算机毕业设计:Python农产品电商数据采集与价格预估平台 Flask框架 Spark 线性回归 数据分析 可视化 大数据 大模型(建议收藏)✅

1、项目介绍 技术栈 采用 Python 语言开发,基于 Flask 框架搭建后端服务,使用 Spark 技术进行大数据处理,通过 requests 爬虫从惠农网采集农产品数据,运用线性回归预测算法模型进行价格预测,前端结合 Echarts 可视化库…...

Intv_AI_MK11 Node.js 环境集成教程:构建全栈智能应用

Intv_AI_MK11 Node.js 环境集成教程:构建全栈智能应用 1. 开篇:为什么选择Node.js集成AI能力 如果你是一名Node.js开发者,想要给自己的应用添加AI能力,这篇教程就是为你准备的。我们将一步步带你完成从零开始的环境搭建&#xf…...

三分钟快速定位:Windows热键冲突终极解决方案指南

三分钟快速定位:Windows热键冲突终极解决方案指南 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 你是否曾经按…...

从单兵到军团:2026 多智能体协作的崛起与实战全指南

从单兵到军团:2026 多智能体协作的崛起与实战全指南在前三篇文章中,我们拆解了单个AI Agent的技术内核,并盘点了2026年主流框架的选型策略。但企业级场景的复杂程度,正在以肉眼可见的速度超越单一个体的能力天花板。单个“全能实习…...

Cursor AI免费VIP破解方案:如何绕过试用限制持续使用Pro功能

Cursor AI免费VIP破解方案:如何绕过试用限制持续使用Pro功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached yo…...

PD协议中的VDM:从握手到模式切换的实战解析

1. VDM基础:从USB PD到厂商自定义消息 第一次接触USB PD协议中的VDM(Vendor Defined Message)时,我完全被各种缩写搞晕了。后来在实际项目中调试一个支持DisplayPort Alt Mode的扩展坞才发现,VDM简直是USB-C设备的&qu…...

在 Linux 中查询最耗费 CPU 资源的前 10 个进程的常用脚本

方法一:使用 ps 命令(推荐,最通用)#!/bin/bash # 查看CPU占用最高的10个进程 ps aux --sort-%cpu | head -n 11 | tail -n 10或者更详细的版本:#!/bin/bash echo " CPU使用率最高的10个进程 " printf "…...

051.数据库选型:为检测结果存储选择合适的数据库(SQLite/MySQL/PostgreSQL)

从一次线上事故说起 上个月深夜接到报警,部署在厂区的YOLO检测服务突然响应缓慢。登录服务器一看,发现检测结果写入数据库的线程全部卡死,前端页面加载历史记录要十几秒。查日志定位到问题:随着检测图片数量突破百万级,当初为了省事直接用的SQLite文件膨胀到8GB,并发写入…...

零代码经验也能搞定的软著申请:用AI工具30分钟生成合规材料

零代码经验也能搞定的软著申请:用AI工具30分钟生成合规材料 在数字化浪潮席卷各行各业的今天,软件著作权(简称"软著")已成为保护创新成果的重要法律凭证。无论是初创企业的核心产品、高校科研项目的技术输出&#xff0c…...

真的绝了!这套私域运营思路和方法让我效率提升10倍

你有没有发现,很多人做私域,每天花4.5小时在重复劳动上——回消息2小时、写朋友圈1小时、手动拉群0.5小时、跟进客户1小时。一年下来1642.5个小时,折合68天。结果呢?好友从3000删到800,月成交从50单跌到8单&#xff0c…...

Shopee卖家必看:如何用爬虫自动监控竞品评价与价格(Python实战)

Shopee卖家必看:如何用Python爬虫实现竞品评价与价格智能监控 在东南亚电商市场激烈竞争的今天,Shopee卖家们面临着一个共同的挑战:如何快速响应市场变化,及时调整运营策略?传统的人工监控方式不仅效率低下&#xff0…...

Flutter 三方库 serial 的鸿蒙化适配指南—如何在在鸿蒙系统上构建极致、稳定的 Web 串口通信与工业硬软连接实战

在工业数字化、设备物联网化、产线可视化运维的场景里,串口通信依然是最基础、最稳定、最具成本优势的设备连接方式之一。无论是 PLC、仪器仪表、扫码枪、称重模块,还是自定义 MCU 控制板,大量设备仍通过 UART/USB-Serial 与上位系统交换数据…...

C++数据成员指针

class Data1 { public:int a;char b; };int Data1:: * aa &Data1::a; 这行代码定义了一个指向 Data1 类中 int 类型成员变量的指针 aa,并将其初始化为指向成员 a。 int Data1::* 是指向 Data1 类中 int 类型数据成员的指针类型。aa 是指针变量的名字。&Dat…...

OpenGL渲染与几何内核那点事-项目实践理论补充(一-3-(6):从“搬砖”到“无人仓”:一个CAD极客的OpenGL性能压榨史,连AI都看呆了——给图形学新手的VBO/VAO全攻略)

TOC 代码仓库入口: github源码地址。gitee源码地址。 系列文章规划: OpenGL渲染与几何内核那点事-项目实践理论补充(一-1-(8)-番外篇:当你的 CAD 遇上“活”的零件)OpenGL渲染与几何内核那点事-项目实践理论补充(一-2-(1)-当你的CAD想“联…...

Fish-Speech 1.5新手必看:3个参数调出完美语音,告别重复卡顿

Fish-Speech 1.5新手必看:3个参数调出完美语音,告别重复卡顿 1. 为什么你的语音合成总是不自然? 刚接触语音合成的朋友经常会遇到这样的困扰:生成的语音要么机械感十足,要么频繁重复字词,甚至出现莫名其妙…...

【2024 AGI技术成熟度白皮书】:12项核心指标首次量化评估,仅2项达Gartner Hype Cycle峰值前夜

第一章:AGI的技术瓶颈与突破方向 2026奇点智能技术大会(https://ml-summit.org) 当前通用人工智能(AGI)仍受限于认知架构的不完备性、跨域迁移的脆弱性以及因果推理的符号—神经鸿沟。尽管大语言模型在模式覆盖上取得显著进展,其…...

跨时钟域处理方法

目录前言1.1 setup-time 和 hold-time1.2 亚稳态的产生及原因2. 单bit信号跨时钟域处理方法2.1 慢时钟域到快时钟域-打两拍2.2 快时钟域到慢时钟域-脉冲同步前言 1.1 setup-time 和 hold-time 同步时序电路设计中,只在时钟的上升沿或下降沿进行采样。为了正确得到…...

Python的__init_subclass__类装饰器链式调用与元类协作

Python的类装饰器与元类机制一直是其面向对象编程中的高级特性,而__init_subclass__的引入进一步丰富了类层次结构的控制能力。当开发者需要在不显式使用元类的情况下定制子类行为,或实现装饰器链式调用与元类的协作时,这一特性展现出强大的灵…...

G-Helper终极指南:5分钟掌握华硕笔记本性能优化技巧

G-Helper终极指南:5分钟掌握华硕笔记本性能优化技巧 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar…...

【JVM深度解析】第24篇:JVM内存模型(JMM)核心原理

摘要 JMM(Java Memory Model,Java 内存模型)是 Java 并发编程的基础,它定义了线程之间共享变量的可见性、有序性问题,以及如何通过 Happens-Before 规则和内存屏障来解决这些问题。理解 JMM,你才能真正明白…...

Hive Lateral View + posexplode 实战:从数据炸裂到业务洞察

1. 从爆炸到洞察:为什么需要posexplode? 刚接触Hive时,我和大多数人一样先学会了explode函数。它能轻松把数组炸开成多行,处理JSON数据特别顺手。但直到遇到一个用户行为分析的需求,我才发现explode有个致命缺陷——它…...

水性浸涂漆工艺规范:从调配到干燥,讲透五金浸涂所有细节

在水性工业漆的实际应用中,浸涂工艺因其效率高、适合大批量小五金件(如螺栓、垫圈、弹簧、小型电机壳、刹车钳、千斤顶零部件等)而备受青睐。但很多工厂在浸漆时常常遇到气泡、流挂、膜厚不均等问题。本文以敦普水性工业漆的水性浸涂漆为例&a…...

Obsidian Dataview数据索引与查询引擎:构建智能知识库的完整技术方案

Obsidian Dataview数据索引与查询引擎:构建智能知识库的完整技术方案 【免费下载链接】obsidian-dataview A data index and query language over Markdown files, for https://obsidian.md/. 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-dataview …...

把MobileMamba的‘多感受野’模块拆给你看:如何用WTE-Mamba和MK-DeConv给老模型做一次‘微创手术’

MobileMamba模块化改造实战:如何用WTE-Mamba和MK-DeConv升级传统视觉模型 当你在深夜调试一个基于ResNet的图像分类项目时,是否遇到过这样的困境——模型在局部细节识别上表现尚可,但面对需要全局上下文理解的场景时总是力不从心?…...