【个人开源】——从零开始在高通手机上部署sd(二)
代码:https://github.com/chenjun2hao/qualcomm.ai


推理耗时统计
单位/ms
| 硬件 | qnncpu_clip | qnncpu_unet | qnncpu_vae | htp_clip | htp_unet | htp_vae |
|---|---|---|---|---|---|---|
| 骁龙8 gen1+ | 24716.994 | 133440.397 | 23.215 | 411.097 | 696.327 |
1. 下载依赖
- 下载opencv_x64.tar,提取码: rrbp
- 下载opencv_aarch64.tar, 提取码: xj8w
修改CMakeLists.txt中OPENCV_X64_PATH和OPENCV_AARCH64_PATH的路径 - 安装高通QNN,并声明
QNN_SDK_ROOT环境变量 - 下载android_ndk, 我使用的版本android-ndk-r26c
2. 编译
1.linux
mkdir build_x64 && cd build_x64
cmake .. -DCMAKE_BUILD_TYPE=Debug
make -j8
2.android
mkdir build_android && cd build_android
cmake -DCMAKE_TOOLCHAIN_FILE=$ANDROID_NDK_ROOT/build/cmake/android.toolchain.cmake \-DANDROID_ABI="arm64-v8a" \-DANDROID_NDK=$ANDROID_NDK_ROOT \-DANDROID_PLATFORM=android-28 \-DPLATFORM_X64=OFF \..
make -j8
3. x64 cpu执行浮点模型
-
转换浮点模型
参考qualcomm.sd, readme导出浮点模型 -
执行
export FLOAT_MODEL_PATH=/data1/chenjun/2_qualcomm_ai/sd2.1 # 修改成自己导出模型的路径
./build_x64/example/sd2.1/sd_15.out \${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnCpu.so \${QNN_SDK_ROOT}/lib/x86_64-linux-clang/libQnnHtp.so \${FLOAT_MODEL_PATH}/qnn_models/text_encoder_float/x86_64-linux-clang/libtext_encoder.so \${FLOAT_MODEL_PATH}/qnn_models/unet_float/x86_64-linux-clang/libunet.so \${FLOAT_MODEL_PATH}/qnn_models/vae_decoder_float/x86_64-linux-clang/libvae_decoder.so \10
可视化output/sd21_portrait.jpg(种子未固定,结果具有随机性):
4. 高通HTP执行量化模型
-
转换浮点模型
参考qualcomm.sd, readme导出量化模型 -
执行
参考高通的例子,我自己的adb操作,将所有的依赖push到手机再跑模型
export LD_LIBRARY_PATH=$PWD
# 跑sd
./sd_15_htp.out ./libQnnCpu.so ./libQnnHtp.so ./model_quant/libtext_encoder.so ./model_float/libunet.so ./model_float/libvae_decoder.so 10
结果保存在output/sd21_portrait_quant.jpg, 再adb pull下来看
其他
- qnn输入输出dataformat都是NHWC
- qnn 2.14.0.230828 cpu不支持量化的模型推理,需要用htp的后端
- qnn 2.26.0.240827 cpu也不支持量化模型的推理,composeGraphs的时候报错
相关文章:
【个人开源】——从零开始在高通手机上部署sd(二)
代码:https://github.com/chenjun2hao/qualcomm.ai 推理耗时统计 单位/ms 硬件qnncpu_clipqnncpu_unetqnncpu_vaehtp_cliphtp_unethtp_vae骁龙8 gen124716.994133440.39723.215411.097696.327 1. 下载依赖 下载opencv_x64.tar,提取码: rrbp下载opencv_aarch64.t…...
【MCU驱动开发概述】
MCU驱动开发概述 目录 MCU驱动开发概述二、驱动开发的目的三、驱动开发的关键组成部分四、示例 - LED 控制驱动 一、引言 MCU(Microcontroller Unit),即微控制器单元,是一种集成在单个芯片上的计算机系统,通常用于控制…...
PC端Linux之虚拟CAN
在调试QT程序时候需要用到虚拟CAN进行发送和接收的操作,以此记录方法。 在调试QT程序时候需要用到虚拟CAN进行发送和接收的操作,以此记录方法。 1、安装can-utils sudo apt install can-utils ifconig -a【查看是否安装成功,是否有can0网络…...
C++:std::thread、条件变量与信号量
介绍 在多线程编程的世界里,协调不同线程之间的工作是一项极具挑战性的任务。线程可能需要等待特定条件的满足,或者对共享资源的访问进行限制。C 标准库为我们提供了强大的工具,如 std::thread 用于创建和管理线程,条件变量用于线…...
POI pptx转图片
前言 ppt页面预览一直是个问题,office本身虽然有预览功能但是收费,一些开源的项目的预览又不太好用,例如开源的:kkfileview pptx转图片 1. 引入pom依赖 我这个项目比较老,使用版本较旧 <dependency><gro…...
Java File 类
File 类是 Java 中用于处理文件和目录的基本类之一,位于 java.io 包中。它提供了多种方法来创建、删除、检查、修改文件或目录的属性,以及列出文件夹中的内容。虽然 File 类本身不提供直接的读取或写入文件内容的方法(这些操作通常由 FileInp…...
工业通信协议 EtherNet/IP 全面解析
工业通信协议 EtherNet/IP 全面解析 EtherNet/IP(以太网工业协议)是一种基于标准以太网的工业自动化通信协议,由 ODVA(开放设备网供应商协会) 管理。它融合了 CIP(通用工业协议) 和以太网技术&…...
使用docker配置PostgreSQL
配置docker阿里云镜像仓库 国内使用docker hub拉取镜像比较慢,所以首先配置个人的镜像仓库。 阿里云的个人镜像仓库是免费的,对个人来说足够用。 具体操作参考阿里云官方链接 。 关于个人镜像仓库的使用参考链接。 配置完个人镜像仓库后将公网配置到doc…...
UITextView删除原有字符串时,光标会上移并且光标会变高
代码运行效果如图: import Foundationclass TestVC: UIViewController {override func viewDidLoad() {super.viewDidLoad()let testV MyCustomTextView(frame: CGRect(x: 0, y: 130, width: SCREEN_WIDTH - 50, height: 170))self.view.addSubview(testV)testV.ba…...
python入门 介绍及变量的使用
1.python介绍 python 是一门计算机语言 常见的计算机语言:python、java、C语言。。。 什么是计算机语言:就是让计算机知道你想干什么,把你的需求使用它能听懂的语言说出来 中国也有一门计算机语言:易语言 能认为是语言的本质上…...
51单片机-按键
1、独立按键 1.1、按键介绍 轻触开关是一种电子开关,使用时,轻轻按开关按钮就可使开关接通,当松开手时,开关断开。 1.2、独立按键原理 按键在闭合和断开时,触点会存在抖动现象。P2\P3\P1都是准双向IO口,…...
Java 8 至 Java 23 版本特性对比表
Java现在发布的版本很快,每年两个,但是真正会被大规模使用的是三年一个的TLS版本。 版本年份LTS关键特性影响力等级Java 82014✅Lambda 表达式、Stream API、方法引用、接口默认方法、Optional 类⭐⭐⭐⭐⭐Java 92017❌模块化系统(JPMS&…...
在wsl环境中配置和开发verilog(一种比较新颖的verilog开发指南)
WSL是windows中自带的linux子系统,笔者在若干月前首次接触其便爱不释手,verilog作为一种硬件解释语言,可否像c语言那样被游刃有余的编译和运行呢,笔者这次大胆的尝试在WSL环境VSCODEIverilog开发verilog。 首先默认按照了WSL和VS…...
AI学习指南HuggingFace篇-Hugging Face 的核心工具
一、引言 Hugging Face作为AI领域的重要参与者,提供了许多强大的工具,极大地简化了自然语言处理(NLP)任务的开发流程。其中,Transformers、Datasets 和 Tokenizers 是Hugging Face的三大核心工具。本文将深入介绍这些工具的作用、功能以及它们如何相互配合,帮助读者更好…...
DeepSeek 助力 Vue 开发:打造丝滑的二维码生成(QR Code)
前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 Deep…...
QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,压缩进度
前言 最近在做项目时遇到一个需求,需要将升级的文件压缩成zip,再进行传输; 通过网络调研,有许多方式可以实现,例如QT私有模块的ZipReader、QZipWriter;或者第三方库zlib或者libzip或者quazip等࿱…...
深入解析桥接模式:软件设计中的解耦利器
桥接模式:软件设计中的解耦利器 在软件开发的复杂世界中,设计模式是开发者解决常见问题的有力工具。桥接模式作为一种重要的结构型设计模式,在处理抽象与实现的关系时展现出独特的优势,它能够巧妙地将抽象部分与实现部分分离&…...
MYSQL-数据库-DDL-DML-DQL-DCL-基础学习
MySql概念: 建立在关系模型基础上,有多张相互连接的二维表组成的数据库 SQL通用语法: 1.SQL语句可以单行或多行书写,以分号结尾 2.SQL语句可以使用空格/缩进来增强语句的可读性 3.MySQL数据库的SQL语句不区分大小写,关…...
rv1126解码的一些原理
rv1126解码篇中,出现最重要的两个api一个是,send_vdec_thread线程里面调用的RK_MPI_SYS_SendMediaBuffer,把数据发到解码器。另外一个是read_vdec_thread线程的RK_MPI_SYS_GetMediaBuffer获取解码器里面的数据。 今天想探讨一下他的底层原理。…...
二级公共基础之数据结构与算法篇(七)排序技术
目录 前言 一、交换类排序 1.冒泡排序法 1. 冒泡排序的思想 2. 冒泡排序的实现步骤 3. 示例 4. 冒泡排序的特点 2.快速排序 1. 快速排序的核心思想 2. 快速排序的实现步骤 3. 示例代码(C语言) 4. 快速排序的特点 二、插入类排序 1. 简单插入排序 1.简单插入排…...
LitCAD:免费开源二维CAD绘图软件,轻松入门专业绘图
LitCAD:免费开源二维CAD绘图软件,轻松入门专业绘图 【免费下载链接】LitCAD A very simple CAD developed by C#. 项目地址: https://gitcode.com/gh_mirrors/li/LitCAD 想要尝试CAD设计却担心软件复杂难学?LitCAD为你提供完美的解决方…...
考研复习 Day 18 | 数据结构与算法--图(上)
一、图的基本概念1.1 图的定义图G由顶点集V和边集E组成,记为G(V,E)要素说明V(G)顶点的有限非空集E(G)顶点之间关系的集合重要:线性表可以是空表,树可以是空树,但图不可以是空图。顶点集V必须非空,但边集E可以为空。1.2…...
如何5分钟完成Windows系统优化:Chris Titus Tech WinUtil完全指南
如何5分钟完成Windows系统优化:Chris Titus Tech WinUtil完全指南 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 你是否厌倦了每…...
从module变量到intent参数:手把手教你写出更安全、更地道的Fortran子程序
从module变量到intent参数:手把手教你写出更安全、更地道的Fortran子程序 Fortran作为科学计算领域的常青树,其独特的模块化设计和参数传递机制常常让从C/Python转来的开发者感到困惑。本文将带你深入理解module变量的作用域陷阱、参数传递的底层逻辑&am…...
小程序富文本渲染难题如何解决?mp-html组件实战指南
小程序富文本渲染难题如何解决?mp-html组件实战指南 【免费下载链接】mp-html 小程序富文本组件,支持渲染和编辑 html,支持在微信、QQ、百度、支付宝、头条和 uni-app 平台使用 项目地址: https://gitcode.com/gh_mirrors/mp/mp-html …...
从“主动错误”到“总线关闭”:深入理解CAN节点错误状态机与计数器(TEC/REC)
从“主动错误”到“总线关闭”:深入理解CAN节点错误状态机与计数器(TEC/REC) 在汽车电子和工业控制领域,CAN总线作为经典的现场总线协议,其可靠性直接影响着整个系统的稳定性。当某个CAN节点开始频繁发送错误帧时&…...
如何轻松激活Windows系统:KMS_VL_ALL_AIO智能激活工具完整指南
如何轻松激活Windows系统:KMS_VL_ALL_AIO智能激活工具完整指南 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统激活而烦恼吗?KMS_VL_ALL_AIO是一款功能…...
机械识图:基本视图
在机械图样的表示法中,可分为基本表示法和特殊表示法。 基本表示法:图样画法是以真实投影为基础的画法,但画出的图形又不完全是机件(工程形体)的真实投影。 特殊表示法:图样画法是采用特殊的规定画法来表示…...
盟接之桥®制造业EDI软件:专注制造,为制造业服务,让全球供应链协同更有底气
在全球制造业数字化转型的浪潮中,供应链的协同效率已成为企业核心竞争力的关键一环。对于汽车零部件、机械制造、电子电器等领域的制造企业而言,电子数据交换(EDI)早已不是“锦上添花”的辅助工具,而是进入全球主流供应…...
别再只画图了!用Matlab Simulink+Simscape Multibody给你的SolidWorks装配体做个‘体检’(附完整联动教程)
机械设计动态验证:用Simscape Multibody为SolidWorks装配体做专业"体检" 在机械设计领域,完成三维建模只是第一步。真正考验设计合理性的,是装配体在实际运动中的表现——关节受力是否均匀?运动轨迹是否符合预期&#…...
