当前位置: 首页 > article >正文

CANN/GE动态输入算子样例

样例使用指导【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge1、功能描述本样例使用动态输入算子进行构图旨在帮助构图开发者快速理解动态输入的定义和使用2、目录结构cpp/ ├── src/ | └── CMakeLists.txt // CMake构建文件 | └── es_showcase.h // 头文件 | └── make_concatv2_graph.cpp // sample文件 ├── CMakeLists.txt // CMake构建文件 ├── main.cpp // 程序主入口 ├── README.md // README文件 ├── run_sample.sh // 执行脚本 ├── utils.h // 工具文件3、使用方法3.1、准备cann包通过安装指导 环境准备正确安装toolkit和ops包设置环境变量 (假设包安装在/usr/local/Ascend/)source /usr/local/Ascend/cann/set_env.sh3.2、编译和执行1.2.1 生成 es 接口与构建图进行DUMP只需运行下述命令即可完成清理、生成接口、构图和DUMP图bash run_sample.sh当前 run_sample.sh 的行为是先自动清理旧的 build构建 sample并默认执行sample dump 。当看到如下信息代表执行成功[Success] sample 执行成功pbtxt dump 已生成在当前目录。该文件以 ge_onnx_ 开头可以在 netron 中打开显示1.2.2 输出文件说明执行成功后会在当前目录生成以下文件ge_onnx_*.pbtxt - 图结构的protobuf文本格式可用netron查看1.2.3 构建图并执行基本的图构建和dump功能外esb_sample支持构建图并实际执行计算。bash run_sample.sh -t sample_and_run该命令会自动生成ES接口编译sample程序生成dump图、运行图并输出计算结果执行成功后会看到[Success] sample_and_run 执行成功pbtxt和data输出dump 已生成在当前目录可通过data文件查看计算结果3.3、日志打印可执行程序执行过程中如果需要日志打印来辅助定位可以在bash run_sample.sh之前设置如下环境变量来让日志打印到屏幕export ASCEND_SLOG_PRINT_TO_STDOUT1 #日志打印到屏幕 export ASCEND_GLOBAL_LOG_LEVEL0 #日志级别为debug级别1.4、图编译DUMP图可执行程序执行过程中如果需要DUMP图来辅助定位图编译流程可以在 bash run_sample.sh -t sample_and_run 之前设置如下环境变量来DUMP图到执行路径下export DUMP_GE_GRAPH24、核心概念介绍4.1、构图步骤如下创建图构建器(用于提供构图所需的上下文、工作空间及构建相关方法)添加起始节点(起始节点指无输入依赖的节点通常包括图的输入(如 Data 节点)和权重常量(如 Const 节点))添加中间节点(中间节点为具有输入依赖的计算节点通常由用户构图逻辑生成并通过已有节点作为输入连接)设置图输出(明确图的输出节点作为计算结果的终点)4.2、动态输入概念说明动态输入是指某些算子的输入个数不固定例如 ConcatV2 和 AddN 算子该算子为动态多输入算子ConcatV2 算子的原型如下所示ES 构图生成的API是ConcatV2()支持在 C、C 中使用REG_OP(ConcatV2) .DYNAMIC_INPUT(x, TensorType({BasicType(), DT_BOOL, DT_STRING})) .INPUT(concat_dim, TensorType::IndexNumberType()) .OUTPUT(y, TensorType({BasicType(), DT_BOOL, DT_STRING})) .ATTR(N, Int, 1) .OP_END_FACTORY_REG(ConcatV2)其对应的函数原型为函数名ConcatV2C或 EsConcatV2C参数共 3 个依次为 x concat_dim N返回值输出 yC API中EsCTensorHolder *EsConcatV2(EsCTensorHolder **x int64_t x_num, EsCTensorHolder *concat_dim, int64_t N);C APIEsTensorHolder ConcatV2(const std::vectorEsTensorHolder x, const EsTensorLike concat_dim, int64_t N 1);注 1.使用TensorLike类型表达输入以支持实参可以直接传递数值的情况 2.使用默认参数表达IR原型中的可选属性【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/GE动态输入算子样例

样例使用指导 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前…...

娱乐圈天降紫微星终结乱象,海棠山铁哥终结资源咖霸屏时代

资源咖的丧钟,已鸣。 草根王的号角,已响。一、旧秩序罪状书固化霸权三宗罪现场速写1. 资源垄断霸占赛道、包揽曝光、红利通吃2. 圈层护城出身即顶流,背景即通行证3. 劣币驱逐流水线泛滥,原创被碾压,审美被带偏 “无资源…...

3天搞定中文API大全:从菜鸟到高手的完整指南

3天搞定中文API大全:从菜鸟到高手的完整指南 嘿,开发者!你是不是经常为找一个好用的API而烦恼?项目做到一半,突然发现某个API文档全是英文,看得头大?别担心,今天我要给你介绍一个超级…...

终极Visual C++运行库修复指南:一劳永逸解决Windows软件兼容性问题

终极Visual C运行库修复指南:一劳永逸解决Windows软件兼容性问题 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist Visual C运行库修复工具是解决Windo…...

CherryPy与数据库集成:SQLAlchemy和ORM模式详解

CherryPy与数据库集成:SQLAlchemy和ORM模式详解 【免费下载链接】cherrypy CherryPy is a pythonic, object-oriented HTTP framework. https://cherrypy.dev 项目地址: https://gitcode.com/gh_mirrors/ch/cherrypy CherryPy是一个Python风格的面向对象HTTP…...

构建 AI Agent 应用商店的构想

构建 AI Agent 应用商店的构想:从“单骑救主”的工具到“生态协同”的智能枢纽关键词 AI Agent、应用商店、多Agent协作、工具调用链、Prompt工程标准化、安全沙箱、智能分发摘要 当你在凌晨2点对着一份混乱的月度财务报表焦虑时,有没有想过:…...

5分钟掌握Typora插件:从文件管理小白到高效写作达人的3步法

5分钟掌握Typora插件:从文件管理小白到高效写作达人的3步法 【免费下载链接】typora_plugin Typora plugin. Feature enhancement tool | Typora 插件,功能增强工具 项目地址: https://gitcode.com/gh_mirrors/ty/typora_plugin 你是否曾在Typora…...

SAP销售单文本处理保姆级教程:用SAVE_TEXT和READ_TEXT BAPI搞定抬头备注

SAP销售单文本处理实战指南:从业务需求到代码实现的完整闭环 销售订单处理过程中,文本信息承载着关键业务逻辑——加急标识、特殊包装要求、客户备注等非结构化数据往往决定了后续物流和财务流程的准确性。当这些信息在流转中丢失时,轻则导致…...

告别黑盒:用Python+Wireshark抓包,手把手解析CANoe FDX协议数据交互全过程

告别黑盒:用PythonWireshark抓包,手把手解析CANoe FDX协议数据交互全过程 在汽车电子和嵌入式系统开发领域,CANoe作为主流的网络仿真与分析工具,其FDX协议提供了一种强大的跨语言数据交互能力。但对于许多开发者而言,协…...

PostgreSQL数据清洗实战:用string_agg合并地址字段,我这样整理混乱的客户信息

PostgreSQL数据清洗实战:用string_agg合并地址字段,我这样整理混乱的客户信息 客户信息表中的地址字段分散是个常见痛点。想象一下:同一客户的"省"、"市"、"详细地址"分散在不同行,导出Excel时地址…...

告别I2C的龟速:用STM32的SPI接口榨干ICM20948的性能(实测对比与配置优化)

突破传感器性能瓶颈:STM32 SPI驱动ICM20948的极致优化实践 在无人机飞控、姿态解算和高频数据采集领域,传感器接口的选择往往成为系统性能的决定性因素。当开发者面对ICM20948这款集成了三轴陀螺仪、加速度计和磁力计的9轴运动传感器时,一个关…...

拆解OpenWrt的.ipk安装包:从文件结构到手动安装,彻底搞懂opkg底层逻辑

OpenWrt软件包深度解析:从.ipk结构到手动安装全指南 1. OpenWrt软件包管理机制揭秘 对于OpenWrt用户来说,opkg命令是日常管理软件包的基础工具。但当你遇到网络连接问题无法在线安装,或者需要定制修改软件包时,理解其背后的工作机…...

SleeperX:如何彻底掌控MacBook睡眠模式,让工作流程不再被打断

SleeperX:如何彻底掌控MacBook睡眠模式,让工作流程不再被打断 【免费下载链接】SleeperX MacBook prevent idle/lid sleep! Hackintosh sleep on low battery capacity. 项目地址: https://gitcode.com/gh_mirrors/sl/SleeperX 你是否曾因MacBook…...

【仅限奇点大会注册开发者获取】:Istio for AI策略模板库(含RAG路由、推理超时分级、Token流控等12个YAML黄金配置)

更多请点击: https://intelliparadigm.com 第一章:AI原生服务网格应用:2026奇点智能技术大会Istio for AI 在2026奇点智能技术大会上,Istio社区正式发布 Istio for AI —— 一个专为大模型推理、微调与多租户AI工作负载设计的服务…...

django-flask基于python实验室资产管理系统 实验室器材租赁系统

目录基于Python的实验室资产与器材租赁管理系统(Django/Flask)摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!基于Python的实验室资产与器材租赁管理系统…...

UNet3+全解析:从结构创新到医学图像分割实战

1. UNet3为什么能成为医学图像分割的新标杆? 第一次看到UNet3的论文时,我正被一个肝脏CT分割项目折磨得焦头烂额。当时试过UNet、UNet、Attention UNet等各种变体,但总在一些微小病灶的边界分割上差强人意。直到把UNet3的代码跑起来&#xff…...

构建企业级日志监控:免费Syslog服务器部署方案

构建企业级日志监控:免费Syslog服务器部署方案 【免费下载链接】visualsyslog Syslog Server for Windows with a graphical user interface 项目地址: https://gitcode.com/gh_mirrors/vi/visualsyslog 在分布式系统架构中,网络设备、服务器和应…...

Python爬虫实战:手把手教你如何采集开源许可证 FAQ 文章归档!

㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐⭐ (中级) 🉐福利: 一次订阅后,专栏内的所有文章…...

从.axf到.bin:ARM Compiler 6.14链接与格式转换的隐藏细节(Keil MDK实战)

从.axf到.bin:ARM Compiler 6.14链接与格式转换的隐藏细节(Keil MDK实战) 当你在Keil MDK中点击"Build"按钮时,背后发生的远不止简单的代码翻译。对于使用STM32的嵌入式工程师而言,理解从源代码到最终烧录文…...

51单片机LCD12864显示中文,别再傻傻用字库了!手把手教你自定义取模显示任意汉字

51单片机LCD12864深度定制:从零实现任意汉字点阵显示的艺术 在嵌入式开发领域,LCD12864液晶屏因其性价比高、接口简单而广受欢迎。但当我们需要显示公司Logo、特殊符号或艺术字体时,标准中文字库的局限性就暴露无遗。本文将彻底打破这种限制&…...

PARD-SSM:基于概率状态空间模型的多阶段网络攻击检测

1. 项目概述在网络安全领域,传统的入侵检测系统(IDS)面临着多阶段攻击检测的严峻挑战。攻击者通常会按照"攻击链"(Kill Chain)的步骤逐步渗透系统,从最初的侦察阶段到最终的数据窃取,每个阶段的网络流量特征可能单独看起来都像是正…...

Python爬虫实战:手把手教你如何采集软件文档“弃用功能”清单!

㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐⭐ (中级) 🉐福利: 一次订阅后,专栏内的所有文章…...

探索War3编辑器(7):从触发器GUI到JASS脚本的进阶实践

1. 为什么需要从GUI转向JASS脚本 很多War3地图作者刚开始都会使用图形化触发器界面(GUI)来制作游戏逻辑,毕竟点点鼠标就能完成功能确实很方便。但当你想要实现更复杂的效果时,比如循环判断系统、动态技能机制或者高级AI行为&#…...

5分钟极速上手:用BepInEx打造你的专属游戏世界

5分钟极速上手:用BepInEx打造你的专属游戏世界 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx 想象一下,你刚入手了一款心仪已久的游戏,但总觉得…...

3步解锁PotPlayer字幕翻译:让外语视频不再难懂

3步解锁PotPlayer字幕翻译:让外语视频不再难懂 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为看不懂的外语视频字幕…...

AD覆铜疑难杂症:从Modified Polygon到“引脚粘连”的排查与设计规避

1. Modified Polygon报错:现象与诊断 最近在做一个六层板设计时,遇到了典型的Modified Polygon报错。当时正在对电源层进行覆铜操作,点击"铺铜"按钮后,软件突然弹出一个红色警告框,显示"Modified Polyg…...

从‘监控谁’到‘如何查’:手把手教你用Prometheus标签玩转K8s监控数据筛选

从‘监控谁’到‘如何查’:手把手教你用Prometheus标签玩转K8s监控数据筛选 在Kubernetes集群监控领域,数据洪流是每个运维人员必须面对的挑战。当数百个Pod不断创建销毁时,传统静态配置的监控方式显得力不从心。这正是Prometheus标签系统大显…...

LVGL Canvas画布实战:5分钟教你制作一个可交互的简易绘图板

LVGL Canvas画布实战:5分钟教你制作一个可交互的简易绘图板 在嵌入式GUI开发领域,LVGL因其轻量级和高度可定制性成为众多开发者的首选。而Canvas画布控件作为其核心组件之一,能够实现从简单图形绘制到复杂交互界面的各种功能。今天&#xff0…...

LaTeX2Word-Equation:3秒搞定网页公式到Word的终极解决方案

LaTeX2Word-Equation:3秒搞定网页公式到Word的终极解决方案 【免费下载链接】LaTeX2Word-Equation Copy LaTeX Equations as Word Equations, a Chrome Extension 项目地址: https://gitcode.com/gh_mirrors/la/LaTeX2Word-Equation 还在为复制数学公式而头疼…...

STM32串口通信调试实录:从灯不亮到数据收发自如,我踩过的那些坑

STM32串口通信调试实录:从灯不亮到数据收发自如,我踩过的那些坑 那是一个周五的深夜,实验室里只剩下我和闪烁的示波器。屏幕上跳动的波形仿佛在嘲笑我的无能——明明按照教程一步步配置好了STM32的串口通信,可连接在PE5引脚的LED灯…...