当前位置: 首页 > article >正文

CANN Ascend C数据转换临时空间API

GetTransDataMaxMinTmpSize【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明kernel侧TransData接口的计算需要开发者预留/申请临时空间本接口用于在host侧获取预留/申请的最大最小临时空间大小开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。为保证功能正确预留/申请的临时空间大小不能小于最小临时空间大小。在最小临时空间-最大临时空间范围内随着临时空间增大kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间。函数原型bool GetTransDataMaxMinTmpSize(const platform_ascendc::PlatformAscendC platform, const ge::Shape srcShape, const ge::Shape dstShape,const ge::DataType dataType, const TransDataConfig config, uint32_t maxValue, uint32_t minValue)参数说明表 1接口参数列表接口输入/输出功能platform输入传入硬件平台的信息PlatformAscendC定义请参见构造及析构函数。srcShape输入输入源操作数的shape大小参数取值与TransData接口的params.srcLayout参数中的shape信息保持一致。dstShape输入输出目的操作数的shape大小参数取值与TransData接口的params.dstLayout参数中的shape信息保持一致。dataType输入输入的数据类型ge::DataType类型当前只支持half/float/uint16_t/int16_t数据类型的输入。config输入数据格式转换的场景参数取值与TransData接口的config参数保持一致。当前支持的转换场景有NCDHW - NDC1HWC0、NDC1HWC0 - NCDHW、NCDHW - FRACTAL_Z_3D、FRACTAL_Z_3D - NCDHW。TransDataConfig类型具体定义如下。struct TransDataConfig { DataFormat srcFormat; DataFormat dstFormat; };enum class DataFormat : uint8_t { ND 0, NZ, NCHW, NC1HWC0, NHWC, NCDHW, NDC1HWC0, FRACTAL_Z_3D, };maxValue输出TransData接口能完成计算所需的最大临时空间大小超出该值的空间不会被该接口使用。说明maxValue仅作为参考值有可能大于Unified Buffer剩余空间的大小该场景下开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。minValue输出TransData接口能完成计算所需最小临时空间大小。为保证功能正确接口计算时预留/申请的临时空间不能小于该数值。返回值说明GetTransDataMaxMinTmpSize返回值为true/falsetrue表示成功获取TransData接口内部计算需要的最大和最小临时空间大小false表示获取失败。约束说明无调用示例完整的调用样例请参考更多样例。// 输入shape为(1,16,2,4,4)NCDHW转换为输出shape(1,2,1,4,4,16)NDC1HWC0;算子输入的数据类型为half uint32_t maxSize; uint32_t minSize; int32_t n 1, c 16, d 2, h 4, w 4, c1 1, c0 16; auto ncdhwShape ge::Shape({ n, c, d, h, w }); auto ndc1hwc0Shape ge::Shape({ n, d, c1, h, w, c0}); auto plat platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); TransDataConfig config {DataFormat::NCDHW, DataFormat::NDC1HWC0}; bool ret GetTransDataMaxMinTmpSize(plat, ncdhwShape, ndc1hwc0Shape, ge::DataType::DT_FLOAT16, config, maxSize, minSize);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN Ascend C数据转换临时空间API

GetTransDataMaxMinTmpSize 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: http…...

3分钟搞定OFD转PDF:免费工具让格式难题迎刃而解

3分钟搞定OFD转PDF:免费工具让格式难题迎刃而解 【免费下载链接】Ofd2Pdf Convert OFD files to PDF files. 项目地址: https://gitcode.com/gh_mirrors/ofd/Ofd2Pdf 你是否曾经面对OFD文件束手无策?当同事发来一份OFD格式的电子发票,…...

CANN/asc-devkit DeepNorm API 文档

DeepNorm 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com/c…...

Perplexity环境新闻检索失效真相(2024最新API响应延迟根因分析)

更多请点击: https://kaifayun.com 第一章:Perplexity环境新闻搜索 Perplexity 是一款基于大语言模型的实时信息检索工具,其核心优势在于融合权威信源与上下文感知能力,特别适用于需要高时效性与高可信度的新闻类查询场景。在该环…...

工业视觉系统选型实战:CCD相机与镜头参数计算全解析

1. 项目概述:从“神坛”到“工具箱”的CCD相机与镜头选型 在自动化视觉检测、精密测量和机器视觉领域,CCD工业相机和镜头的选型与参数计算,常常被新手工程师视为一个“黑箱”或“玄学”问题。客户一问到“这个系统能看多清楚?”、…...

OpCore-Simplify:从技术迷宫到一键直达的黑苹果配置革命

OpCore-Simplify:从技术迷宫到一键直达的黑苹果配置革命 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 曾经有多少个夜晚,你对…...

Sora之后的真相:2026年真正落地的8款工业级AI视频引擎,含API吞吐量、帧间PSNR均值与商用SLA承诺明细

更多请点击: https://intelliparadigm.com 第一章:Sora之后的真相:2026年真正落地的8款工业级AI视频引擎,含API吞吐量、帧间PSNR均值与商用SLA承诺明细 Sora发布两年后,工业界已摒弃“演示即产品”的幻觉。截至2026年…...

Qt QSettings管理Windows环境变量:原理、实现与实战优化

1. 项目概述最近在做一个Qt开发的桌面工具,里面有个功能点需要动态修改用户的系统环境变量,比如把一些我们自己打包的工具路径加到用户的PATH里,这样用户在其他地方打开命令行也能直接调用。一开始想着用系统API或者直接写注册表,…...

LangChain4j-examples:基于Java的AI智能体工作流编排深度解析与实践指南

LangChain4j-examples:基于Java的AI智能体工作流编排深度解析与实践指南 【免费下载链接】langchain4j-examples 项目地址: https://gitcode.com/GitHub_Trending/la/langchain4j-examples LangChain4j-examples是一个面向Java开发者的AI智能体工作流编排框…...

思源宋体TTF格式终极指南:免费商用中文字体的完整使用教程

思源宋体TTF格式终极指南:免费商用中文字体的完整使用教程 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为商业项目寻找既专业又免费的中文字体而烦恼吗?…...

5分钟快速上手Vue3思维导图:打造专业级数据可视化应用

5分钟快速上手Vue3思维导图:打造专业级数据可视化应用 【免费下载链接】vue3-mindmap Mindmap component for Vue3 项目地址: https://gitcode.com/gh_mirrors/vu/vue3-mindmap Vue3-Mindmap是一个基于Vue 3和TypeScript构建的现代化思维导图组件&#xff0c…...

Pixelle-Video:如何让AI为您的声音创作注入灵魂?

Pixelle-Video:如何让AI为您的声音创作注入灵魂? 【免费下载链接】Pixelle-Video 🚀 AI 全自动短视频引擎 | AI Fully Automated Short Video Engine 项目地址: https://gitcode.com/GitHub_Trending/pi/Pixelle-Video 在AI视频创作的…...

Cursor Pro免费激活终极指南:简单快速解锁AI编程高级功能

Cursor Pro免费激活终极指南:简单快速解锁AI编程高级功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your …...

2025届毕业生推荐的六大降AI率助手实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 针对内容创作范畴而言,AI生成内容也就是AIGC的运用愈发普遍,然而所生…...

i.MX6ULL电容触摸驱动开发:从硬件原理到Linux输入子系统实战

1. 项目概述:从零到一,搞定i.MX6ULL电容触摸最近在搞一个基于i.MX6ULL的工控HMI项目,客户要求界面操作必须流畅跟手,这就对触摸屏的响应速度和精度提出了硬性要求。市面上很多现成的模块要么驱动兼容性差,要么调试信息…...

如何零成本获取全球金融数据?开源工具AKShare终极指南

如何零成本获取全球金融数据?开源工具AKShare终极指南 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirrors/aks/ak…...

终极指南:如何用YOLOv8 AI自瞄系统快速提升游戏瞄准精度

终极指南:如何用YOLOv8 AI自瞄系统快速提升游戏瞄准精度 【免费下载链接】RookieAI_yolov8 基于yolov8实现的AI自瞄项目 AI self-aiming project based on yolov8 项目地址: https://gitcode.com/gh_mirrors/ro/RookieAI_yolov8 RookieAI_yolov8是一款基于YO…...

终极指南:如何使用Harepacker复活版轻松打造你的MapleStory游戏世界

终极指南:如何使用Harepacker复活版轻松打造你的MapleStory游戏世界 【免费下载链接】Harepacker-resurrected All in one .wz file/map editor for MapleStory game files 项目地址: https://gitcode.com/gh_mirrors/ha/Harepacker-resurrected 想要个性化修…...

猫抓浏览器扩展:基于网络请求拦截的智能资源嗅探技术实现

猫抓浏览器扩展:基于网络请求拦截的智能资源嗅探技术实现 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓(Cat Catch&a…...

告别纯HDL!用Xilinx SDK和MicroBlaze MCS,像写软件一样玩转FPGA嵌入式开发

从软件工程师视角玩转FPGA:基于MicroBlaze MCS的嵌入式开发实战 在传统认知中,FPGA开发往往与硬件描述语言(HDL)紧密绑定,这让许多习惯高级语言编程的软件工程师望而却步。但现代FPGA开发环境已经发生了革命性变化——…...

昇腾C FMA临时缓冲区因子大小接口

GetFmaTmpBufferFactorSize 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: http…...

告别DDPG训练不稳定!用SAC(软性演员-评论家)算法搞定复杂环境强化学习

告别DDPG训练不稳定!用SAC(软性演员-评论家)算法搞定复杂环境强化学习 在机器人控制、自动驾驶仿真等连续控制任务中,强化学习算法的稳定性往往决定了项目成败。许多工程师都经历过这样的困境:使用DDPG(深度…...

3天掌握Dify工作流开发:从零构建企业级AI应用的完整指南

3天掌握Dify工作流开发:从零构建企业级AI应用的完整指南 【免费下载链接】Awesome-Dify-Workflow 分享一些好用的 Dify DSL 工作流程,自用、学习两相宜。 Sharing some Dify workflows. 项目地址: https://gitcode.com/GitHub_Trending/aw/Awesome-Dif…...

高级逆向工程分析:PC微信小程序wxapkg加密算法深度解析与实现

高级逆向工程分析:PC微信小程序wxapkg加密算法深度解析与实现 【免费下载链接】pc_wxapkg_decrypt_python PC微信小程序 wxapkg 解密 项目地址: https://gitcode.com/gh_mirrors/pc/pc_wxapkg_decrypt_python PC微信小程序逆向工程工具提供了精准的wxapkg加密…...

终极指南:5分钟在Windows上安装安卓APK文件,无需模拟器

终极指南:5分钟在Windows上安装安卓APK文件,无需模拟器 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否厌倦了笨重的安卓模拟器&#xff…...

免费专业速度跑计时工具LiveSplit:终极完整使用教程

免费专业速度跑计时工具LiveSplit:终极完整使用教程 【免费下载链接】LiveSplit A sleek, highly customizable timer for speedrunners. 项目地址: https://gitcode.com/gh_mirrors/li/LiveSplit LiveSplit是一款为速度跑玩家设计的免费开源计时工具&#x…...

GC9A01驱动踩坑记:从供应商代码到自研优化,软件SPI这些细节别忽略

GC9A01驱动深度优化:软件SPI性能压榨实战手册 当240x240的LCD屏幕刷新一张图片需要整整1秒时,那种卡顿感会让任何开发者抓狂。上周调试GC9A01驱动时,我就遇到了这个噩梦——供应商提供的软件SPI驱动在40MHz主频下刷新率不足1FPS。经过72小时的…...

163MusicLyrics:一站式跨平台歌词管理解决方案

163MusicLyrics:一站式跨平台歌词管理解决方案 【免费下载链接】163MusicLyrics 云音乐歌词获取处理工具【网易云、QQ音乐】 项目地址: https://gitcode.com/GitHub_Trending/16/163MusicLyrics 当你在音乐海洋中遨游时,是否曾为找不到心仪歌曲的…...

如何用Perplexity秒级获取NCBI/UniProt/PDB关联知识?——生物学家正在悄悄使用的4层语义穿透法

更多请点击: https://intelliparadigm.com 第一章:如何用Perplexity秒级获取NCBI/UniProt/PDB关联知识?——生物学家正在悄悄使用的4层语义穿透法 Perplexity 不是传统搜索引擎,而是面向科研语义网络的推理型知识代理。当输入一个…...

某供应链企业200GB数据泄露复盘:如果开了透明加密,攻击者拿走的只有乱码

图:供应链企业数据泄露的3条典型路径(U盘导出/数据库导出/截图)与TDE透明加密的拦截机制事件还原:一次"完美"的内部数据窃取说明:以下事件基于多起真实安全事件综合脱敏处理,技术细节均为真实攻击…...