当前位置: 首页 > article >正文

CANN Gather算子API描述

Gather 算子 API 描述【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench1. 算子简介从输入 Tensor 的指定维度按 index 提取元素。主要应用场景嵌入层Embedding的查表操作注意力机制中按索引提取 Key/Value稀疏操作中按索引收集特征算子特征难度等级L2IndexGather双输入x 和 index单输出y按索引进行元素提取输入支持 ND 格式支持任意维度2. 算子定义数学公式$$ y[i][m][n] x[index[i]][m][n] $$更一般地对于batch_dimsk前 k 个维度作为 batch 维度在第 k 个维度上按 index 进行 gather 操作。3. 接口规范算子原型cann_bench.gather(Tensor x, Tensor index, int batch_dims) - Tensor y输入参数说明参数类型默认值描述xTensor必选输入张量indexTensor必选索引张量batch_dimsINT640batch 维度数输出参数Shapedtype描述y由 index shape 和 x 的非 gather 维度决定与输入 x 相同输出张量gather 结果数据类型x dtypeindex dtype输出 dtypefloat16int32 / int64float16float32int32 / int64float32bfloat16int32 / int64bfloat16int8int32 / int64int8int32int32 / int64int32int64int32 / int64int64规则与约束输入支持任意维度的 ND 格式张量batch_dims指定 batch 维度数前batch_dims个维度作为 batch 维度x 和 index 在这些维度上的大小必须一致index 中的值必须为有效索引即在 [0, x.shape[batch_dims]) 范围内输出 dtype 与输入 x 的 dtype 一致index 张量在 gather 维度之外的维度上shape 必须与 x 对应维度一致4. 精度要求采用生态算子精度标准进行验证。误差指标平均相对误差MERE采样点中相对误差平均值$$ \text{MERE} \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$最大相对误差MARE采样点中相对误差最大值$$ \text{MARE} \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$通过标准数据类型FLOAT16BFLOAT16FLOAT32HiFLOAT32FLOAT8 E4M3FLOAT8 E5M2通过阈值(Threshold)2^-102^-72^-132^-112^-32^-2当平均相对误差 MERE Threshold最大相对误差 MARE 10 * Threshold 时判定为通过。5. 标准 Golden 代码import torch Gather算子Torch Golden参考实现 从输入Tensor的指定维度按index提取元素 公式: y[i][m][n] x[index[i]][m][n] def gather( x: torch.Tensor, index: torch.Tensor, batch_dims: int 0 ) - torch.Tensor: 从输入Tensor的指定维度按index提取元素 公式: y[i][m][n] x[index[i]][m][n] Args: x: 输入张量 index: 索引张量 batch_dims: batch维度数 Returns: 输出张量gather结果 y torch.gather(x, batch_dims, index.long()) return y6. 额外信息算子调用示例import torch import cann_bench x torch.randn(1024, 1024, dtypetorch.float32, devicenpu) index torch.randint(0, 1024, (512, 1024), dtypetorch.int32, devicenpu) y cann_bench.gather(x, index, batch_dims0) # 沿第 0 维 gather x torch.randn(128, 128, 64, dtypetorch.float16, devicenpu) index torch.randint(0, 128, (128, 64, 64), dtypetorch.int64, devicenpu) y cann_bench.gather(x, index, batch_dims1) # batch_dims1【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN Gather算子API描述

Gather 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测平台&#x…...

基于Convex与技能系统的云端AI助手clawsync部署与实战指南

1. 项目概述:打造你的专属云端AI助手 最近在折腾个人AI助理工具,发现了一个挺有意思的开源项目——clawsync。简单来说,它让你能轻松在云端部署一个属于你自己的AI助手,自带聊天界面,还能通过技能系统扩展功能&#xf…...

CANN/hcomm通信数据类型定义

数据类型定义 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm CommTopoCommLinkCommMemCommMemTypeChannelHandleThreadHandle…...

代购必备:这 5 款工具让你效率翻倍

工具一:跨境电商管理系统 做跨境代购,工具用得好,效率能翻倍。今天分享 5 款我最常用的工具。 这是最核心的工具。好的系统帮你解决: 自动采购:复制链接自动下单仓储管理:商品入库、质检、出库物流追踪&…...

在自动化工作流中实现多模型 API 供应商的动态切换

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在自动化工作流中实现多模型 API 供应商的动态切换 应用场景类,当企业需要构建高可用的 AI 应用时,依赖单一…...

CANN/metadef:Tensor创建API文档

CreateFollowing 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 创建一个指定数据类型以及大小的Tensor,其数据在TensorV2对象后连续排布。 函数原型 传入元素个数和数据类型,创建…...

WHERE子句中的函数调用:KES与Oracle的执行顺序陷阱

WHERE子句中的函数调用:KES与Oracle的执行顺序陷阱在 WHERE 子句里放一个"有副作用"的函数,就像在高速公路上放了一个随机变道的司机——也许今天没事,但迟早会出事故。引言:一段看起来"理所当然"的代码 在一…...

CANN/ge静态Shape运行时约束文档

静态Shape运行时约束文档 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、T…...

三维分子表征学习:从不变性、等变性到高体阶方法的技术演进与实践

1. 项目概述:三维分子表征学习的核心挑战与演进在药物发现、材料科学和催化设计等领域,理解分子的三维结构如何决定其性质与功能,是一个根本性的科学问题。传统的实验方法耗时耗力,而计算模拟,特别是基于量子力学的计算…...

卷积改进与轻量化:重参数化再升级:RepConv 引入多尺度分支,训练期提取多感受野特征,推理单路无损

一、问题缘起:当单结构不再够用 2026年已经过半,计算机视觉模型在边缘端的部署需求持续井喷。根据Ultralytics官方博客在2026年4月发布的信息,YOLO26 Nano模型在标准CPU上的推理速度较YOLO11提升了高达43%,这标志着边缘AI进入了一个新的加速周期。然而,这个成绩的背后隐藏…...

超 5 成银行已用!2026 银行大模型 + 19 个智能体案例复盘

人工智能技术的迭代演进,正深刻重构金融行业的服务模式、业务逻辑与竞争格局,而大模型作为生成式AI的核心载体,自2023年以来,历经三年探索、试点与沉淀,已从“概念狂欢”逐步走向“价值落地”,成为中国银行…...

数据网格架构:云原生时代的数据管理新范式

数据网格架构:云原生时代的数据管理新范式 一、数据网格的概念与价值 1.1 数据网格的定义 数据网格(Data Mesh)是一种去中心化的数据架构模式,将数据视为产品,由各个业务域自主管理和提供数据服务。与传统的集中式数据…...

干货|Active-Active/Active-Passive 数据库架构解析:高可用设计中的权衡与选型

在技术领域,我们常常被那些闪耀的、可见的成果所吸引。今天,这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力,让我们得以一窥未来的轮廓。然而,作为在企业一线构建、部署和维护复杂系统的实践者,我们深知…...

AI时代家庭教育新路径:脑能构建替代补课刷题的核心逻辑

一、传统家庭教育的失效困境AI全面进入教育领域,让知识获取变得愈发便捷,也让传统以补课、刷题、盯作业为核心的家庭教育模式彻底失效。光明网2025年调研显示,仅17%家庭靠传统补课提升孩子能力,68%优秀学生的核心优势的是自主规划…...

Godot引擎复刻N64复古渲染:着色器实现低多边形美学

1. 项目概述:在Godot引擎中复刻N64美学如果你和我一样,对90年代末期那批N64游戏(比如《塞尔达传说:时之笛》、《超级马力欧64》)所特有的那种粗粝、朦胧又充满魅力的3D画面情有独钟,那么这个项目就是为你准…...

3步解锁网易云音乐NCM格式:ncmdumpGUI图形化转换工具完全指南

3步解锁网易云音乐NCM格式:ncmdumpGUI图形化转换工具完全指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾经在网易云音乐下载了心爱的…...

对比Taotoken与直接调用原厂API在接入便捷性上的差异

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比Taotoken与直接调用原厂API在接入便捷性上的差异 对于需要集成多种大语言模型的开发者而言,管理多个供应商的接入流…...

基于MCP协议的Windows AI自动化:winremote-mcp部署与实战指南

1. 项目概述:当AI助手学会“远程桌面”如果你和我一样,日常主力开发环境是Mac或Linux,但总有那么几个场景不得不和Windows打交道——可能是公司内网里那台跑着老旧ERP系统的服务器,也可能是家里那台专门用来打游戏的PC&#xff0c…...

CANN oam-tools运维工具集

AGENTS.md 【免费下载链接】oam-tools 本项目为开发者提供故障定位工具,包含故障信息收集,软硬件信息展示,AI core error报错分析等能力,提升故障问题定位效率,文档可在昇腾社区搜索“故障处理简介”(选择社…...

深度解析碧蓝航线智能自动化方案:解放双手的终极指南

深度解析碧蓝航线智能自动化方案:解放双手的终极指南 【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研,全自动大世界 项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript 在移动游戏…...

3步解锁SD-WebUI-Inpaint-Anything插件:自定义修复模型完全指南

3步解锁SD-WebUI-Inpaint-Anything插件:自定义修复模型完全指南 【免费下载链接】sd-webui-inpaint-anything Inpaint Anything extension performs stable diffusion inpainting on a browser UI using masks from Segment Anything. 项目地址: https://gitcode.…...

AI如何优化卫星与HAPS网络的资源管理与智能切换

1. 项目概述:当AI遇见天空网络最近几年,我一直在关注一个特别有意思的交叉领域:如何把那些听起来很“酷”的人工智能技术,实实在在地用在解决天空中的通信难题上。这个项目标题——“AI在卫星通信与HAPS网络中的资源管理与切换优化…...

构建AI数字城市:多学科融合的智能体模拟与决策实验平台

1. 项目概述:当AI遇见城市,我们到底在模拟什么?最近几年,AI和“数字孪生”的概念火得不行,好像不提这两个词就跟不上时代了。但说实话,很多所谓的“数字城市”项目,要么是做个漂亮的3D可视化大屏…...

使用curl命令直接调试Taotoken大模型API的快速入门

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 使用curl命令直接调试Taotoken大模型API的快速入门 对于开发者而言,在集成初期、快速验证或排查问题时,直接…...

不用代码!5 分钟装好本地 AI 智能体

https://xiake.yun/api/download/package/14?promoCodeIV8E496E2F7A 2026 年开源圈备受关注的本地 AI 智能体 OpenClaw(小龙虾),凭借本地运行、零代码操作、自动完成电脑任务的突出优势,成为办公效率神器。它可以精准理解自然语…...

初次使用Taotoken官方价折扣进行模型实验的实际成本感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初次使用Taotoken官方价折扣进行模型实验的实际成本感受 1. 背景与起点 对于个人开发者或小型团队而言,探索不同大模型…...

【太奶学IT】一文搞懂0R电阻的10种硬核用法,90%的硬件工程师都用错了

文章目录0R电阻的认知误区,很多人从入门就错了0R电阻≠导线,两者存在本质差异0R电阻的电气参数,你从未关注过的细节0R电阻的基础通用用法,硬件工程师每天都在用电路调试与兼容设计,0R电阻的本职工作单点接地与噪声隔离…...

Web 3.0技术内核:区块链、AI与边缘计算的融合挑战与实践路径

1. 项目概述:Web 3.0的技术内核与融合挑战最近几年,Web 3.0从一个技术圈的热词,逐渐演变为一个被广泛讨论的下一代互联网愿景。作为一名长期关注分布式系统和网络架构的从业者,我观察到很多人对Web 3.0的理解还停留在“去中心化金…...

AIROGS挑战赛冠军方案解析:鲁棒性青光眼筛查的深度学习实战

1. 项目概述:当AI眼科医生遇上“模糊”的眼底照片作为一名长期混迹于医疗AI和计算机视觉交叉领域的老兵,我参与和围观过不少医学影像分析的挑战赛。这些比赛往往聚焦于“在理想数据集上刷出最高分”,但现实世界的医疗影像,尤其是基…...

Activity切换监听(系统级APP)

系统级APP<manifestxmlns:android"http://schemas.android.com/apk/res/android"package"com.xxx.xxx"android:sharedUserId"android.uid.system">方式一&#xff1a;TaskStackListener 封装类import android.app.ActivityManager; import…...