当前位置: 首页 > article >正文

cann-bench TopK算子API描述

TopK 算子 API 描述【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench1. 算子简介返回 k 个最大或最小的元素及其索引。主要应用场景推荐系统中选取得分最高的 k 个候选项分类任务中获取 Top-K 预测类别及其置信度搜索与排序场景中的部分排序加速MoEMixture of Experts路由中选取 Top-K 专家算子特征难度等级L3SortSelect单输入双输出值和索引支持 1-8 维输入支持沿指定维度选取最大或最小的 k 个元素2. 算子定义数学公式$$ y, idx \text{topk}(x, k, dim) $$沿指定维度 dim 对输入张量 x 进行部分排序返回前 k 个最大值当 largesttrue或前 k 个最小值当 largestfalse及其对应的索引。3. 接口规范算子原型cann_bench.top_k(Tensor x, int k, int dim, bool largest) - (Tensor y, Tensor idx)输入参数说明参数类型默认值描述xTensor必选输入张量支持 1-8 维kint必选返回的 topk 数量取值范围1 k dim_sizedimint必选排序维度取值范围-ndim ~ ndim-1largestbooltrue是否返回最大值false 时返回最小值输出参数Shapedtype描述y与输入相同但 dim 维大小变为 k与输入 x 相同输出张量topk 值idx与 y 相同int64输出索引张量始终为 int64数据类型输入 dtype输出 dtypey输出 dtypeidxint8int8int64uint8uint8int64int32int32int64int64int64int64float16float16int64float32float32int64bfloat16bfloat16int64规则与约束输入支持 1-8 维张量k 的取值范围为 1 k 指定维度的大小dim 支持负数索引取值范围为 -ndim ~ ndim-1当 largesttrue 时返回最大的 k 个元素largestfalse 时返回最小的 k 个元素输出 shape 与输入相同仅 dim 维度大小变为 k4. 精度要求采用生态算子精度标准进行验证。误差指标平均相对误差MERE采样点中相对误差平均值$$ \text{MERE} \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$最大相对误差MARE采样点中相对误差最大值$$ \text{MARE} \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$通过标准数据类型FLOAT16BFLOAT16FLOAT32HiFLOAT32FLOAT8 E4M3FLOAT8 E5M2通过阈值(Threshold)2^-102^-72^-132^-112^-32^-2当平均相对误差 MERE Threshold最大相对误差 MARE 10 * Threshold 时判定为通过。5. 标准 Golden 代码import torch TopK算子Torch Golden参考实现 返回k个最大或最小的元素及其索引 公式: y, idx topk(x, k, dim) def top_k( x: torch.Tensor, k: int, dim: int, largest: bool True ) - tuple[torch.Tensor, torch.Tensor]: 返回k个最大或最小的元素及其索引 公式: y, idx topk(x, k, dim) Args: x: 输入张量 k: 返回的topk数量 (取值范围: 1 k dim_size) dim: 排序维度 (取值范围: -ndim ~ ndim-1) largest: 是否返回最大值 (false时返回最小值) Returns: y, idx values, indices torch.topk(x, kk, dimdim, largestlargest) return values, indices6. 额外信息算子调用示例import torch import cann_bench x torch.randn(1024, 1024, dtypetorch.float16, devicenpu) y, idx cann_bench.top_k(x, 10, -1, True) # 每行取最大的10个元素 x torch.randn(2, 8, 256, 256, dtypetorch.float32, devicenpu) y, idx cann_bench.top_k(x, 10, -1, False) # 每行取最小的10个元素【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

cann-bench TopK算子API描述

TopK 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测平台&#xff…...

三步解锁QQ音乐加密文件:qmc-decoder让你的音乐真正自由播放

三步解锁QQ音乐加密文件:qmc-decoder让你的音乐真正自由播放 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经在QQ音乐下载了心爱的歌曲,却…...

CANN/catccos计算通信融合算子模板库

CATCCOS 【免费下载链接】catccos CATCCOS昇腾计算-通信融合算子模板库,是一个聚焦于提供高性能计算通信融合类算子基础模板的代码库。 项目地址: https://gitcode.com/cann/catccos 📌 简介 CATCCOS(CANN Templates for Compute-Communication …...

CANN设备运行时事实

Device and Runtime Facts 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills Use this file for device caps, pipe mapp…...

RAP中的派生变量%说明

1. %msg是 BDEF 派生类型(Derived Types)的一个组件。它被用作 REPORTED 响应参数的一个组成部分。%msg 提供了一个消息接口 IF_ABAP_BEHV_MESSAGE 的实例。如果不需要对该接口进行自定义实现,可以使用继承而来的 new_message( ) 或 new_mess…...

CANN/tensorflow AOE调优配置

AOE 【免费下载链接】tensorflow Ascend TensorFlow Adapter 项目地址: https://gitcode.com/cann/tensorflow [!NOTE]说明 AOE调优特性仅支持如下产品的训练场景: Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品A…...

长期使用Taotoken服务在API延迟与稳定性方面的实际感受分享

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 长期使用Taotoken服务在API延迟与稳定性方面的实际感受分享 在持续数月的项目开发中,我们团队将多个AI应用的后端服务统…...

企业内如何通过Taotoken实现AI模型调用的统一审计与风控

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业内如何通过Taotoken实现AI模型调用的统一审计与风控 对于有合规与安全要求的企业而言,直接让各部门或应用分别对接…...

我给 MariaDB 装了个“副驾驶”:DBLens for MariaDB

有时候我觉得,数据库不是难用,是太会藏东西了。 你问它:“订单状态在哪?” 它沉默。 你问:“这个字段谁在用?” 它继续沉默。 你打开表列表,看着一串似曾相识但又不敢乱点的名字,心里…...

马斯克投1200亿建芯片工厂,微美全息加速量子算力集群进入全球“AI军备竞赛”

据报道,埃隆马斯克的太空探索技术公司准备斥资1200亿美元建造一家人工智能(AI)芯片工厂,这将是世界上最大的人工智能芯片工厂。AI芯片工厂重构算力马斯克在社交媒体平台X上写道:“这是为建设全球最大、最先进芯片制造设…...

CANN/runtime算子信息订阅API

# 19-03 订阅算子信息 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述算子信息订阅接口,用于订阅模型中算子的执行信息(类型、名称、耗时等)…...

CANN/runtime多Stream同步示例

2_multi_stream 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了多个Stream之间流间任务同步功能。 产品支持情况 本样例支持以下产品: 产品是否支持Atlas A3 训练系列…...

AI时代知识工作者的创造力重塑:从复用、随机性到形式与内容的边界

1. 项目概述:当知识工作遇上AI,创造力如何被重新定义?最近和不少做内容、做产品、做策略的朋友聊天,大家都有一个共同的感受:自从ChatGPT、Midjourney这些AI工具普及后,工作流程确实快了不少,但…...

CANN/ops-nn Gelu梯度算子

GeluGrad 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√A…...

科学拉丁文献翻译评测:ChatGPT与Google Translate的深度对比

1. 项目缘起与核心价值作为一名长期在生物、医药和古典文献领域打交道的从业者,我几乎每天都要和拉丁文打交道。无论是解读一份18世纪的植物志手稿,还是理解一篇现代药理学论文中引用的经典术语,拉丁语都是横亘在面前的一道坎。过去&#xff…...

通过 Taotoken 管理控制台精细化设置 API Key 的访问权限与审计日志

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过 Taotoken 管理控制台精细化设置 API Key 的访问权限与审计日志 在团队协作或项目开发中,统一管理大模型 API 的调…...

CANN/opbase获取Tensor格式

aclGetFormat 【免费下载链接】opbase 本项目是CANN算子库的基础框架库,为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 功能说明 获取aclTensor的format,aclTensor由aclCreateTensor接口创建。 函数原型 …...

ATVC AddWithBroadcast算子样例

【免费下载链接】atvc ATVC(Ascend C Templates for Vector Compute),是为基于Ascend C开发的典型Vector算子封装的一系列模板头文件的集合,可帮助用户快速开发典型Vector算子。 项目地址: https://gitcode.com/cann/atvc …...

泰山派3M-RK3576-系统功能-Debian12-MIPI屏幕显示

Debian12系统MIPI屏幕显示 下载对应镜像 使用 网盘🚀 在 系统镜像/Debian12/ 这个目录中下载我们提供的 .img 镜像文件。 本文档使用的镜像有两个(需要根据屏幕的型号选择): 【1】. TaishanPi-3M-RK3576_Debian12-Xfce_dsiC41…...

Graph-autofusion super_kernel极简示例

super_kernel极简sample 【免费下载链接】graph-autofusion Graph-autofusion 是一个面向昇腾(Ascend)芯片的轻量级、解耦式组件集合,旨在通过自动融合技术加速模型执行。 目前已开源 SuperKernel 组件,未来将持续开放更多自动融合…...

02.基础语法

第 2 章 C++ 基础语法 目录介绍 2.1 C++快速介绍 2.1.1 C++语言介绍 2.1.2 C++的特点 2.1.3 C++标准库 2.1.4 C++应用领域 2.1.5 C++的版本 2.1.6 综合案例与思考 2.2 C++编译器...

CANN TensorFlow调试配置

功能调试 【免费下载链接】tensorflow Ascend TensorFlow Adapter 项目地址: https://gitcode.com/cann/tensorflow enable_exception_dump 是否dump异常算子数据。 0:关闭异常算子数据dump功能。 1:开启普通ExceptionDump,dump异常…...

群论与张量积:构建等变神经网络的核心原理与实践

1. 项目概述:当AI遇见数学的优雅 如果你在深度学习的海洋里游过泳,大概率听过“卷积神经网络(CNN)在处理图像时具有平移不变性”这种说法。这听起来很酷,但你是否想过,这种“不变性”从何而来?它…...

CANN/hcomm pre-commit 使用指导

pre-commit 工具使用指导 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 概述 pre-commit 是一个 Git Hooks 框架&#xff0…...

第 2 章 C++ 基础语法

第 2 章 C++ 基础语法 目录介绍 2.1 C++快速介绍 2.1.1 C++语言介绍 2.1.2 C++的特点 2.1.3 C++标准库 2.1.4 C++应用领域 2.1.5 C++的版本 2.1.6 综合案例与思考 2.2 C++编译器...

口碑好的四川别墅电梯哪家专业

在选择别墅电梯时,许多业主都会把“口碑”作为重要的参考标准。毕竟电梯是日常频繁使用的家庭设备,它既要承载家人的安全,也要融入家的氛围。在四川本地,有一家深耕别墅电梯多年的企业——四川西子奥通电梯有限公司,凭…...

通过curl命令诊断大模型API连接与返回问题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过curl命令诊断大模型API连接与返回问题 当你在集成大模型服务时遇到问题,无论是调用失败、返回异常还是响应缓慢&am…...

泰山派3M-RK3576-镜像烧录-成品镜像烧录

【立创泰山派3-RK3576开发板】成品镜像烧录 什么是成品镜像 简单来说就是一个 .img 就是完整的系统镜像,烧录这一个就可以完整的运行系统,这样的镜像叫做成品镜像。 这样的镜像体积都比较大,但胜在烧录方便。 例如:update.img…...

对比多个模型 API 供应商后我为何选择 Taotoken 作为主用平台

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比多个模型 API 供应商后我为何选择 Taotoken 作为主用平台 作为个人开发者,在构建需要集成大语言模型能力的应用时&…...

AI应用上线前必做的5项安全验证:基于SITS2026标准的CI/CD嵌入式检测清单

更多请点击: https://intelliparadigm.com 第一章:SITS2026标准的演进逻辑与AI原生安全范式转型 SITS2026并非对传统信息安全标准的简单迭代,而是以AI系统全生命周期为锚点,重构信任边界、责任归属与验证机制的范式跃迁。其核心驱…...