当前位置: 首页 > article >正文

CANN评测:SwiGlu算子API

SwiGlu 算子 API 描述【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench1. 算子简介SwiGlu 是采用 Swish 作为激活函数的 GLUGated Linear Unit变体输入在最后一维拆分成 x0 和 x1 两部分x0 经 Swish 激活后与 x1 做门控乘法。主要应用场景LLaMA、PaLM 等大语言模型的前馈网络Transformer FFN 层中替代传统 ReLU/GELU 的激活方案算子特征难度等级L1Elementwise单输入单输出输入在 -1 维拆分为两部分输出 shape 的最后一维为输入的一半2. 算子定义数学公式输入 x 沿最后一维拆分为 x0、x1 两等份$$ x0, x1 \text{chunk}(x, 2, \text{dim}-1) $$$$ \text{Swish}(x0) x0 \cdot \sigma(\beta \cdot x0) $$$$ y \text{Swish}(x0) \cdot x1 $$其中 $\sigma$ 为 Sigmoid 函数$\beta$ 为scalarValue参数。3. 接口规范算子原型cann_bench.swi_glu(Tensor x, float scalarValue) - Tensor y输入参数说明参数类型默认值描述xTensor必选输入张量会在 -1 维拆分成 x0 和 x1scalarValuefloat必选Swish 激活函数的 beta 参数输出参数Shapedtype描述y输入 shape 的最后一维除以 2与输入 x 相同SwiGlu 门控激活结果数据类型输入 dtype输出 dtypefloat16float16float32float32规则与约束输出 shape 的最后一维为输入最后一维的一半输出 dtype 与输入 dtype 一致若输入最后一维为奇数则仅取前偶数个元素进行拆分4. 精度要求采用生态算子精度标准进行验证。误差指标平均相对误差MERE采样点中相对误差平均值$$ \text{MERE} \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$最大相对误差MARE采样点中相对误差最大值$$ \text{MARE} \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$通过标准数据类型FLOAT16BFLOAT16FLOAT32HiFLOAT32FLOAT8 E4M3FLOAT8 E5M2通过阈值(Threshold)2^-102^-72^-132^-112^-32^-2当平均相对误差 MERE Threshold最大相对误差 MARE 10 * Threshold 时判定为通过。5. 标准 Golden 代码import torch def swi_glu( x: torch.Tensor, scalarValue: float ) - torch.Tensor: 采用Swish作为激活函数的GLU变体输入在第-1维拆分成x0和x1两部分 公式: y swish(x0) * x1 x0 * sigmoid(beta * x0) * x1 Args: x: 输入张量会在-1维拆分成x0和x1 scalarValue: Swish激活函数的beta参数 Returns: 输出张量形状为输入shape除以2 # 在最后一维拆分为两部分 last_dim_size x.shape[-1] # 对于奇数维度只取前偶数个元素进行拆分确保两部分大小一致 if last_dim_size % 2 ! 0: # 取前 floor(n/2)*2 个元素 usable_size (last_dim_size // 2) * 2 x x[..., :usable_size] x0, x1 x.chunk(2, dim-1) swish x0 * torch.sigmoid(scalarValue * x0) y swish * x1 return y6. 额外信息算子调用示例import torch import cann_bench x torch.randn(1024, 1024, dtypetorch.float32, devicenpu) y cann_bench.swi_glu(x, scalarValue1.0)【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN评测:SwiGlu算子API

SwiGlu 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测平台&#x…...

CherryPy入门指南:如何在5分钟内构建你的第一个Web应用

CherryPy入门指南:如何在5分钟内构建你的第一个Web应用 【免费下载链接】cherrypy CherryPy is a pythonic, object-oriented HTTP framework. https://cherrypy.dev 项目地址: https://gitcode.com/gh_mirrors/ch/cherrypy CherryPy是一个Pythonic的面向对象…...

CANN/asc-devkit Tiling模板参数选择接口

ASCENDC_TPL_SEL_PARAM 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://…...

群论与表示论:构建等变神经网络的数学基石与实践指南

1. 项目概述:当神经网络遇见对称性如果你在深度学习的实践中,遇到过这样的场景:训练一个图像分类器,希望它对旋转、平移后的图片依然能做出正确判断;或者构建一个分子性质预测模型,需要它天然地理解三维空间…...

Proxima本地AI网关深度实践:无API密钥统一调用ChatGPT等四大模型

1. 项目概述:Proxima,一个本地AI网关的深度实践如果你和我一样,每天要在ChatGPT、Claude、Gemini和Perplexity之间来回切换,复制粘贴代码片段,或者为了一个复杂问题想同时听听不同模型的见解,那你肯定也受够…...

Llama 3.2 90B-Vision实战:Groq云推理+Streamlit轻量部署图像描述生成器

1. 项目概述:这不是一个“调API”的玩具,而是一次对多模态工程边界的实测我用Llama 3.2 90B-Vision搭了一个图像描述生成器,上线三天,内部测试团队传了278张图进来——有手机随手拍的早餐煎蛋、模糊的旧照片扫描件、带水印的电商主…...

Monkey部署指南:从本地Demo到生产环境的完整解决方案

Monkey部署指南:从本地Demo到生产环境的完整解决方案 【免费下载链接】Monkey Monkey (LMM): Image Resolution and Text Label Are Important Things for Large Multi-modal Models 项目地址: https://gitcode.com/gh_mirrors/monke/Monkey Monkey是一款强大…...

commitlint火星任务:为太空探索定制的提交规范终极指南

commitlint火星任务:为太空探索定制的提交规范终极指南 【免费下载链接】commitlint 📓 Lint commit messages 项目地址: https://gitcode.com/gh_mirrors/co/commitlint commitlint是一款强大的提交信息检查工具,它能帮助开发团队规范…...

基于时空图对比学习的尼古丁成瘾脑功能环路识别方法

1. 项目概述:从“烟瘾”到“脑环路”的科学解码干了这么多年神经影像数据分析,我越来越觉得,很多看似复杂的成瘾行为,其背后的大脑“电路图”其实有迹可循。就拿尼古丁成瘾来说,我们常听到“戒烟难”、“心瘾难除”&am…...

如何成为全栈Web开发者:HTML/CSS/JavaScript三件套终极入门指南 [特殊字符]

如何成为全栈Web开发者:HTML/CSS/JavaScript三件套终极入门指南 🚀 【免费下载链接】Become-A-Full-Stack-Web-Developer Free resources for learning Full Stack Web Development 项目地址: https://gitcode.com/gh_mirrors/be/Become-A-Full-Stack-…...

Z-score本质:数据标准化的底层逻辑与工程实践

1. 为什么你手里的“85分”和隔壁班的“92分”根本不在一个赛道上?——Z-score不是数学游戏,是数据世界的通用翻译器你刚拿到一份体检报告,上面写着骨密度T值-1.8,医生说“轻度骨量减少”;转头又看到孩子期末考卷&…...

CANN/shmem编译构建指南

编译与构建 【免费下载链接】shmem CANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。 项目地址: https://gitcode.com/cann/shmem SHMEM编译 下载SHMEM源码 git clone https://git…...

终极指南:如何使用Deep-Research进行物联网设备连接与数据采集研究

终极指南:如何使用Deep-Research进行物联网设备连接与数据采集研究 【免费下载链接】deep-research An AI-powered research assistant that performs iterative, deep research on any topic by combining search engines, web scraping, and large language model…...

终极指南:掌握Sanic参数验证,保障Web应用数据完整性

终极指南:掌握Sanic参数验证,保障Web应用数据完整性 【免费下载链接】sanic Accelerate your web app development | Build fast. Run fast. 项目地址: https://gitcode.com/gh_mirrors/sa/sanic 在当今快速发展的Web应用开发中,Sani…...

如何高效使用XUnity自动翻译器:游戏本地化终极指南

如何高效使用XUnity自动翻译器:游戏本地化终极指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为外语游戏的语言障碍而烦恼吗?每次打开心仪的游戏,却因为看不懂…...

面向空间环境的星载AI系统设计:从挑战到工程实践

1. 项目概述:当AI遇见深空“把AI送上太空”,这听起来像是科幻电影里的情节,但SpIRIT卫星的Loris成像载荷项目,正在将这一构想变为现实。作为一名长期关注航天与边缘计算交叉领域的技术从业者,我深知这其中的挑战与魅力…...

从LIME到因果干预:可解释AI技术演进与反事实解释实践

1. 项目概述:从“事后诸葛亮”到“事前诸葛亮”的AI解释之路最近几年,我身边越来越多的团队在部署AI模型时,都遇到了一个共同的“信任墙”:模型预测得再准,业务方和用户总会问一句——“它为什么这么判断?”…...

AI学习持久性研究:社会归属感与编程信心如何影响学生坚持

1. 项目概述:为什么我们要关心“坚持”这件事? 在机器学习与人工智能这个领域待久了,你可能会发现一个有趣的现象:每年都有大量充满热情的学生涌入,但几年后,真正能在这个领域深耕并做出成绩的,…...

终极前端性能清单:长期性能维护的完整指南

终极前端性能清单:长期性能维护的完整指南 【免费下载链接】Front-End-Performance-Checklist 🎮 The only Front-End Performance Checklist that runs faster than the others 项目地址: https://gitcode.com/gh_mirrors/fr/Front-End-Performance-C…...

阴阳师自动化脚本:智能百鬼夜行AI助手完全指南

阴阳师自动化脚本:智能百鬼夜行AI助手完全指南 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 阴阳师自动化脚本(Onmyoji Auto Script)是一款…...

5款MySQL驱动性能大比拼:为什么这个纯Node.js客户端能脱颖而出?

5款MySQL驱动性能大比拼:为什么这个纯Node.js客户端能脱颖而出? 【免费下载链接】mysql A pure node.js JavaScript Client implementing the MySQL protocol. 项目地址: https://gitcode.com/gh_mirrors/my/mysql 在现代Web开发中,选…...

在Obsidian中构建AI工作流:ChatGPT MD插件配置与本地LLM部署指南

1. 项目概述:在Obsidian中构建你的私人AI工作流 如果你和我一样,是个重度依赖Obsidian进行知识管理、写作和思考的人,那么你一定遇到过这样的场景:在整理笔记时,突然冒出一个想法需要验证;在撰写文章时&am…...

PotPlayer字幕翻译插件完整指南:免费实现实时双语字幕

PotPlayer字幕翻译插件完整指南:免费实现实时双语字幕 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为看不懂外语电影…...

TensorFlow-Course:Colab云端开发终极指南

TensorFlow-Course:Colab云端开发终极指南 【免费下载链接】TensorFlow-Course :satellite: Simple and ready-to-use tutorials for TensorFlow 项目地址: https://gitcode.com/gh_mirrors/te/TensorFlow-Course TensorFlow-Course是一个专为初学者设计的T…...

终极指南:NHSE - 深度解析《动物森友会》存档编辑器的技术实现与实战应用

终极指南:NHSE - 深度解析《动物森友会》存档编辑器的技术实现与实战应用 【免费下载链接】NHSE Animal Crossing: New Horizons save editor 项目地址: https://gitcode.com/gh_mirrors/nh/NHSE NHSE(Animal Crossing: New Horizons Save Editor…...

claude code用户如何通过taotoken解决封号与token不足困扰

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Claude Code用户如何通过Taotoken解决封号与Token不足困扰 应用场景类,许多Claude Code用户面临官方账号不稳定或额度快…...

CANN/metadef AppendDim函数API

AppendDim 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 向后扩展一个dim值,如果扩展的dim数量超出Shape的最大限制,那么本函数不做任何事情。 函数原型 Shape& AppendDim(c…...

LangChain实战指南:从零构建生成式AI应用的核心架构与优化

1. 项目概述:当LangChain遇上生成式AI,我们能构建什么?最近在GitHub上看到一个挺有意思的项目,benman1/generative_ai_with_langchain。光看名字,就能猜到它的核心:用LangChain这个框架来玩转生成式AI。这其…...

CANN/ops-cv最近邻上采样算子

UpsampleNearest 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 …...

AI监管框架:技术不确定性、全球路径与治理平衡

1. 项目概述:当AI监管遇上“薛定谔的猫”如果你问一个AI开发者最头疼什么,除了算力和数据,答案里大概率会有“监管”二字。这感觉就像在高速公路上开一辆没有明确交通规则的新概念车——你不知道限速多少,不知道哪个车道能走&…...