当前位置: 首页 > article >正文

CANN/asc-devkit Atan函数API

Atan【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√Kirin X90√Kirin 9030√功能说明按元素做三角函数反正切运算计算公式如下函数原型通过sharedTmpBuffer入参传入临时空间源操作数Tensor全部/部分参与计算template typename T, bool isReuseSource false, const AtanConfig config defaultAtanConfig __aicore__ inline void Atan(const LocalTensorT dstTensor, const LocalTensorT srcTensor, const LocalTensoruint8_t sharedTmpBuffer, const uint32_t calCount)源操作数Tensor全部参与计算template typename T, bool isReuseSource false, const AtanConfig config defaultAtanConfig __aicore__ inline void Atan(const LocalTensorT dstTensor, const LocalTensorT srcTensor, const LocalTensoruint8_t sharedTmpBuffer)接口框架申请临时空间源操作数Tensor全部/部分参与计算template typename T, bool isReuseSource false, const AtanConfig config defaultAtanConfig __aicore__ inline void Atan(const LocalTensorT dstTensor, const LocalTensorT srcTensor, const uint32_t calCount)源操作数Tensor全部参与计算template typename T, bool isReuseSource false, const AtanConfig config defaultAtanConfig __aicore__ inline void Atan(const LocalTensorT dstTensor, const LocalTensorT srcTensor)由于该接口的内部实现中涉及复杂的数学计算需要额外的临时空间来存储计算过程中的中间变量。临时空间支持开发者通过sharedTmpBuffer入参传入和接口框架申请两种方式。通过sharedTmpBuffer入参传入使用该tensor作为临时空间进行处理接口框架不再申请。该方式开发者可以自行管理sharedTmpBuffer内存空间并在接口调用完成后复用该部分内存内存不会反复申请释放灵活性较高内存利用率也较高。接口框架申请临时空间开发者无需申请但是需要预留临时空间的大小。通过sharedTmpBuffer传入的情况开发者需要为tensor申请空间接口框架申请的方式开发者需要预留临时空间。临时空间大小BufferSize的获取方式如下通过GetAtanMaxMinTmpSize中提供的接口获取需要预留空间范围的大小。参数说明表 1模板参数说明参数名描述T操作数的数据类型。Ascend 950PR/Ascend 950DT支持的数据类型为half、float。Atlas A3 训练系列产品 / Atlas A3 推理系列产品支持的数据类型为half、float。Atlas A2 训练系列产品 / Atlas A2 推理系列产品支持的数据类型为half、float。Kirin X90支持的数据类型为half、float。Kirin 9030支持的数据类型为half、float。isReuseSource是否允许修改源操作数。该参数预留传入默认值false即可。configAtan算法的相关配置。此参数可选配AtanConfig类型具体定义如下方代码所示其中参数的含义为algoAtan内部实现使用的算法。AtanAlgo类型支持的取值如下TAYLOR_EXPANSION默认值。该算法使用6阶泰勒展开实现Atan支持的数据类型为half、float。POLYNOMIAL_APPROXIMATION该算法是17次多项式逼近算法支持的数据类型为float。enum class AtanAlgo { TAYLOR_EXPANSION 0, POLYNOMIAL_APPROXIMATION, }; struct AtanConfig { AtanAlgo algo AtanAlgo::TAYLOR_EXPANSION; };表 2参数说明参数名输入/输出描述dstTensor输出目的操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。srcTensor输入源操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。源操作数的数据类型需要与目的操作数保持一致。sharedTmpBuffer输入临时缓存。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。临时空间大小BufferSize的获取方式请参考GetAtanMaxMinTmpSize。calCount输入参与计算的元素个数。返回值说明无约束说明不支持源操作数与目的操作数地址重叠。不支持sharedTmpBuffer与源操作数和目的操作数地址重叠。操作数地址对齐要求请参见通用地址对齐约束。调用示例AscendC::TPipe pipe; AscendC::TQueAscendC::TPosition::VECCALC, 1 tmpQue; pipe.InitBuffer(tmpQue, 1, bufferSize); // bufferSize 通过Host侧tiling参数获取 AscendC::LocalTensoruint8_t sharedTmpBuffer tmpQue.AllocTensoruint8_t(); // 输入tensor长度为1024, 算子输入的数据类型为half, 实际计算个数为512 AscendC::Atan(dstLocal, srcLocal, sharedTmpBuffer, 512); // 指定输入算法为POLYNOMIAL_APPROXIMATION, 输入的数据类型为float, 实际计算个数为512 static constexpr AscendC::AtanConfig atanConfig { AscendC::AtanAlgo::POLYNOMIAL_APPROXIMATION}; AscendC::Atanfloat, false, atanConfig(dstLocal, srcLocal, sharedTmpBuffer, 512);结果示例如下输入数据(srcLocal): [0.76769257 -0.23710161 ... 2.770608 1.0303017] 输出数据(dstLocal): [0.65472853 -0.23280266 ... 1.2244163 0.80032176]【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/asc-devkit Atan函数API

Atan 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com/cann/…...

如何从八大主流网盘获取真实下载链接?LinkSwift开源工具深度解析

如何从八大主流网盘获取真实下载链接?LinkSwift开源工具深度解析 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云…...

SD-WebUI-Inpaint-Anything 插件:自定义修复模型终极配置指南

SD-WebUI-Inpaint-Anything 插件:自定义修复模型终极配置指南 【免费下载链接】sd-webui-inpaint-anything Inpaint Anything extension performs stable diffusion inpainting on a browser UI using masks from Segment Anything. 项目地址: https://gitcode.co…...

AI赋能人才分析:从数据清洗到算法应用的全景解析

1. 项目概述:当AI遇见人才管理在人力资源这个传统上高度依赖“直觉”和“经验”的领域,一场静默的革命正在发生。过去,HR经理们筛选简历、评估候选人、预测员工离职风险,很大程度上依赖于个人判断和有限的量化指标。然而&#xff…...

DeepVision实时视频流处理:10个高效实现技巧

DeepVision实时视频流处理:10个高效实现技巧 【免费下载链接】DeepVision 在我很多项目中用到的CV算法推理框架应用。 项目地址: https://gitcode.com/gh_mirrors/de/DeepVision DeepVision是一个功能强大的CV算法推理框架应用,专为实时视频流处理…...

AdGuardHomeRules自动化更新机制详解:如何保持规则库始终最新

AdGuardHomeRules自动化更新机制详解:如何保持规则库始终最新 【免费下载链接】AdGuardHomeRules 高达百万级规则!由我原创&整理的 AdGuardHomeRules ADH广告拦截过滤规则!打造全网最强最全规则集 项目地址: https://gitcode.com/gh_mi…...

TokenTracker:基于事件监听的以太坊代币转账实时追踪工具实战

1. 项目概述与核心价值最近在搞一个涉及链上数据分析的小项目,需要实时追踪特定代币的链上转账记录。一开始想着直接用区块浏览器的API,但试了几个发现要么有频率限制,要么数据不够实时,要么就是没法按我想要的粒度(比…...

基于AI编辑器的本地化生产力系统:jw-agenda智能体技能深度解析

1. 项目概述:一个为AI编辑器而生的本地化生产力系统 如果你和我一样,日常重度依赖 Cursor 或 Claude 这类 AI 驱动的编辑器,那你肯定也经历过这种场景:脑子里有一堆待办事项,项目规划散落在各个角落,想用 …...

CANN元数据定义基础库

metadef 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 🔥Latest News [2025/12/26] metadef项目首次上线。 🚀概述 metadef,即昇腾元数据定义,用于定义相关数据结构…...

基于OpenClaw智能体生态系统的神经多样性家庭支持平台设计

1. 项目概述:一个面向神经多样性家庭的支持性智能体生态系统最近在开源社区里,我注意到一个名为“neurofamily-support-openclaw-agent-ecosystem”的项目,它来自boktoday这个组织。这个标题本身就很有意思,它像是一个技术愿景的浓…...

Firebase Auth实战:构建雅思练习Web应用的用户认证系统

1. 项目概述:一个基于Firebase的雅思练习Web应用 最近在GitHub上看到一个挺有意思的练手项目,叫“IELTS Practice - Firebase Authentication”。这项目本质上是一个前端练手Demo,核心目标是通过构建一个简单的雅思练习网站,来学…...

生成式AI图像偏见:技术根源、分类与缓解策略

1. 项目概述:当AI开始“画画”,它看到了谁?生成式AI图像模型,比如大家熟知的Stable Diffusion、DALL-E或者Midjourney,已经从一个极客玩具变成了设计师、营销人员和内容创作者的日常工具。只需要输入一段文字描述&…...

AI眼底疾病诊断:从图像处理到深度学习的技术融合与实践

1. 项目概述:当AI遇见眼底,一场关于“看见”的革命作为一名在医疗影像和计算机视觉交叉领域摸爬滚打了十多年的从业者,我亲眼见证了技术如何一步步改变诊断的范式。今天想和大家深入聊聊的,是“AI在视网膜疾病诊断中的应用”这个既…...

构建无缝数字收藏库:picacomic-downloader智能管理解决方案

构建无缝数字收藏库:picacomic-downloader智能管理解决方案 【免费下载链接】picacomic-downloader 哔咔漫画 picacomic pica漫画 bika漫画 PicACG 多线程下载器,带图形界面 带收藏夹,已打包exe 下载速度飞快 项目地址: https://gitcode.co…...

tao-8k Embedding模型工业质检:设备说明书长文本向量化与故障描述语义匹配

tao-8k Embedding模型工业质检:设备说明书长文本向量化与故障描述语义匹配 1. 工业质检场景中的文本匹配挑战 在工业设备维护和质检领域,技术人员每天都要面对大量的设备说明书、故障报告和维护记录。传统的关键词匹配方式经常遇到这样的问题&#xff…...

ChatGPT在教育领域的应用、挑战与未来展望:AI导师如何重塑教学

1. 项目概述:当AI导师走进课堂“ChatGPT在教育领域的应用、挑战与未来展望”这个标题,乍一看像是一篇学术论文的题目,但背后折射出的,是每一位教育工作者、学生乃至家长都在亲身经历的一场静默革命。作为一名长期关注技术与教育交…...

QYVXHOOK最新版5.0.0.6008(qywxhook5.0)与4.1.303.6009双版本发布|含LOAD.dll+Helper.dll调用示例

温馨提示:文末有联系方式QYVXHOOK双版本正式发布:功能升级,即开即用 QYVXHOOK现已推出两个经过实测验证的稳定分支——全新旗舰版5.0.0.6008(对应qywxhook5.0)与高兼容性精简版4.1.303.6009,分别定价150元与…...

AI在创业金融中的三十年演进:从SVM到神经网络的融合应用

1. 项目概述:当AI遇见创业金融如果你在金融科技圈待过几年,或者自己创过业、融过资,你大概率会听过这样的故事:一个满怀激情的创始人,拿着一份精心打磨的商业计划书,见了十几个投资人,最后因为“…...

基于间隔重复算法的本地知识管理工具RecallForge部署与实战

1. 项目概述:从“遗忘”到“掌控”的智能记忆工具在信息爆炸的时代,我们每天都在与海量的数字内容打交道——浏览的文章、收藏的链接、闪过的灵感、待办的任务。然而,一个普遍且令人沮丧的现象是:我们“收藏即遗忘”。那些被我们精…...

把 ABAP Cloud 的入站集成服务做明白,从 OData Web API、HTTP Service、RFC 到 SQL Service 的完整落地路径

在做 SAP BTP ABAP environment 或者 S/4HANA Cloud 的系统集成时,最容易被低估的一块,不是业务逻辑本身,而是你把能力暴露给外部系统的那条链路,到底该用什么协议、怎么做发布、管理员又该怎么把认证和授权接起来。很多团队一谈集成,就只盯着接口实现类,结果开发对象做完…...

AI-XR元宇宙隐私保护:从数据安全到可信计算的技术实践

1. 项目概述:当虚拟与现实交织,隐私的边界在哪里?“AI-XR元宇宙隐私保护”这个标题,乍一看充满了前沿科技感,但它的核心其实是一个我们每个人在数字时代都正在面临的、日益严峻的现实问题。AI(人工智能&…...

去中心化网络中生成式AI的可复现性与共识验证研究

1. 项目概述:当AI遇见去中心化,可复现性为何成为“圣杯”?最近和几个做AI模型和区块链的朋友聊天,大家不约而同地提到了一个共同的痛点:“你这模型结果,我怎么复现不出来?”这几乎是所有AI研究者…...

GPT-4核心技术解析与企业级应用实践指南

1. GPT-4技术本质解析GPT-4作为当前最先进的大语言模型之一,其核心架构基于Transformer神经网络。与早期版本相比,它在模型规模、训练数据和算法优化上都有显著提升。具体表现为:参数量达到万亿级别(具体数值未公开)训…...

AI Agent技能管理革命:用skill-mix统一管理Cursor、Claude Code插件生态

1. 项目概述:一个AI Agent技能的管理层如果你和我一样,深度使用Cursor、Codex和Claude Code这类AI编程助手,那你一定遇到过这样的场景:在GitHub上看到一个很酷的“代码重构”技能,兴冲冲地下载下来,却发现它…...

NumPy时间序列分析:10个高效单行代码技巧

1. 时间序列分析中的NumPy高效技巧在处理时间序列数据时,我们经常需要执行各种重复性操作,比如计算移动平均、检测异常值、创建预测特征等。许多分析师会不自觉地编写冗长的循环和复杂函数来完成这些任务,但实际上,使用NumPy的数组…...

AI心智理论:从信念推理到社会智能的技术实现与应用

1. 项目概述:当AI开始“揣测”人心最近和几个做认知科学和复杂系统的朋友聊天,话题总绕不开一个词:“心智理论”。这可不是什么玄学,简单说,就是个体理解自己以及他人拥有信念、欲望、意图等心理状态,并能据…...

微软Word APA 7th Edition引用样式终极解决方案:告别格式混乱的学术写作体验

微软Word APA 7th Edition引用样式终极解决方案:告别格式混乱的学术写作体验 【免费下载链接】APA-7th-Edition Microsoft Word XSD for generating APA 7th edition references 项目地址: https://gitcode.com/gh_mirrors/ap/APA-7th-Edition 还在为学术论文…...

Z-Image Turbo实战案例:营销文案配图一体化生成

Z-Image Turbo实战案例:营销文案配图一体化生成 1. 项目背景与价值 在数字营销时代,内容创作的速度和质量直接影响营销效果。传统的营销内容制作需要文案撰写和图片设计分开进行,不仅耗时耗力,还容易出现风格不统一的问题。 Z-…...

XUnity.AutoTranslator终极指南:让所有游戏秒变中文版

XUnity.AutoTranslator终极指南:让所有游戏秒变中文版 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为看不懂的外文游戏发愁吗?XUnity.AutoTranslator是一款开源游戏翻译神器…...

TPFanCtrl2:ThinkPad风扇控制的终极解决方案

TPFanCtrl2:ThinkPad风扇控制的终极解决方案 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 你是否厌倦了ThinkPad风扇在安静办公时突然狂转?或…...