当前位置: 首页 > article >正文

CANN/pyasc块内最小值归约API文档

asc.language.basic.block_reduce_min【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascasc.language.basic.block_reduce_min(dst: LocalTensor, src: LocalTensor, repeat: int, mask: int, dst_rep_stride: int, src_blk_stride: int, src_rep_stride: int) → Noneasc.language.basic.block_reduce_min(dst: LocalTensor, src: LocalTensor, repeat: int, mask: List[int], dst_rep_stride: int, src_blk_stride: int, src_rep_stride: int) → None对每个datablock内所有元素求最小值。对应的Ascend C函数原型mask逐比特模式template typename T, bool isSetMask true __aicore__ inline void BlockReduceMin(const LocalTensorT dst, const LocalTensorT src, const int32_t repeatTime, const uint64_t mask[], const int32_t dstRepStride, const int32_t srcBlkStride, const int32_t srcRepStride)mask连续模式template typename T, bool isSetMask true __aicore__ inline void BlockReduceMin(const LocalTensorT dst, const LocalTensorT src,const int32_t repeatTime, const int32_t mask, const int32_t dstRepStride, const int32_t srcBlkStride, const int32_t srcRepStride)参数说明is_set_mask: 是否在接口内部设置mask。True表示在接口内部设置mask。False表示在接口外部设置mask开发者需要使用set_vector_mask接口设置mask值。这种模式下本接口入参中的mask值必须设置为占位符MASK_PLACEHOLDER。dst目的操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。LocalTensor的起始地址需要保证16字节对齐针对half数据类型32字节对齐针对float数据类型。src: 源操作数。类型为LocalTensor支持的TPosition为VECIN/VECCALC/VECOUT。LocalTensor的起始地址需要32字节对齐。repeat_time迭代次数。取值范围为[0, 255]。mask 控制每次迭代内参与计算的元素。逐bit模式mask为数组形式。数组长度和数组元素的取值范围和操作数的数据类型有关。可以按位控制哪些元素参与计算bit位的值为1表示参与计算0表示不参与。操作数 16 位数组长度 2mask[0], mask[1] ∈ [0, 2⁶⁴-1]且不能同时为 0操作数 32 位数组长度 1mask[0] ∈ (0, 2⁶⁴-1]操作数 64 位数组长度 1mask[0] ∈ (0, 2³²-1]例如mask [8, 0]表示仅第 4 个元素参与计算连续模式mask为整数形式。表示前面连续多少个元素参与计算。取值范围和操作数的数据类型有关数据类型不同每次迭代内能够处理的元素个数最大值不同。操作数 16 位mask ∈ [1, 128]操作数 32 位mask ∈ [1, 64]操作数 64 位mask ∈ [1, 32]dst_rep_stride目的操作数相邻迭代间的地址步长。以一个repeat_time归约后的长度为单位。每个repeat_time(8个datablock)归约后得到8个元素所以输入类型为half类型时RepStride单位为16Byte输入类型为float类型时RepStride单位为32Byte。src_blk_stride单次迭代内datablock的地址步长。src_rep_stride源操作数相邻迭代间的地址步长即源操作数每次迭代跳过的datablock数目。约束说明操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。为了节省地址空间您可以定义一个Tensor供源操作数与目的操作数同时使用即地址重叠需要注意计算后的目的操作数数据不能覆盖未参与计算的源操作数需要谨慎使用。针对不同场景合理使用归约指令可以带来性能提升, 相关介绍请参考选择低延迟指令优化归约操作性能。调用示例mask连续模式asc.block_reduce_min(z_local, x_local, repeat1, mask128, dst_rep_stride8, src_blk_stride1, src_rep_stride8)mask逐bit模式uint64_max 2**64 - 1 mask [uint64_max, uint64_max] asc.block_reduce_min(z_local, x_local, repeat1, maskmask, dst_rep_stride8, src_blk_stride1, src_rep_stride8)【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/pyasc块内最小值归约API文档

asc.language.basic.block_reduce_min 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.basic.…...

CANN/pyasc加法ReLU类型转换API

asc.language.basic.add_relu_cast 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.basic.add…...

AI监管政策分析框架:从技术不确定性到全球治理的合规导航

1. 项目概述:当AI撞上“红绿灯”最近和几个做AI产品落地的朋友聊天,大家不约而同地提到了同一个词:合规。以前我们聊的都是模型精度、算力成本、用户增长,现在话题的焦点变成了“这个功能会不会触发监管红线”、“数据跨境怎么处理…...

数据驱动的可解释AI:从特征归因到样本影响分析的实践指南

1. 项目概述:当数据挖掘遇见可解释AI在深度学习的浪潮席卷了几乎所有领域之后,我们获得了一个又一个性能惊人的“黑箱”模型。作为一名长期在数据科学一线工作的从业者,我见证了模型精度从90%提升到99.9%的激动,也亲历了当业务方或…...

基于MCP协议构建MeiliSearch AI助手集成:安全搜索与工作流自动化

1. 项目概述:一个为MeiliSearch打造的MCP服务器如果你正在使用MeiliSearch这个高性能的开源搜索引擎,并且同时是AI Agent生态(比如Claude、Cursor等)的深度用户,那么你很可能遇到过这样的痛点:如何在AI工作…...

修改寄存器的位操作方法

某一位&#xff08;不分组&#xff09;&#xff1a;对变量某位清零&#xff1a; a & ~(1 <<N); 对变量某位置1&#xff1a; a | (1 <<N); 对变量某位取反&#xff1a; a ^ (1 <<N); 分组&#xff08;连续位&#xff09;的情况&#xff1a;A <…...

AI责任归属:从算法黑箱到法律虚构的治理路径

1. 项目概述&#xff1a;当算法“犯错”&#xff0c;谁该负责&#xff1f;最近和一位做AI产品经理的朋友聊天&#xff0c;他提到一个让他头疼的案例&#xff1a;他们公司的一款用于简历初筛的AI工具&#xff0c;在一次使用中&#xff0c;意外地将一批来自某所顶尖高校的毕业生简…...

CANN电力负荷预测算子库

【免费下载链接】elec-ops-prediction elec-ops-prediction 是 CANN 社区 Electrical Engineering SIG&#xff08;电力行业兴趣小组&#xff09;旗下的电力负荷预测算子库&#xff0c; 聚焦于电力系统运行、调度、规划与市场交易中的预测核心需求&#xff0c;面向华为昇腾&…...

创业公司如何借助Taotoken快速原型验证多个AI创意

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 创业公司如何借助Taotoken快速原型验证多个AI创意 对于资源有限的创业团队而言&#xff0c;产品构思阶段往往伴随着大量的不确定性…...

对抗性可解释AI:攻击原理、防御策略与工程实践

1. 项目概述&#xff1a;当可解释性遭遇对抗攻击在机器学习模型日益渗透到高风险决策领域的今天&#xff0c;可解释人工智能&#xff08;XAI&#xff09;被寄予厚望&#xff0c;成为连接复杂算法与人类信任的桥梁。无论是医生需要理解AI辅助诊断的依据&#xff0c;还是法官需要…...

2026年网络安全自学入门(超详细)从入门到精通学习路线规划,学完即可就业!_网安学习路线

随着数字化转型加速与网络威胁常态化&#xff0c;网络安全已成为数字经济的 “安全底座”。2026 年行业数据显示&#xff0c;全球网络安全人才缺口超 300 万&#xff0c;国内缺口达数百万&#xff0c;平均起薪较 IT 行业高出 20%-30%&#xff0c;且呈现 “越老越值钱” 的职业发…...

OpenClaw AI助手架构解析:模块化设计、记忆系统与自动化实践

1. 项目概述&#xff1a;一个AI助手的“数字大脑”与自动化中枢如果你正在构建或研究一个功能完备的AI助手&#xff0c;那么如何管理它日益增长的“记忆”、行为准则、技能库和自动化任务&#xff0c;绝对是一个甜蜜的烦恼。今天要聊的这个项目——luovicter-collab/openclaw-d…...

AI心智理论与人工社会智能:从提示到自发的范式变革

1. 项目概述&#xff1a;当AI开始“揣测”人心最近和几个做认知科学和强化学习的朋友聊天&#xff0c;大家不约而同地提到了一个词&#xff1a;“心智理论”。这可不是什么哲学玄谈&#xff0c;而是AI领域一个越来越“烫手”的山芋。简单说&#xff0c;心智理论就是个体理解自己…...

3分钟快速上手:PotPlayer字幕翻译插件的终极配置指南

3分钟快速上手&#xff1a;PotPlayer字幕翻译插件的终极配置指南 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还在为外语视频的字幕…...

AI赋能航天制造:CV+LLM混合架构实现装配指令自动化生成

1. 项目概述&#xff1a;当大语言模型遇见航天器装配指令 在航天器制造这个精密到微米、容错率近乎为零的领域&#xff0c;每一份技术文档都承载着千斤重担。想象一下&#xff0c;你是一位负责“欧罗巴快帆”&#xff08;Europa Clipper&#xff09;任务中某个印刷线路板组件装…...

物理AI在智慧交通系统中的应用 iTSTech 2026-5

研究背景与定位城市化带来拥堵、事故、污染等问题&#xff0c;智慧交通亟需适配物理世界、高实时性的 AI 技术&#xff1b;大模型存在 “物理盲”、延迟高、难实时决策等短板&#xff0c;而物理 AI&#xff08;具身智能&#xff09; 因能理解物理规律、实现实时交互&#xff0c…...

AI公平性实践指南:AIF360、LiFT与WIT三大开源工具解析

1. 项目概述&#xff1a;当AI需要“公平”的标尺最近几年&#xff0c;AI模型在招聘、信贷、司法等关键领域的应用越来越深入&#xff0c;一个老问题也随之被放大&#xff1a;算法真的公平吗&#xff1f;我们训练模型用的数据&#xff0c;本身就带着人类社会固有的偏见&#xff…...

CANN Gather算子API描述

Gather 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力&#xff0c;涵盖算子生成、算子优化等领域&#xff0c;支撑模型选型、训练效果评估&#xff0c;统一量化评估标准&#xff0c;识别Agent能力短板&#xff0c;构建CANN领域评测平台&#x…...

基于Convex与技能系统的云端AI助手clawsync部署与实战指南

1. 项目概述&#xff1a;打造你的专属云端AI助手 最近在折腾个人AI助理工具&#xff0c;发现了一个挺有意思的开源项目——clawsync。简单来说&#xff0c;它让你能轻松在云端部署一个属于你自己的AI助手&#xff0c;自带聊天界面&#xff0c;还能通过技能系统扩展功能&#xf…...

CANN/hcomm通信数据类型定义

数据类型定义 【免费下载链接】hcomm HCOMM&#xff08;Huawei Communication&#xff09;是HCCL的通信基础库&#xff0c;提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm CommTopoCommLinkCommMemCommMemTypeChannelHandleThreadHandle…...

代购必备:这 5 款工具让你效率翻倍

工具一&#xff1a;跨境电商管理系统 做跨境代购&#xff0c;工具用得好&#xff0c;效率能翻倍。今天分享 5 款我最常用的工具。 这是最核心的工具。好的系统帮你解决&#xff1a; 自动采购&#xff1a;复制链接自动下单仓储管理&#xff1a;商品入库、质检、出库物流追踪&…...

在自动化工作流中实现多模型 API 供应商的动态切换

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 在自动化工作流中实现多模型 API 供应商的动态切换 应用场景类&#xff0c;当企业需要构建高可用的 AI 应用时&#xff0c;依赖单一…...

CANN/metadef:Tensor创建API文档

CreateFollowing 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 创建一个指定数据类型以及大小的Tensor&#xff0c;其数据在TensorV2对象后连续排布。 函数原型 传入元素个数和数据类型&#xff0c;创建…...

WHERE子句中的函数调用:KES与Oracle的执行顺序陷阱

WHERE子句中的函数调用&#xff1a;KES与Oracle的执行顺序陷阱在 WHERE 子句里放一个"有副作用"的函数&#xff0c;就像在高速公路上放了一个随机变道的司机——也许今天没事&#xff0c;但迟早会出事故。引言&#xff1a;一段看起来"理所当然"的代码 在一…...

CANN/ge静态Shape运行时约束文档

静态Shape运行时约束文档 【免费下载链接】ge GE&#xff08;Graph Engine&#xff09;是面向昇腾的图编译器和执行器&#xff0c;提供了计算图优化、多流并行、内存复用和模型下沉等技术手段&#xff0c;加速模型执行效率&#xff0c;减少模型内存占用。 GE 提供对 PyTorch、T…...

三维分子表征学习:从不变性、等变性到高体阶方法的技术演进与实践

1. 项目概述&#xff1a;三维分子表征学习的核心挑战与演进在药物发现、材料科学和催化设计等领域&#xff0c;理解分子的三维结构如何决定其性质与功能&#xff0c;是一个根本性的科学问题。传统的实验方法耗时耗力&#xff0c;而计算模拟&#xff0c;特别是基于量子力学的计算…...

卷积改进与轻量化:重参数化再升级:RepConv 引入多尺度分支,训练期提取多感受野特征,推理单路无损

一、问题缘起:当单结构不再够用 2026年已经过半,计算机视觉模型在边缘端的部署需求持续井喷。根据Ultralytics官方博客在2026年4月发布的信息,YOLO26 Nano模型在标准CPU上的推理速度较YOLO11提升了高达43%,这标志着边缘AI进入了一个新的加速周期。然而,这个成绩的背后隐藏…...

超 5 成银行已用!2026 银行大模型 + 19 个智能体案例复盘

人工智能技术的迭代演进&#xff0c;正深刻重构金融行业的服务模式、业务逻辑与竞争格局&#xff0c;而大模型作为生成式AI的核心载体&#xff0c;自2023年以来&#xff0c;历经三年探索、试点与沉淀&#xff0c;已从“概念狂欢”逐步走向“价值落地”&#xff0c;成为中国银行…...

数据网格架构:云原生时代的数据管理新范式

数据网格架构&#xff1a;云原生时代的数据管理新范式 一、数据网格的概念与价值 1.1 数据网格的定义 数据网格&#xff08;Data Mesh&#xff09;是一种去中心化的数据架构模式&#xff0c;将数据视为产品&#xff0c;由各个业务域自主管理和提供数据服务。与传统的集中式数据…...

干货|Active-Active/Active-Passive 数据库架构解析:高可用设计中的权衡与选型

在技术领域&#xff0c;我们常常被那些闪耀的、可见的成果所吸引。今天&#xff0c;这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力&#xff0c;让我们得以一窥未来的轮廓。然而&#xff0c;作为在企业一线构建、部署和维护复杂系统的实践者&#xff0c;我们深知…...