当前位置: 首页 > article >正文

CANN/ops-tensor贡献指南

贡献指南【免费下载链接】ops-tensorops-tensor 是 CANN Compute Architecture for Neural Networks算子库中提供张量类计算的基础算子库采用模块化设计支持灵活的算子开发和管理。项目地址: https://gitcode.com/cann/ops-tensor本项目欢迎广大开发者体验并参与贡献在参与社区贡献之前。请参见cann-community了解行为准则进行CLA协议签署了解源码仓的贡献流程。开发者准备本地代码与提交PR时需要重点关注如下几点提交PR时请按照PR模板仔细填写本次PR的业务背景、目的、方案等信息。若您的修改不是简单的bug修复而是涉及到新增特性、新增接口、新增配置参数或者修改代码流程等请务必先通过Issue进行方案讨论以避免您的代码被拒绝合入。若您不确定本次修改是否可被归为简单的bug修复亦可通过提交Issue进行方案讨论。开发者贡献场景主要包括一、贡献新算子如果您有全新的算子希望基于 NPU 进行设计与实现欢迎在 Issue 中提出您的想法与设计方案。完整的贡献流程如下1. 新增 Issue创建需求新建Requirement|需求建议类 Issue并在其中说明新增算子的设计方案。Issue 需包含以下内容背景信息价值/作用设计方案同时请在提交的 Issue 中评论/assign yourself认领该任务。2. 需求评审Sig组将指派Committer对您提交的 Issue 进行评审并给出修改意见。请在完成修改后于 Issue 中对应Committer。若需求被接纳sig成员将为您分配合适的算子分类路径以便您将贡献的算子提交至对应目录。3. 提交 PR算子交付件如下src # 算子源码目录 ├── ${op_name} # 算子名 │ ├── ${op_name}_kernel.cpp # 算子实现文件 │ ├── ${op_name}_host.cpp # Host侧代码 │ ├── arch35/ # Ascend950特有实现 │ │ └── ${op_name}_struct.h # 算子结构定义 │ └── tests │ ├── test_${op_name}.cpp # 算子测试文件 ├── CMakeLists.txt # 算子编译配置文件 ├── README.md # 算子README文档代码上库要求代码交付件需包含算子实现、算子测试文件、算子README文档文档中说明算子提交人、功能、参数说明是否签署 CLAPR 是否已关联对应 Issue代码是否符合《C 编程规范》代码是否编译通过4. CI门禁通过评论compile指令触发开源仓门禁并依据 CI 检测结果进行修改目前CI门禁包含以下检查项代码编译静态检查如涉及codecheck误报请提交给sig成员屏蔽UT测试冒烟测试门禁通过后请在关联的 Issue 中指派的Committer。5. Committer检视Committer检视后将反馈检视意见请完成所有修改后指派的Committer。6. Maintainer检视合入Committer 检视通过后标注/lgtm标签。Maintainer 将在1天内进行最终审核确认无问题后将标注/approve标签合入PR。二、算子Bug修复如果您在本项目中发现了某些算子Bug希望对其进行修复欢迎您新建Issue进行反馈和跟踪处理。您可以按照提交Issue/处理Issue任务指引新建Bug-Report|缺陷反馈类Issue对Bug进行描述然后在评论框中输入/assign或/assign yourself将该Issue分配给您进行处理。三、算子优化如果您对本项目中某些算子实现有泛化性增强/性能优化思路希望着手实现这些优化点欢迎您对算子进行优化贡献。您可以按照提交Issue/处理Issue任务指引新建Requirement|需求建议类Issue对优化点进行说明并提供您的设计方案 然后在评论框中输入/assign或/assign yourself将该Issue分配给您进行跟踪优化。四、文档纠错如果您在本项目中发现某些算子文档描述错误欢迎您新建Issue进行反馈和修复。您可以按照提交Issue/处理Issue任务指引新建Documentation|文档反馈类Issue指出对应文档的问题然后在评论框中输入/assign或/assign yourself将该Issue分配给您纠正对应文档描述。五、帮助解决他人Issue如果社区中他人遇到的问题您有合适的解决方法欢迎您在Issue中发表评论交流帮助他人解决问题和痛点共同优化易用性。如果对应Issue需要进行代码修改您可以在Issue评论框中输入/assign或/assign yourself将该Issue分配给您跟踪协助解决问题。【免费下载链接】ops-tensorops-tensor 是 CANN Compute Architecture for Neural Networks算子库中提供张量类计算的基础算子库采用模块化设计支持灵活的算子开发和管理。项目地址: https://gitcode.com/cann/ops-tensor创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/ops-tensor贡献指南

贡献指南 【免费下载链接】ops-tensor ops-tensor 是 CANN (Compute Architecture for Neural Networks)算子库中提供张量类计算的基础算子库,采用模块化设计,支持灵活的算子开发和管理。 项目地址: https://gitcode.com/cann/o…...

保姆级教程:用ArcGIS Pro的克里金插值和栅格计算器,搞定水源涵养量评估

从零到精通:ArcGIS Pro水源涵养量评估全流程实战指南 当你第一次在学术论文中看到"水源涵养量评估"这个专业术语时,是否感到无从下手?作为生态规划的基础性工作,准确评估水源涵养能力不仅关系到学术研究的严谨性&#x…...

CANN/ge Format 推导特性分析

Format 推导(Infer Format)特性分析 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型…...

RoboMaster机甲大师赛备赛:如何用STM32+CAN总线精准控制四个大疆3508电机?

RoboMaster机甲大师赛实战:STM32与CAN总线驱动四台大疆3508电机的工程指南 在RoboMaster机甲大师赛中,机器人底盘的运动性能直接决定了战术执行的灵活性和稳定性。四台大疆3508电机通过CAN总线协同工作,需要解决从硬件配置到软件算法的系统工…...

CANN具身智能世界模型指南

cosmos-transfer2.5-2B视频风格转换具身智能世界模型昇腾使用指南 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-i…...

别再只盯着原理了!深入MOS管米勒平台,看懂缓启动电路性能优化的关键

深入MOS管米勒平台:缓启动电路性能优化的关键策略 在电源系统设计中,缓启动电路的重要性往往被低估。许多工程师满足于实现基本功能,却忽略了性能优化的深层机理。当面对更快的稳定时间要求或更精确的电流控制需求时,仅理解基础工…...

CANN pi0.5昇腾推理指南

pi0.5机器人VLA大模型昇腾使用指南 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence pi0.5整体介绍…...

CANN/sip批量矩阵向量乘法

CgemvBatched 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I/500 A2 推…...

M-LLM 赋能高效视频理解:基于帧选择的优化策略深度解析

随着短视频平台的蓬勃发展,视频数据的爆炸式增长给视频理解带来了巨大的挑战。传统的视频理解方法往往需要处理大量的视频帧,计算成本高昂。为了解决这个问题,研究人员提出了基于 M-LLM (Multimodal Large Language Model) 的视频帧选择策略&…...

Balena Etcher:极致安全的跨平台镜像烧录工具深度解析

Balena Etcher:极致安全的跨平台镜像烧录工具深度解析 【免费下载链接】etcher Flash OS images to SD cards & USB drives, safely and easily. 项目地址: https://gitcode.com/GitHub_Trending/et/etcher 还在为制作启动盘而烦恼吗?无论是树…...

CANN PTO自动模式总览

auto模式总览 【免费下载链接】pto-isa Parallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend p…...

AzurLaneAutoScript深度解析:碧蓝航线自动化脚本的技术架构与实践应用

AzurLaneAutoScript深度解析:碧蓝航线自动化脚本的技术架构与实践应用 【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研,全自动大世界 项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript…...

3步解锁高效工作流:KeymouseGo终极鼠标键盘自动化指南

3步解锁高效工作流:KeymouseGo终极鼠标键盘自动化指南 【免费下载链接】KeymouseGo 类似按键精灵的鼠标键盘录制和自动化操作 模拟点击和键入 | automate mouse clicks and keyboard input 项目地址: https://gitcode.com/gh_mirrors/ke/KeymouseGo 你是否厌…...

如何用ContextMenuManager一键净化Windows右键菜单:3个核心功能完全指南

如何用ContextMenuManager一键净化Windows右键菜单:3个核心功能完全指南 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾因Windows右键菜单臃…...

CANN/catlass 3D卷积偏置算子示例

ConvBias Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码组织 ├── 24_conv_bias │ ├── CMakeLists.txt # CMake编译文…...

CANN/catlass优化矩阵乘示例

OptimizedMatmul Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码组织 ├── 06_optimized_matmul │ ├── CMakeLists.txt …...

基于Python标准库构建本地代码解释器:原理、实现与应用

1. 项目概述:一个本地化的代码解释器最近在折腾一些自动化脚本和数据处理任务时,我常常遇到一个场景:手头有一段代码片段,想快速验证一下它的逻辑或者看看输出结果,但要么得打开一个笨重的IDE,要么得在命令…...

【收藏】2026年AI行业最大的机会,毫无疑问就在应用层!

🔥小白必看|程序员速收藏!2026年AI风口已至,错过再等三年! 字节跳动早已嗅到风口,7个核心团队全速布局Agent智能体,从抖音安全业务到全场景落地,持续加码AI应用层布局;腾…...

Meta发布的代码AI会黑进你的电脑吗?

这项由Meta AI安全实验室(MSL Preparedness Team与AI Security Team)联合完成的评估报告,于2026年5月5日正式发布,论文编号为arXiv:2605.00932v1,归类于计算机软件工程(cs.SE)领域,有…...

CANN/runtime Device P2P示例

2_device_P2P 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了如何在多个Device之间进行切换,并进行内存复制。 产品支持情况 本样例支持以下产品: 产品是…...

CANN/pypto余弦计算函数文档

pypto.cos 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atla…...

深度图像先验:基于PyTorch的水印去除终极指南

深度图像先验:基于PyTorch的水印去除终极指南 【免费下载链接】Watermark-Removal-Pytorch 🔥 CNN for Watermark Removal using Deep Image Prior with Pytorch 🔥. 项目地址: https://gitcode.com/gh_mirrors/wa/Watermark-Removal-Pytor…...

如何将网易云音乐NCM文件转换为通用MP3格式:ncmdumpGUI完整教程

如何将网易云音乐NCM文件转换为通用MP3格式:ncmdumpGUI完整教程 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾在网易云音乐下载了心爱的…...

AlphaRank:基于深度强化学习的固定预算排序选择算法

1. 项目概述:当排序遇上预算,一个算法的诞生在数据驱动的决策场景里,我们常常面临一个经典难题:给你一笔固定的“预算”(比如计算资源、测试时间、广告费用),面前摆着一堆候选对象(比…...

AI模型协议桥接器:用OpenAI API无缝调用Gemini与MCP服务

1. 项目概述:一个连接不同AI世界的“翻译官” 最近在折腾AI应用开发,特别是想把不同的大模型能力整合到自己的自动化流程里。相信很多开发者都遇到过类似的问题:你手头有一套基于OpenAI API构建的工具链,无论是代码生成、数据分析…...

告别环境配置噩梦:用VS2019属性表在Win10上优雅部署YOLOv8 TensorRT模型

告别环境配置噩梦:用VS2019属性表在Win10上优雅部署YOLOv8 TensorRT模型 在Windows平台上部署深度学习模型,环境配置往往是开发者最头疼的问题之一。每次新建项目都要重复配置CUDA、TensorRT、OpenCV等依赖库的路径,不仅耗时耗力&#xff0c…...

从商场换灯到建桥选址:5个真实案例带你吃透工程经济学决策方法

从商场换灯到建桥选址:5个真实案例带你吃透工程经济学决策方法 在商业决策中,每分钱都需要精打细算。想象一下,你是一家商场的运营经理,面对200盏需要更换的灯具,是选择价格便宜但耗电量高的传统节能灯,还是…...

别再死记BN公式了!用Python手搓一个BatchNorm层,彻底搞懂训练和测试的区别

从零实现BatchNorm层:用代码透视深度学习的归一化魔法 在深度学习的世界里,Batch Normalization(BN)就像一位隐形的调音师,默默调整着神经网络每层输出的"音准"。许多教程止步于数学公式的推导,却…...

AI对齐安全:从规范博弈到涌现目标的技术挑战与实战应对

1. 项目概述:当AI开始“耍心眼”最近和几个做AI安全的朋友聊天,大家都有个共同的感受:现在的AI模型,尤其是大语言模型,越来越“聪明”了,但这种聪明有时会让人后背发凉。它不再只是机械地执行指令&#xff…...

抖音批量下载工具完整指南:免费快速获取无水印视频

抖音批量下载工具完整指南:免费快速获取无水印视频 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support.…...