当前位置：首页 > article >正文

CANN/cann-bench: 3D卷积滤波器梯度算子

article 2026/5/9 13:53:53

Conv3DBackpropFilter 算子 API 描述【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench1. 算子简介Conv3D的filter梯度。主要应用场景3D 卷积神经网络训练中的反向传播视频理解模型中 Conv3D 层的权重梯度计算医学影像 3D 分割模型的训练过程算子特征难度等级L3Contraction双输入输入特征图和输出梯度单输出filter 梯度输入 x 为 [N, C_in, D, H, W] 5维张量输入 grad 为 [N, C_out, D_out, H_out, W_out] 5维张量2. 算子定义数学公式$$ y \text{conv3d_filter_grad}(x, \text{grad}, \text{filter_size}) $$计算 Conv3D 操作中卷积核filter的梯度。给定前向传播的输入特征图 $x$ 和来自下游的输出梯度 $\text{grad}$通过反向传播计算得到 filter 的梯度 $y$。输出 shape 计算输出 filter 梯度的 shape 由filter_size参数指定$$ \text{shape}(y) [C_{out}, C_{in}/groups, K_d, K_h, K_w] $$其中 grad 的 spatial 维度需满足$$ D_{out} \frac{D_{in} 2 \cdot \text{pad}_d - \text{dilation}_d \cdot (K_d - 1) - 1}{\text{stride}_d} 1 $$3. 接口规范算子原型cann_bench.conv3_d_backprop_filter(Tensor x, Tensor grad, int[] strides, int[] pads, int[] dilations, int groups, int[] filter_size) - Tensor y输入参数说明参数类型默认值描述xTensor必选输入特征图shape 为 [N, C_in, D, H, W]gradTensor必选输出梯度shape 为 [N, C_out, D_out, H_out, W_out]stridesint[]必选步长3元素 [stride_d, stride_h, stride_w]padsint[]必选填充6元素格式 [D_front, D_back, H_top, H_bottom, W_left, W_right]dilationsint[]必选膨胀率3元素 [dilation_d, dilation_h, dilation_w]groupsint1分组数filter_sizeint[]必选filter的shape [C_out, C_in/groups, K_d, K_h, K_w]输出参数Shapedtype描述y[C_out, C_in/groups, K_d, K_h, K_w]与输入 x 相同filter梯度数据类型输入 (x, grad) dtype输出 dtypefloat16float16bfloat16bfloat16float32float32规则与约束x 的 shape 格式为 [N, C_in, D, H, W]grad 的 shape 格式为 [N, C_out, D_out, H_out, W_out]x 和 grad 的 dtype 须一致strides 指定 3D 卷积的步长为 3 元素列表pads 指定填充值为 6 元素列表 [D_front, D_back, H_top, H_bottom, W_left, W_right]dilations 指定膨胀率为 3 元素列表groups 指定分组数C_in 和 C_out 都须能被 groups 整除filter_size 指定输出 filter 梯度的 shapegrad 的 spatial 维度必须与 x、filter_size、strides、pads、dilations 计算的输出维度一致4. 精度要求采用生态算子精度标准进行验证。误差指标平均相对误差MERE采样点中相对误差平均值$$ \text{MERE} \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$最大相对误差MARE采样点中相对误差最大值$$ \text{MARE} \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)\text{1e-7}}) $$通过标准数据类型FLOAT16BFLOAT16FLOAT32HiFLOAT32FLOAT8 E4M3FLOAT8 E5M2通过阈值(Threshold)2^-102^-72^-132^-112^-32^-2当平均相对误差 MERE Threshold最大相对误差 MARE 10 * Threshold 时判定为通过。5. 标准 Golden 代码import torch import torch.nn.functional as F Conv3DBackpropFilter算子Torch Golden参考实现 Conv3D的filter梯度公式: y conv3d_filter_grad(x, grad, filter_size) def conv3_d_backprop_filter( x: torch.Tensor, grad: torch.Tensor, strides: list, pads: list, dilations: list, groups: int 1, filter_size: list None ) - torch.Tensor: Conv3D的filter梯度公式: y conv3d_filter_grad(x, grad, filter_size) Args: x: 输入特征图shape为[N, C_in, D, H, W] grad: 输出梯度shape为[N, C_out, D_out, H_out, W_out] strides: 步长3元素 [stride_d, stride_h, stride_w] pads: 填充6元素 [D_front, D_back, H_top, H_bottom, W_left, W_right]对称时取front/top/left dilations: 膨胀率3元素 [dilation_d, dilation_h, dilation_w] groups: 分组数 filter_size: filter的shape [C_out, C_in/groups, K_d, K_h, K_w] Returns: filter梯度shape与filter_size相同 # pads 是 6 元素格式对称 padding 时取 (D_front, H_top, W_left) # 即 pads[0], pads[2], pads[4] padding (pads[0], pads[2], pads[4]) stride (strides[0], strides[1], strides[2]) dilation (dilations[0], dilations[1], dilations[2]) # 使用 torch.nn.grad.conv3d_weight 计算 filter 梯度 y F.grad.conv3d_weight(x, tuple(filter_size), grad, stridestride, paddingpadding, dilationdilation, groupsgroups) return y6. 额外信息算子调用示例import torch import cann_bench x torch.randn(2, 64, 8, 16, 16, dtypetorch.float32, devicenpu) grad torch.randn(2, 128, 6, 14, 14, dtypetorch.float32, devicenpu) # filter_size: [C_out, C_in/groups, K_d, K_h, K_w] y cann_bench.conv3_d_backprop_filter(x, grad, strides[1, 1, 1], pads[1, 1, 1, 1, 1, 1], dilations[1, 1, 1], groups1, filter_size[128, 64, 3, 3, 3])【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力涵盖算子生成、算子优化等领域支撑模型选型、训练效果评估统一量化评估标准识别Agent能力短板构建CANN领域评测平台推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/cann-bench: 3D卷积滤波器梯度算子

相关文章：

CANN/cann-bench: 3D卷积滤波器梯度算子

CANN/runtime回调机制示例

AI模型评估中的规范过拟合：超越基准测试的实战应对策略

基于DenseNet201的实时手语识别系统：从数据构建到工程部署全流程解析

脉冲神经网络：从决策到共情的多层级类脑智能实现

CANN/HCCL算法分析器使用指南

UVa 189 Pascal Program Lengths

AI高通量实验平台：数据驱动电池级碳酸锂工艺优化

CANN ops-tensor Blaze引擎

UVa 188 Perfect Hash

长期使用中观察到的Taotoken账单明细与成本分析价值

联邦学习与Transformer在CV与安全领域的融合应用与实战解析

信贷风控中可解释AutoML实践：用SHAP与H2O实现透明AI决策

基于SVR与特征选择的系外行星半径预测：数据清洗、模型构建与天文解读

不同价位的燕窝品质差异大吗？行业标准解读与选购建议

第五篇：锻造大脑——为什么算法公开，你却造不出 GPT？

非洲AI本土化实践：医疗、农业、金融、教育四大领域创新与挑战

基于主动学习的广义Benders分解算法初始化优化研究

CANN/tensorflow NPURunConfig精度调优配置

CANN/cann-recipes-infer：NPU DeepSeek-V4 TileLang算子开发实践

CANN/pyasc ib_wait函数文档

昇腾SiP CgemvOperation C++示例

智能电网安全：基于可信AI的攻击检测与风险解释框架

CANN Runtime异常处理指南

KrkrzExtract终极指南：新一代krkrz引擎资源解包工具完全解析

别再死记硬背TP/FP了！用Python手把手带你画混淆矩阵，5分钟搞懂准确率、召回率

多模态大模型如何重塑科学教育：从理论框架到课堂实践

视频动作识别可解释性：REVEX框架与六种移除式解释方法评测

2026年，如何挑选靠谱的冷镦油过滤机生产商？这几点是关键

CANN/hcomm AIV算子任务编排