当前位置：首页 > article >正文

CANN算子测试赛Add报告

article 2026/5/9 18:13:01

【免费下载链接】cann-competitions本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。项目地址: https://gitcode.com/cann/cann-competitions 元信息请如实填写此区块将由组委会脚本自动解析请保持字段名不变team_name: 蕉不绿队team_members:成员1姚杰涛-广州大学成员2张欢-广州大学成员3陈贝宁-广州大学operator_name: Addoperator_library: cann-ops-mathreport_date: 2026-04-25Add 算子最终测试结果报告本报告基于当前版本test_aclnn_add.cpp的执行结果以及 4 个评分文件对应的.gcov产物整理形成。与上一版报告相比这一版结论以本轮真实覆盖率为准重点说明当前测试已经打到的主路径、仍未进入的分支以及导致综合覆盖率下降的核心原因。一、结果概览本次实际统计的 4 个评分文件及覆盖率结果如下文件行数行覆盖率分支数分支覆盖率至少命中一次调用覆盖率math/add/op_api/add.cpp5589.09%26374.90%41.44%83.10%math/add/op_api/aclnn_add.cpp28871.53%158154.52%30.80%62.67%math/add/op_host/arch35/add_tiling_arch35.cpp930.00%1820.00%0.00%0.00%math/add/op_api/aclnn_add_v3.cpp7690.79%44064.55%37.50%73.20%按文件行数和分支数加权后本轮综合结果约为综合行覆盖率63.28%综合分支覆盖率54.46%综合“至少命中一次”分支比例30.86%综合调用覆盖率60.78%从结果可以直接看出add.cpp、aclnn_add.cpp、aclnn_add_v3.cpp三个op_api文件的覆盖率已经明显提升主流程、异常输入和部分边界路径已经进入。当前综合覆盖率被add_tiling_arch35.cpp的0.00%明显拉低。因此这一轮测试的主问题已经不再是op_api主路径完全没打到而是host tiling路径完全没有进入。二、结合.gcov的逐文件分析1.math/add/op_api/add.cpp该文件当前表现最好行覆盖率达到89.09%分支覆盖率达到74.90%。结合.gcov可见以下关键路径已经被覆盖Add的 broadcast 成功与失败路径均已进入。AiCore与AiCpu两条调度路径均被打到。mixed dtype 分支已经命中float16 float、float float16、bf16 float等输出转为float的逻辑被实际执行。l0op::Add的非法 broadcast 失败路径已进入。AddAiCore、AddAiCpu两个底层调度函数都已被执行。当前主要剩余缺口有DAV_3102对应的ASCEND610LITE_AICORE_DTYPE_SUPPORT_LIST分支未命中。IsAddSupportNonContiguous只有IsRegBase()false的返回路径未体现真正的非连续输入支持分支。AddInplace虽然进入了失败分支校验但.gcov显示成功调度到AddAiCore或AddAiCpu的路径并未命中说明当前更多是在测它的失败保护而不是成功执行。这说明add.cpp这一层的核心调度逻辑已经覆盖得比较充分但架构特定分支与L0 AddInplace成功路径仍有缺口。2.math/add/op_api/aclnn_add.cpp该文件当前行覆盖率71.53%分支覆盖率54.52%已经从“只打到少量主路径”提升到了“主路径部分异常路径都进入”的状态。结合.gcov当前已经明确命中的内容包括CheckNotNull的多种空指针失败分支。CheckPromoteType中alpha可转换 / 不可转换、输出类型可转换 / 不可转换等路径。CheckInplace中 broadcast 推导、shape 检查成功与失败路径。aclnnAddGetWorkspaceSize主流程。aclnnAddsGetWorkspaceSize、aclnnInplaceAddGetWorkspaceSize、aclnnInplaceAddsGetWorkspaceSize等接口入口。alpha1直走Add、Axpy路径、MulAddfallback 路径都已经命中。bool、mixed dtype、空 tensor、非法 shape、非法 alpha 等测试都对该文件分支覆盖有直接贡献。.gcov同时也显示出当前还没有覆盖到的典型区域GetScalarDefaultDtypeInnerTypeToComplexTypeCombineCategoriesWithComplexGetCastedFloat这些函数全部是called 0说明当前复杂数相关、部分特殊 scalar 推导路径没有真正进入。另外.gcov还显示aclnnInplaceAdd运行接口本身未被执行。aclnnInplaceAdds运行接口本身未被执行。这说明当前测试更多打到了GetWorkspaceSize和参数校验入口但对应的最终执行封装函数并没有留下运行覆盖。也就是说Inplace系列“前半段”覆盖得不错“执行落地”这一小段还需要补。3.math/add/op_api/aclnn_add_v3.cpp该文件当前行覆盖率90.79%分支覆盖率64.55%是本轮覆盖最好的文件之一。结合.gcov可确认CheckNotNull、CheckShape、CheckParams的主要真/假分支已被覆盖。PromoteTypeScalar的多条推导路径被实际命中。alpha1直走Add、Axpy路径、MulAdd路径都已执行。空 tensor 快速返回路径已命中。promote - out不可转换、shape 不匹配、max dim exceeded、不支持 dtype 等失败路径已进入。AddV3的标量 tensor 主语义已经测透到了较深位置。当前明显未覆盖的点主要有aclnnInplaceAddV3运行接口called 0。promoteType DT_BOOL这类很窄的分支没有打到。promoteType DT_UNDEFINED的失败路径没有打到。因此aclnn_add_v3.cpp当前的状态可以判断为主功能、主要异常输入、主要类型约束都已经覆盖到位剩余缺口主要集中在非常窄的特殊类型分支和InplaceAddV3的最终执行封装。4.math/add/op_host/arch35/add_tiling_arch35.cpp这是本轮最关键的问题文件。当前结果是行覆盖率0.00%分支覆盖率0.00%调用覆盖率0.00%从.gcov可见该文件中所有关键函数均为called 0包括AddTiling::IsMixedDtypeAddTiling::CheckDtypeAddTiling::DoOpTilingTilingForAddTilingPrepareForAdd这说明本轮执行过程中host tiling路径完全没有进入。基于.gcov可以做出一个明确判断当前测试集虽然已经把op_api层覆盖得比较充分但没有驱动到arch35对应的 tiling 编译/解析/模板分发路径。因此上一版报告里关于add_tiling_arch35.cpp的高覆盖结论在本轮结果下已经不再成立最终报告必须以本轮0.00%为准。三、本轮测试内容能说明什么从test_aclnn_add.cpp当前用例内容看这一轮测试已经覆盖了以下几类核心场景1. 常规正确性路径float32 broadcast alpha!1int32 alpha2float16 float32float32 float16double alpha!1触发MulAdd路径alpha0的高维 broadcastbool特殊分支int8、uint8、int64边界值NaN / Inf特殊浮点值这些用例保证了 Add 的主数值语义已经不是空白覆盖。2. API 变体路径AddsInplaceAddInplaceAddsAddV3InplaceAddV3并且对其中相当一部分接口补了alpha1负 alphamixed dtypeout dtype cast空 tensor非 ND format因此当前op_api三个文件的覆盖提升是有真实用例支撑的不是靠少量“撞到主函数”得来的。3. 失败路径与边界路径当前测试还显式包含了大量失败场景例如nullptr 输入alpha为空非法 broadcastout shape 不匹配max dim exceededalpha不可转换promote - out不可转换AddV3不支持 dtypeL0 Add/L0 AddInplace非法输入这也是为什么当前aclnn_add.cpp和aclnn_add_v3.cpp的分支覆盖率能比上一版明显提高。五、结论Add 测试的真实状态可以概括为op_api层已经从“基础覆盖”进入到“主路径异常路径都较充分”的阶段。add.cpp、aclnn_add.cpp、aclnn_add_v3.cpp的结果说明当前测试方案对 eager / op_api 层是有效的。最大短板已经不是普通 Add/Adds/AddV3 的数值正确性而是host tiling路径完全未进入。【免费下载链接】cann-competitions本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。项目地址: https://gitcode.com/cann/cann-competitions创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN算子测试赛Add报告

相关文章：

CANN算子测试赛Add报告

别人写的代码看不懂，到底是谁的水平有问题

AI光学硬件加速：1.2Tb/s高光谱视频实时理解平台架构与实践

从代码生成到自主学习：构建AI编程智能体的核心架构与实践

分布式追踪深度解析：解锁微服务架构的可观测性

3步搭建个人游戏串流服务器：Sunshine让你在任何设备畅玩3A大作

追赶行业节奏！DeepSeek计划6月推V4.1，500亿融资加速商业化转型

Java AI应用开发实战：langchain4j框架核心架构与生产实践指南

保姆级教程：Qwen-Image-2512-ComfyUI内置工作流怎么用？手把手教你5分钟出图

ACAI平台：基于数据湖与智能调度的MLOps实验管理实践

第三代社保卡全功能使用指南

Qwen-Image-2512+LoRA像素艺术作品集：Retro、Cyberpunk、Fantasy三风格实测

构式语法与AI融合：从语言认知到可解释NLP的实践路径

DeepAnalyze部署教程：基于Ollama的免配置镜像，10分钟搭建私有文本分析平台

AI项目管理中的算法偏见与包容性设计：效率与公平的平衡之道

Driver Store Explorer：Windows驱动存储清理终极指南，释放数GB磁盘空间

CANN / cann-learning-hub: Ascend C 算子工程化开发指南

XUnity.AutoTranslator：5分钟掌握Unity游戏实时翻译的完整指南

AI智能体开发实战：基于agent-sdk构建可扩展的智能应用

基于verl框架和代码沙盒环境工具调用的代码强化学习实践

美欧AI治理法案对比：从核心理念到企业合规实操全解析

nli-MiniLM2-L6-H768在舆情分析中的实战：识别观点冲突与一致性

Gemma-3-12B-IT实战体验：搭建企业内部AI助手完整指南

[实战指南] 2026年工程图纸数字化与检验计划自动化的技术路径

强化学习新范式：文化累积与跨代智能进化技术解析

DriverStore Explorer：Windows驱动管理专家，让系统重获新生

2026年制造业数字化质量管理实务：从图纸识别到检验计划自动化

AI黑箱与法律归责：可解释性技术如何破解算法决策责任困境

科研影响力评估：从引文指标到AI预测的量化方法与实践

别再傻傻分不清了！FreeRTOS事件组与任务通知的保姆级对比与实战选型指南