当前位置: 首页 > article >正文

CANN/asc-tools:show_kernel_debug_data样例

show_kernel_debug_data样例【免费下载链接】asc-toolsAscend C Tools仓是CANN基于Ascend C编程语言推出的配套调试工具仓。项目地址: https://gitcode.com/cann/asc-tools概述本样例基于Add算子演示kernel侧算子调试信息的获取并通过show_kernel_debug_data工具解析。算子相关描述请参考Add算子直调样例.支持的产品Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品目录结构介绍├── 01_show_kernel_debug_data │ ├── acl.json // Dump配置文件 │ ├── add.asc // Ascend C算子实现 │ └── CMakeLists.txt // 编译工程文件编译运行在本样例根目录下执行如下步骤编译并执行算子。配置环境变量请根据当前环境上CANN开发套件包的安装方式选择对应配置环境变量的命令。默认路径root用户安装CANN软件包source /usr/local/Ascend/cann/set_env.sh默认路径非root用户安装CANN软件包source $HOME/Ascend/cann/set_env.sh指定路径install_path安装CANN软件包source ${install_path}/cann/set_env.sh执行如下命令若能正常显示--help或-h信息则表示工具环境正常功能可正常使用。show_kernel_debug_data -h修改编译选项Ascend 950PR/Ascend 950DT对于Ascend 950PR/Ascend 950DT执行前需要修改CMakeLists.txt中编译选项--npu-arch具体修改如下--npu-archdav-3510样例执行mkdir -p build output cd build; # 创建并进入build目录 cmake ..;make -j; # 编译工程 # 在build目录执行以下内容 ./demo # 执行样例执行结果如下说明精度对比成功。[Success] Case accuracy is verification passed.执行完成后将在当前目录生成kernel调试信息bin文件落在配置的路径下例如:${git_clone_path}/examples/01_show_kernel_debug_data/output └── 202xxxxxxxxxxx // 待解析的dump二进制文件包含kernel侧打印信息 ├── asc_kernel_data_xxx.bin ├── ... └── asc_kernel_data_xxx.bin调用show_kernel_debug_data工具解析使用命令行方式调用show_kernel_debug_data工具解析调试信息。mkdir dump_info_output show_kernel_debug_data ../output dump_info_output运行后终端显示如下打印信息(AscendC::print打印)如需保存解析日志需设置环境变量ASCEND_GLOBAL_LOG_LEVEL1log file saves to ./dump_info_output/PARSER_20251022074515310995/parser.log write dump workspace result: ./dump_info_output/PARSER_20251022074515310995/dump_data block.0 begin fmt string int: 291 fmt string int: 291 fmt string float: 3.140000 fmt string float: 3.140000 block.0 end block.1 begin fmt string int: 291 fmt string int: 291 fmt string float: 3.140000 fmt string float: 3.140000 block.1 end ... block.7 begin fmt string int: 291 fmt string int: 291 fmt string float: 3.140000 fmt string float: 3.140000 block.7 end 结果目录结构如下:${git_clone_path}/examples/01_show_kernel_debug_data/build/dump_info_output └── PARSER_20251022074515310995 ├── dump_data │ ├── 0 // core0解析结果 │ │ ├── asc_kernel_data_aiv_0_index_0_loop_0.bin // core0 desc0 progress0落盘信息 │ │ ├── asc_kernel_data_aiv_0_index_0_loop_0.txt // core0 desc0 progress0解析结果 ... │ │ ├── asc_kernel_data_aiv_0_index_2_loop_15.bin // core0 desc2 progress15落盘信息 │ │ ├── asc_kernel_data_aiv_0_index_2_loop_15.txt // core0 desc2 progress15落盘信息 │ │ └── time_stamp_core_0.csv // 时间戳信息 │ ├── 1 // core1解析结果 │ ├── 2 // core2解析结果 │ ... │ └── index_dtype.json // index与数据类型的映射关系 └── parser.log // 工具解析日志其中dump_data目录下的0,1,2,...,7为8个核各自的打印信息。index0、index1、index2分别对应代码中Dumptensor第二个参数desc0、desc1、desc2所在函数调用代码的打印对应到本例分别为xLocal, yLocal, zLocal的打印AscendC::DumpTensor(xLocal[64], 0, 16); AscendC::DumpTensor(yLocal[64], 1, 16); AscendC::DumpTensor(zLocal[64], 2, 16);asc_kernel_data_aiv_0_index_0_loop_x.*中x的取值是0-15对应Block1xLocal切分的每个tileLength大小的数据打印。【免费下载链接】asc-toolsAscend C Tools仓是CANN基于Ascend C编程语言推出的配套调试工具仓。项目地址: https://gitcode.com/cann/asc-tools创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN/asc-tools:show_kernel_debug_data样例

show_kernel_debug_data样例 【免费下载链接】asc-tools Ascend C Tools仓是CANN基于Ascend C编程语言推出的配套调试工具仓。 项目地址: https://gitcode.com/cann/asc-tools 概述 本样例基于Add算子,演示kernel侧算子调试信息的获取并通过show_kernel_deb…...

ATVOSS向量算子模板库

ATVOSS 【免费下载链接】atvoss ATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 项目地址: https:/…...

ncmdumpGUI:3步快速解锁网易云音乐NCM加密文件的终极指南

ncmdumpGUI:3步快速解锁网易云音乐NCM加密文件的终极指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐下载的NCM格式文件无法在…...

从零复刻Stripe官网动态背景:WebGL着色器与Next.js实战

1. 项目概述:从零复刻 Stripe 官网的炫酷动态背景 如果你是一名前端开发者,或者对现代网页的视觉表现力着迷,那你一定对 Stripe 的官网印象深刻。它那个丝滑流畅、色彩变幻的动态背景,早已成为业界的视觉标杆。很多人第一次看到时…...

正交系统架构与DSPTH技术在高速电子设计中的应用

1. 正交系统架构与DSPTH技术解析在高速电子系统设计中,信号路径优化始终是工程师面临的核心挑战。传统背板架构中,信号需要穿越多层PCB板、连接器和复杂的布线通道,导致信号完整性严重受损。而正交系统架构通过独特的机械布局和电气设计&…...

TVA重塑智慧城市安防新范式(9)

重磅预告:本专栏将独家连载新书《AI视觉技术:从入门到进阶》精华内容。本书是《AI视觉技术:从进阶到专家》的权威前导篇,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“AI教…...

无需代码使用curl命令直接测试Taotoken大模型聊天接口

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 无需代码使用curl命令直接测试Taotoken大模型聊天接口 对于开发者而言,在集成大模型能力时,直接通过HTTP请…...

TVA重塑智慧城市安防新范式(7)

重磅预告:本专栏将独家连载新书《AI视觉技术:从入门到进阶》精华内容。本书是《AI视觉技术:从进阶到专家》的权威前导篇,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“AI教…...

Instill Core:开源AI工作流引擎,标准化编排多模型Pipeline

1. 项目概述:一个面向AI应用开发者的开源核心引擎如果你正在构建一个需要集成多种AI模型(比如视觉识别、语音处理、大语言模型)的应用,大概率会面临一个头疼的问题:每个模型都有自己的一套API接口、数据格式要求和部署…...

基于ESP32的Wi-Fi数据记录器:从环境扫描到物联网数据采集实战

1. 项目概述:一个基于ESP32的Wi-Fi数据记录器最近在折腾一个物联网数据采集的小项目,需要把几个传感器节点的数据汇总到一个中心点。一开始想用LoRa,但考虑到部署成本和网络覆盖,最后还是决定用最普遍的Wi-Fi。在GitHub上翻找现成…...

AI编程助手如何通过结构化代码分析提升开发效率

1. 项目概述:为AI编程助手装上“透视眼”如果你和我一样,每天都在和Claude、Cursor、Copilot这类AI编程助手打交道,那你一定遇到过这个让人头疼的场景:想让AI帮你修改一个函数,结果它二话不说,直接把整个几…...

基于HTML/CSS/JS+PHP的GPT API集成:从原理到部署的全栈实践

1. 项目概述:一个全栈Web开发者的效率工具箱 最近在GitHub上看到一个挺有意思的项目,叫“GPT-API-Integration-in-HTML-CSS-with-JS-PHP”。光看名字,你大概就能猜到它的核心:一个演示如何在传统的Web技术栈(HTML、CS…...

基于大语言模型的自主代码生成智能体:从原理到实战搭建

1. 项目概述:当代码生成器遇上“记忆”与“规划”在AI辅助编程的浪潮里,GitHub Copilot、Cursor这类工具已经成为了不少开发者的“标配”。它们能根据你敲下的几行注释,快速生成代码片段,极大地提升了编码效率。但用过一段时间后&…...

产品经理开项目对齐会不想记笔记?2026年这3款视频内容总结ai工具,散会直接出完整纪要

做产品经理开一下午项目对齐会,脑子已经转不动了,散会老板一句“下班前把纪要出给我”,瞬间头大;作为内容创作者,采访完嘉宾,几个小时的录音要逐句拖进度条整理,熬到半夜眼睛都花了;…...

大模型“幻觉”不再!揭秘RAG技术如何让AI开卷考试,秒变知识达人!

🤔 为什么大模型总爱“一本正经地胡说八道”? 用过 ChatGPT、文心一言或者自己部署过 Gemma、Llama 的朋友,大概率遇到过这两种情况:幻觉问题:你问它“鲁迅为什么暴打周树人”,它真能给你编出一段民国秘闻&…...

RAG技术大揭秘:从入门到高阶,助你构建智能问答系统!

近年来,随着大语言模型(LLM)的广泛应用,检索增强生成(Retrieval-Augmented Generation,RAG)系统逐渐成为连接私有知识库与智能问答的核心架构。RAG 不仅弥补了大模型在实时性与事实性上的不足&a…...

拼多多股权曝光:腾讯持股13.8% 价值1319亿 是最大机构股东

雷递网 雷建平 5月9日拼多多(NASDAQ: PDD)日前发布20-F文件,文件显示,截至2026年3月18日,拼多多一共有 5,693,585,848股A类股,没有B类股,拼多多创始人黄峥持有1,409,744,080股,持股比例为24.8%,…...

Zabbix AI技能实战:基于MCP协议实现自然语言监控运维自动化

1. 项目概述 如果你和我一样,在运维Zabbix监控系统超过五年,那你一定经历过这样的场景:凌晨三点被告警电话吵醒,登录Zabbix Web界面,手忙脚乱地点击一个又一个菜单,试图搞清楚到底是哪个主机的哪个触发器出…...

体验Taotoken官方价折扣活动对降低AI实验成本的直接影响

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 体验Taotoken官方价折扣活动对降低AI实验成本的直接影响 对于开发者而言,在原型验证和产品迭代阶段,模型调…...

为AI编码助手注入设计思维:UX技能包提升开发与协作效率

1. 项目概述:为AI编码助手注入设计思维如果你和我一样,日常重度依赖Claude Code、Cursor这类AI编码助手来提升开发效率,那你肯定也遇到过类似的困境:当你让它“优化一下这个页面的用户体验”或者“检查一下这个组件的可访问性”时…...

Maestro工作流引擎:声明式编排与复杂自动化流程实践

1. 项目概述:一个面向开发者的全能型工作流编排引擎最近在梳理团队内部持续集成和自动化测试的流程,发现随着项目复杂度的提升,传统的脚本串联方式越来越力不从心。脚本分散、依赖管理混乱、错误处理不统一,每次流程调整都像在拆解…...

非厄米量子系统中的精度诱导不可逆性研究

1. 非厄米量子系统中的精度诱导不可逆性:现象与机制在量子力学框架下,我们通常研究的系统由厄米(Hermitian)哈密顿量描述,这类系统具有实数能谱和幺正演化性质。然而,当系统与外界环境存在粒子或能量交换时…...

基于可变字体与光标交互的磁吸文字效果实现与优化

1. 项目概述:让字体与光标共舞的交互式工具在网页设计的工具箱里,我们总在寻找那些能让静态页面“活”起来的细节。动画、过渡、微交互……这些元素共同构成了现代网页的呼吸感。但你是否想过,页面上的文字本身,也能成为这种动态体…...

Tenere:专为LLM设计的终端TUI工具,提升开发者AI对话效率

1. 项目概述:一个为LLM而生的TUI终端神器 如果你和我一样,每天在终端里泡的时间比在图形界面里还多,同时又离不开各种大语言模型来辅助编程、写作或者查资料,那你肯定也受够了在浏览器标签页和终端窗口之间反复横跳的麻烦。每次想…...

MATLAB算法合成技术在DSP硬件设计中的应用与优化

1. MATLAB算法合成如何重塑DSP硬件设计流程在数字信号处理(DSP)领域,算法开发者与硬件工程师之间长期存在着一条明显的分界线。算法团队使用MATLAB构建优雅的数学模型,而硬件团队则需要将这些抽象算法转化为实际的电路设计。这个转…...

PawForge AI:基于工作流引擎的AI应用开发框架实战解析

1. 项目概述与核心价值最近在AI应用开发圈子里,一个名为“PawForge AI”的项目引起了我的注意。这个项目来自一个名为“NYX-305Parad0xLabs”的组织,名字本身就透着一股神秘感和技术范儿。作为一个长期在AI工具链和自动化流程领域摸爬滚打的从业者&#…...

AI与空间计算融合:在Vision Pro上部署与优化机器学习模型的工程实践

1. 项目概述:当苹果Vision Pro遇上开源AI,一场空间计算的“化学反应”最近在GitHub上闲逛,发现了一个挺有意思的项目,叫imclab/Apple-Vision-PRO-AR-VR-XR-AI。光看这个仓库名,信息量就爆炸了,直接把苹果的…...

ARM虚拟化架构中HCRX_EL2寄存器详解与应用

1. ARM虚拟化架构与HCRX_EL2寄存器概述 在ARMv8/v9架构的虚拟化实现中,异常等级(EL)机制构成了安全隔离的基础框架。EL2作为专为虚拟化设计的特权等级,通过一组精心设计的系统寄存器实现对硬件资源的精确控制。其中HCRX_EL2(Extended Hypervi…...

TVA重塑智慧城市安防新范式(10)

重磅预告:本专栏将独家连载新书《AI视觉技术:从入门到进阶》精华内容。本书是《AI视觉技术:从进阶到专家》的权威前导篇,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“AI教…...

Blender Cursor Ops插件:3D游标精准控制与建模效率革命

1. 项目概述:Blender中的“手术刀”——Cursor Ops如果你在Blender里建模时,经常觉得3D游标(3D Cursor)这个工具用起来有点“隔靴搔痒”,定位不够精准,操作不够流畅,那么今天聊的这个插件&#…...