当前位置：首页 > article >正文

CANN模型推理实施者

article 2026/5/10 0:27:23

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skillsname: model-infer-implementer description: 模型优化实施专家负责按已确认方案实施代码改造和调试修复。适用于并行切分、算子替换、模式适配等各优化阶段的代码实施和问题修复。 mode: subagent skills:model-infer-migratormodel-infer-parallel-implmodel-infer-kvcachemodel-infer-fusionmodel-infer-graph-modemodel-infer-precision-debugmodel-infer-runtime-debugModel Implementer Agent模型实施工程师按确认的方案实施代码改造和调试修复。启动流程从 dispatch prompt 中的工作目录确定模型路径读取该目录下的progress.md了解模型信息和当前阶段方案优先从常驻区确认运行环境NPU 型号、HBM 容量、部署卡数读取 git log了解最近改动和当前代码状态若为接力前一个 subagent 未完成从实施记录断点继续已完成项不重复必须调用编排层指定的 skill按 skill 流程实施状态文件读写规则progress.md直接 Readprogress_history.md禁止 Read 全文需要历史信息时用 Grep 关键字查找。工作场景识别优先级判断条件执行动作1主 Agent 明确指定 skill按指定执行2progress.md有已确认方案按方案实施改造3有 reviewer 诊断表按诊断修复代码核心原则禁止编造解释遇到异常数据、自验证结果不合理或用户质疑时必须先用工具调查用证据回答严格按 skill 流程实施调用 skill 后按其定义的步骤逐步推进不跳过skill 中指定的参考实现、代码模板等直接使用严格按方案实施不擅自改方案读取progress.md中 analyzer 输出的方案遇到方案本身的问题停止并报告不自行修改方案内循环自审基础问题自己解决编译 → 修错 → 跑通 → 基础测试编译错误、crash、shape 不匹配等自己搞定NPU 运行时错误aicore timeout、HCCL 超时、OOM 等参考 model-infer-runtime-debug skill 排查不盲目重试推理超 10 分钟无输出时按 model-infer-runtime-debug 的推理卡住流程主动排查不盲目等待调试优先用工具观测如 memory_summary、逐步 print不要纯手算推断遇到需要更换方案方向的问题先重新查阅 skill 确认方向再改调试修复按诊断表定位reviewer FAIL 时会输出诊断表问题 | 位置 | 诊断按诊断表逐项修复不从头重新排查完成后更新 progress.md更新实施记录、当前代码状态section调试时更新调试记录sectionprogress.md 写入格式写入规则只追加不清空写入前先读取现有内容追加到对应 section 末尾避免覆盖其他角色的记录。### 实施记录 - [完成] 描述 — 文件:行号 - [进行中] 描述 - [失败] 描述 — 失败原因 ### 当前代码状态 - 简要记录关键状态tensor layout、cache 格式、已替换/未替换的模块等 - 供接力 subagent 直接了解现状不必重新读代码推断 ### 自验证结果 - 参考 skill: /xxx编排层指定的 skill 名称 - 代码加载: 确认推理加载的是修改后的模型模块和正确的模型配置 - 编译: 通过 / 失败错误信息 - 推理: 通过 / crash错误信息 - 输出: 合理 / 异常描述 ### 调试记录调试修复时写入 - [已查] 检查项 ✓ - [发现] 问题描述 - [放弃] 方案描述 — 放弃原因 - [修复] 修复措施 — 文件:行号 - [待验证] 待确认事项【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN模型推理实施者

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills name: model-infer-implementer description: 模型优化实施专家&#…...

编程日记 2026/5/10 0:27:23

Web代理逆向工程：从协议分析到客户端架构的技术实践与风险

1. 项目概述：一个开源Web代理的逆向工程实践最近在折腾一些AI应用的前端集成时，偶然发现了一个名为zachey01/gpt4free.js的开源项目。这个项目在GitHub上热度不低，它的核心目标很直接：提供一个JavaScript库，让开发者能…...

编程日记 2026/5/10 0:27:21

ChatGemini部署指南：基于React与反向代理的Gemini AI客户端实战

1. 项目概述与核心价值如果你和我一样，对ChatGPT的交互体验爱不释手，但又想体验一下Google Gemini模型的能力，或者手头正好有Gemini的API额度，那么ChatGemini这个项目绝对值得你花时间研究一下。简单来说，它是一个用Re…...

编程日记 2026/5/10 0:25:21

2026.5.9：如何编译TypeScript代码

如何编译TypeScript代码浏览器不能直接运⾏ TypeScript 代码，需要编译为 JavaScript 再交由浏览器解析器执行!!! 1.命令行编译要把 .ts ⽂件编译为 .js ⽂件，需要配置 TypeScript 的编译环境，步骤如下：第⼀步：创建⼀个 demo.ts ⽂件，例如： const person = {name…...

编程日记 2026/5/10 0:25:21

MATLAB|抽水蓄能电站系统的最优竞价策略研究

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程日记 2026/5/10 0:25:21

基于Datasette与ChatGPT插件实现自然语言数据查询

1. 项目概述：当数据API遇见智能对话如果你和我一样，既是一个数据爱好者，又对AI应用开发充满好奇，那么最近在GitHub上看到的一个项目绝对会让你眼前一亮。这个项目就是 simonw/datasette-chatgpt-plugin 。简单来说&#xff0c…...

编程日记 2026/5/10 0:25:21

基于GPT的项目结构智能分析工具gptree：从原理到实践

1. 项目概述与核心价值最近在整理一个老项目的代码库，面对里面错综复杂的目录结构和历史遗留的依赖关系，我一度感到头疼。手动梳理一个项目的架构，特别是当它已经迭代了多个版本、包含了大量第三方库和自定义模块时，效率极低且容易…...

编程日记 2026/5/10 0:25:21

CANN/sip BLAS Swap算子文档

Swap 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库，基于华为Ascend AI处理器，专门为信号处理领域而设计。项目地址: https://gitcode.com/cann/sip 产品支持情况产品是否支持 Atlas 200I/500 A2 推理产品…...

编程日记 2026/5/10 0:23:20

CANN/VGGT昇腾推理适配

VGGT inference on Ascend Atlas A2 【免费下载链接】cann-recipes-spatial-intelligence 本项目针对空间智能业务中的典型模型、加速算法，提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-spatial-intelligence CANN Environm…...

编程日记 2026/5/10 0:23:20

为内容生成平台集成Taotoken，实现按需切换不同风格的大模型

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度为内容生成平台集成Taotoken，实现按需切换不同风格的大模型在构建内容生成平台时，一个常见的需求是希望输…...

编程日记 2026/5/10 0:23:20

自定义鼠标光标引擎：从原理到实现，打造个性化交互体验

1. 项目概述：一个鼠标光标背后的交互革命最近在GitHub上看到一个挺有意思的项目，叫“Mouse-Cursor”。初看标题，你可能觉得这有什么好研究的？不就是操作系统里那个跟着你手移动的小箭头或者小手图标吗？但点进去深入了解…...

编程日记 2026/5/10 0:23:15

基于SocialDAO的性勒索防御系统：技术架构与工程实践

1. 项目概述：一个面向未来的性勒索综合防御体系在数字生活的阴影面，性勒索（Sxtortion）正成为一种日益猖獗且极具破坏性的网络犯罪。它利用受害者的私密信息或影像进行威胁、敲诈，造成的心理创伤和社会伤害往往难以估量…...

编程日记 2026/5/10 0:23:07

可解释AI（xAI）如何破解医疗AI黑盒？以OCT辅助诊断多发性硬化为例

1. 项目概述：当AI诊断遇上“黑盒”困境，我们如何让医生信服？ 在神经眼科和神经退行性疾病的研究前沿，光学相干断层扫描（OCT）已经成为一种革命性的无创成像工具。它能以微米级的精度，清晰地呈现视…...

编程日记 2026/5/10 0:21:06

算法审查委员会（ARB）建设指南：从设计到落地的负责任AI治理实践

1. 项目概述：为什么我们需要算法审查委员会？在过去的几年里，我亲眼见证了AI项目从实验室原型到大规模生产部署的惊人速度。随之而来的，是越来越多的深夜电话和紧急会议，议题往往围绕着某个已上线的模型出现了意想不到的…...

编程日记 2026/5/10 0:21:06

AI伦理框架实战：IEEE与WEF双轨制如何指导负责任的AI系统开发

1. 项目概述：为什么我们需要在AI项目中嵌入伦理框架？最近几年，AI项目从实验室走向了千家万户和各行各业。作为一名从业者，我亲眼见证了从“能用就行”到“必须好用且安全”的观念转变。早期我们更关注模型的准确率、响应速度&…...

编程日记 2026/5/10 0:21:06

CANN/opbase AllocScalar API文档

AllocScalar 【免费下载链接】opbase 本项目是CANN算子库的基础框架库，为算子提供公共依赖文件和基础调度能力。项目地址: https://gitcode.com/cann/opbase 功能说明申请一个aclScalar对象，并对其赋值。通过多个重载函数，用于支持…...

编程日记 2026/5/10 0:21:06

CANN/metadef AppendStride函数

AppendStride 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能向后扩展一个步长值，如果扩展的步长数量超出Stride的最大限制，那么本函数不做任何事情。函数原型 Stride& Appe…...

编程日记 2026/5/10 0:21:06

3秒获取百度网盘提取码：baidupankey智能工具的终极解决方案

3秒获取百度网盘提取码：baidupankey智能工具的终极解决方案【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 在数字资源共享日益频繁的今天，百度网盘提取码成为获取资料的关键屏障。据统计，超…...

编程日记 2026/5/10 0:19:05

AI算力治理五大核心原则：平衡风险管控与技术创新

1. 项目概述：为什么我们需要关注AI算力治理？最近几年，AI的发展速度让人眼花缭乱，从能写代码的Copilot到能生成逼真图像的Stable Diffusion，背后都离不开一个核心驱动力：算力。简单来说，没有海量…...

编程日记 2026/5/10 0:19:02

Segment Anything生态全景：从基础模型到垂直应用实战指南

1. 项目概述：Segment Anything 生态全景图如果你在2023年之后关注过计算机视觉领域，那么“Segment Anything Model”这个名字你一定不会陌生。它就像一颗投入平静湖面的巨石，激起的涟漪迅速扩散到了图像分割、医学影像、机器人、遥感乃至生物…...

编程日记 2026/5/10 0:18:49

BLDC无刷直流电机作为发电机的波形图

这是张价值上千块的图片，因为花了上千块买了个示波器才发现的这个图片...

编程日记 2026/5/10 0:18:47

CANN/pto-isa异步通信Demo

Allgather Async Demo 【免费下载链接】pto-isa Parallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across …...

编程日记 2026/5/10 0:18:43

CANN模型推理实施者

相关文章：

CANN模型推理实施者

Web代理逆向工程：从协议分析到客户端架构的技术实践与风险

ChatGemini部署指南：基于React与反向代理的Gemini AI客户端实战

2026.5.9：如何编译TypeScript代码

MATLAB|抽水蓄能电站系统的最优竞价策略研究

基于Datasette与ChatGPT插件实现自然语言数据查询

基于GPT的项目结构智能分析工具gptree：从原理到实践

CANN/sip BLAS Swap算子文档

CANN/VGGT昇腾推理适配

为内容生成平台集成Taotoken，实现按需切换不同风格的大模型

自定义鼠标光标引擎：从原理到实现，打造个性化交互体验

基于SocialDAO的性勒索防御系统：技术架构与工程实践

可解释AI（xAI）如何破解医疗AI黑盒？以OCT辅助诊断多发性硬化为例

算法审查委员会（ARB）建设指南：从设计到落地的负责任AI治理实践

AI伦理框架实战：IEEE与WEF双轨制如何指导负责任的AI系统开发

CANN/opbase AllocScalar API文档

CANN/metadef AppendStride函数

3秒获取百度网盘提取码：baidupankey智能工具的终极解决方案

AI算力治理五大核心原则：平衡风险管控与技术创新

Segment Anything生态全景：从基础模型到垂直应用实战指南

BLDC无刷直流电机作为发电机的波形图

CANN/pto-isa异步通信Demo

Cap开源视频消息工具：自托管部署、技术架构与Loom替代方案

开源AI录音助理ClawHark：用Wear OS手表打造隐私优先的语音采集方案

企业级AI应用开发，利用Taotoken实现API访问控制与审计日志

基于Docker的AI Agent安全部署实践：Carapace项目深度解析

多模态AI重塑教育：从评估到个性化支持的实践与伦理挑战

医疗AI可解释性实战：SHAP与EBM模型在眼科诊断中的对比解析

Nucleus Co-Op终极指南：如何让任何单机游戏变身为多人派对神器

AI平台竞争中的合谋与网络效应：市场博弈的底层逻辑分析