当前位置: 首页 > article >正文

自我提升智能体的自进化原理和实践

自我提升智能体skill赋予了AI助手从错误中反思、学习并自动繁衍新通用技能的持续进化能力。1 实际案例帮我运行测试,看看为什么登录模块失败。 流程如下:第一步,任务开始前,Hook 触发 activator.sh(通过 UserPromptSubmit 触发)。它不会输出一大堆规则,只是提醒 AI 一句:这次任务结束后,如果发现了有价值的错误、经验或用户纠正,要记录下来。第二步,如果AI 判断这个任务可能涉及测试失败和错误修复,会命中自我提升 Skill。系统把 SKILL.md 加载进上下文。AI 现在知道:如果后面出现错误,要考虑记录到 .learnings/ERRORS.md。在当前的 SKILL.md 中,所有的规则、格式、判断条件全部平铺在这个单一文件里,一次性加载整个 2700 字的 SKILL.md。为了控制token,可以把SKILL.md 设计为是每次命中都会加载的短规则;references/ 里放具体的规则,在 AI 遇到具体不确定动作时才查。第三步,AI 去运行测试。测试结果显示登录模块失败,原因是 mock 数据里缺少 token 字段。第四步,工具执行结束后,Hook 触发 error-detector.sh(使用PostToolUse)。它扫描终端输出,发现了 failed 或 exception 之类的错误关键词,于是提醒 AI:刚才的工具输出里有错误,请按自我提升规则处理。第五步,AI 不会马上写一条新记录。它先去 .learnings/ERRORS.md 里搜索(grep -r “keyword”.learnings/), 看看以前有没有类似错误。比如搜索登录测试认证失败这些关键词。在命令执行完毕到最终回复之前,如果去操作 LEARNINGS.md 或 ERRORS.md文件,会多了几轮的 Tool Call 交互,会造成几秒钟的延迟。第六步,假设它发现以前没有类似记录,就新增一条错误记录。内容是:登录模块测试失败,是因为测试 mock 数据缺少 token 字段。以后遇到登录测试失败时,先检查 mock 用户数据是否包含 token、用户 ID 和过期时间。第七步,AI 修复测试数据,再次运行测试。测试通过后,它回到刚才那条错误记录,把状态从待处理改成已解决,并补充一句解决方式:补全 mock 登录响应中的 token 字段后测试通过。第八步,几天后又遇到类似问题。AI 再次搜索 .learnings/ERRORS.md,发现之前有同类记录,应该AddSee Also: ERR-xxx in Metadata。第九步,如果同类问题出现三次,AI 就会把它提升成一条通用经验,写进AGENTS.md。比如:登录相关测试失败时,优先检查 mock 认证数据是否完整,不要一开始就怀疑业务代码。第十步,如果这个经验在很多项目里都适用,AI 可以建议你把它提取成一个新 Skill,比如登录测试调试 Skill。但这个动作不应该自动完成,应该先问你确认。2 核心架构设计2.1 技能描述Self-Improving Agent(自我提升智能体)的描述文件### 1. 触发条件 * **命令或操作失败**:当代码运行报错、API 调用失败或外部工具异常时。 * **用户纠正**:当用户指出 AI 的错误(如不,那不对…、实际上应该…)或 AI 的知识已过时。 * **缺失的能力**:用户要求 AI 执行当前不支持的操作。 * **发现更优解**:在开发过程中发现了更好的重复性任务处理模式。 ### 2. 存储结构 工作区根目录初始化一个 .learnings/ 文件夹: * LEARNINGS.md:记录知识盲区、最佳实践和用户的纠正。 * ERRORS.md:记录命令失败、异常堆栈和集成错误。 * FEATURE_REQUESTS.md:记录用户请求的新功能或能力。 ### 3. 标准化日志格式 所有的记录都有严格的格式要求,包含唯一的 ID(如 LRN-20250115-001)、优先级(低/中/高/严重)、状态(pending/resolved/promoted)、涉及领域(前端/后端/测试等)。 ### 4. 核心工作流:记录 - 解决 - 晋升 - 提取 * **记录**:问题发生时,立即以标准化格式记录到对应的 Markdown 文件中。 * **解决**:当问题被修复后,将记录的状态从 pending 更新为 resolved * **晋升到项目记忆**:如果一个经验教训具有普适性将其提炼成简洁的规则,并晋升到项目的全局上下文中。 * **提取为独立技能**:如果某个经验经过验证、高频出现且具有跨项目复用的价值,可以通过提供的脚本提取为AI 技能模块。 ### 5. 高级特性与自动化集成 * **模式检测**:AI 会在记录前搜索历史(利用 grep 等命令),通过关联相同的 Pattern-Key 和增加 Recurre

相关文章:

自我提升智能体的自进化原理和实践

自我提升智能体skill赋予了AI助手从错误中反思、学习并自动繁衍新通用技能的持续进化能力。 1 实际案例 帮我运行测试,看看为什么登录模块失败。 流程如下: 第一步,任务开始前,Hook 触发 activator.sh(通过 UserPromptSubmit 触发)。它不会输出一大堆规则,只是提醒 AI 一…...

NoFences终极指南:免费开源桌面分区工具彻底解决Windows桌面混乱问题

NoFences终极指南:免费开源桌面分区工具彻底解决Windows桌面混乱问题 【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 还在为杂乱的Windows桌面而烦恼吗&#xff1…...

2026各个行业可以考的资格经济学专业证书

2026年经济学专业必考高含金量证书指南:CDA数据分析师领衔在数字经济时代,经济学专业人才需通过权威证书提升竞争力。2026年,数据分析、金融、审计等领域的资格证书将成为职业发展的关键筹码。本文将重点解析CDA数据分析师等热门证书的报考条…...

【claude code agent 实践7】后台任务机制深度解析: 从S02到S08的演进

后台任务机制深度解析 文章目录后台任务机制深度解析🔄 s02 vs s08 核心变化对比🔍 新增核心逻辑详解1. BackgroundManager类(后台任务管理器)2. agent_loop关键变化 - 每次LLM调用前排空队列📊 后台任务完整工作流程图…...

PowerToys Awake:3种模式彻底解决Windows电脑意外休眠的烦恼

PowerToys Awake:3种模式彻底解决Windows电脑意外休眠的烦恼 【免费下载链接】PowerToys Microsoft PowerToys is a collection of utilities that supercharge productivity and customization on Windows 项目地址: https://gitcode.com/GitHub_Trending/po/Pow…...

基于Nuxt 4与Shadcn/ui的现代化全栈仪表板模板开发指南

1. 项目概述:一个现代化的全栈仪表板起点如果你正在寻找一个能快速启动企业级后台管理、数据可视化或内容管理系统的技术栈,那么你很可能已经厌倦了从零开始配置的繁琐。每次新项目,都要重新折腾 Nuxt 的配置、UI 组件库的集成、样式工具链、…...

MediaCreationTool.bat:5大实用功能带你告别Windows安装烦恼

MediaCreationTool.bat:5大实用功能带你告别Windows安装烦恼 【免费下载链接】MediaCreationTool.bat Universal MCT wrapper script for all Windows 10/11 versions from 1507 to 21H2! 项目地址: https://gitcode.com/gh_mirrors/me/MediaCreationTool.bat …...

从RRM到RIC:手把手拆解5G O-RAN智能控制器如何“接管”你的基站

从RRM到RIC:5G O-RAN智能控制器的技术演进与实战解析 在5G网络架构的演进浪潮中,O-RAN联盟提出的开放无线接入网理念正在重塑传统基站的控制方式。本文将带您深入探索无线资源管理(RRM)如何进化为近实时智能控制器(Nea…...

掌握大模型Function Call能力:小白程序员必学训练秘籍(收藏版)

大模型的Function Call能力并非与生俱来,而是通过两个关键训练阶段——SFT和RLHF——精心培养的。SFT通过大量包含工具调用样本的监督微调,让模型学会如何输出结构化JSON调用请求;而RLHF则通过人类反馈强化学习,教会模型何时该调用…...

如何彻底修复Windows更新故障:使用Reset Windows Update Tool的完整指南

如何彻底修复Windows更新故障:使用Reset Windows Update Tool的完整指南 【免费下载链接】Reset-Windows-Update-Tool Troubleshooting Tool with Windows Updates (Developed in Dev-C). 项目地址: https://gitcode.com/gh_mirrors/re/Reset-Windows-Update-Tool…...

2026最新论文降AI攻略:实测5款高效辅助工具,查降一体与结构重构选哪个

最近看了一些行业报告,AI工具在写作方面的普及率真的已经超乎想象了。 很多大学生在写论文时也都习惯用AI来辅助寻找灵感、提高效率。 与此同时,相关部门针对人工智能写作出台了一系列规定,各大学术检测平台也都在不断升级AIGC检测算法。 现…...

PowerToys深度解析:Windows生产力工具集的高级配置与性能调优

PowerToys深度解析:Windows生产力工具集的高级配置与性能调优 【免费下载链接】PowerToys Microsoft PowerToys is a collection of utilities that supercharge productivity and customization on Windows 项目地址: https://gitcode.com/GitHub_Trending/po/Po…...

从矩阵求逆到元素倒数:用Matlab power函数处理数据时,90%的人会踩的坑

从矩阵求逆到元素倒数:用Matlab power函数处理数据时,90%的人会踩的坑 在科学计算和工程分析中,Matlab作为一款强大的工具被广泛应用。然而,许多用户在数据处理过程中常常陷入一个看似简单却影响深远的陷阱——混淆矩阵元素的倒数…...

【实测避坑】文科/理工科怎么选论文降AI工具?5款热门工具深度评测

最近看了一些行业报告,AI工具在写作方面的普及率真的已经超乎想象了。 很多大学生在写论文时也都习惯用AI来辅助寻找灵感、提高效率。 与此同时,相关部门针对人工智能写作出台了一系列规定,各大学术检测平台也都在不断升级AIGC检测算法。 现…...

基于OpenClaw的AI智能体脚手架Tradeclaw:构建跨境贸易决策支持系统

1. 项目概述:为跨境贸易打造的AI智能体脚手架如果你正在从事跨境电商或外贸采购,每天面对海量的产品信息、繁杂的供应商数据和模糊的市场信号,感觉像在信息海洋里盲目捕捞,那么Tradeclaw这个项目可能就是为你量身定制的“数字捕手…...

用MATLAB复现机载雷达杂波频谱:从Morchin模型到LFM信号仿真的保姆级教程

MATLAB实战:机载雷达杂波频谱建模与LFM信号仿真全解析 雷达信号处理工程师常面临一个经典难题:如何将教科书中的杂波理论转化为可运行的代码?本文将以Morchin模型为核心,手把手带你完成从地/海杂波建模到LFM雷达回波仿真的完整链路…...

TCRT5000循迹小车总跑偏?一份给STM32新手的硬件调试与软件滤波避坑指南

TCRT5000循迹小车调试实战:从硬件校准到软件滤波的完整解决方案 当你的STM32循迹小车在赛道上左右摇摆、频繁跑偏时,问题往往不只是代码逻辑那么简单。作为嵌入式开发新手,你可能已经尝试过调整PID参数、修改转向算法,但效果依然不…...

MongoDB Atlas Vector Search与LangChain集成:构建企业级RAG系统实践

1. 项目概述:当MongoDB遇见生成式AI最近在开发者社区里,一个名为mongodb-developer/GenAI-Showcase的项目引起了我的注意。作为一名长期与数据打交道的开发者,我深知在生成式AI(GenAI)浪潮席卷而来的当下,如…...

华为MateBook D 2018款升级Win11遇阻?手把手教你通过修改BIOS隐藏参数开启TPM2.0

华为MateBook D 2018款解锁Win11升级全攻略:深入BIOS底层参数调整实战 华为MateBook D系列作为商务本中的性价比代表,2018款用户近期在升级Windows 11时普遍遇到TPM 2.0无法启用的困扰。这台搭载第八代Intel处理器的设备其实完全具备TPM 2.0的硬件基础&a…...

探索Windows上的安卓应用部署:APK Installer技术实践指南

探索Windows上的安卓应用部署:APK Installer技术实践指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 想在Windows电脑上直接运行安卓应用,却…...

对比直接使用官方API体验Taotoken在接入便捷性上的不同

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接使用官方API体验Taotoken在接入便捷性上的不同 1. 从多平台到单一入口的体验转变 在开发需要集成多种大语言模型的应用时…...

Neper终极指南:免费开源的多晶体建模与网格划分神器

Neper终极指南:免费开源的多晶体建模与网格划分神器 【免费下载链接】neper Polycrystal generation and meshing 项目地址: https://gitcode.com/gh_mirrors/nep/neper 你是否正在为材料微观结构建模而烦恼?面对复杂的多晶体生成、网格划分和可视…...

Nix与Helm结合:实现声明式Kubernetes部署的确定性构建

1. 项目概述:当 Helm 遇见 Nix,一种声明式的新思路如果你和我一样,长期在 Kubernetes 生态里折腾,肯定对 Helm 又爱又恨。爱的是它用模板和 Values 文件,把一堆零散的 Kubernetes 资源打包成一个可配置、可版本化的“应…...

瑞昱RTL8762CMF蓝牙5.0芯片烧录避坑指南:从MPTool配置到功耗优化实战

瑞昱RTL8762CMF蓝牙5.0芯片工程化烧录与性能调优全解析 当产品开发进入小批量试产阶段,工程师面临的核心挑战从"功能实现"转向"量产稳定性"和"性能优化"。瑞昱RTL8762CMF作为一款集成蓝牙5.0功能的低功耗芯片,其烧录配置与…...

ARM微服务器与异构计算:从欧洲实验室到现代数据中心的演进

1. 项目概述:欧洲实验室里的微服务器“新酿”最近在整理资料时,翻到一篇2014年EE Times的老报道,讲的是当时欧洲几个由欧盟资助的微服务器项目。虽然时间过去快十年了,但里面探讨的一些架构思路和设计哲学,在今天看来依…...

如何高效采集直播数据:微信视频号监控工具的完整实战指南

如何高效采集直播数据:微信视频号监控工具的完整实战指南 【免费下载链接】wxlivespy 微信视频号直播间弹幕信息抓取工具 项目地址: https://gitcode.com/gh_mirrors/wx/wxlivespy 在直播电商时代,掌握实时互动数据已成为提升直播效果的关键。你是…...

嵌入式视觉成本降至百元级:技术民主化如何重塑工业物联网应用

1. 工业物联网与嵌入式视觉:从昂贵壁垒到百元级应用的演进 提到物联网,很多人脑子里蹦出来的可能是家里的智能音箱、手腕上的健康手环,或者能远程控制的冰箱。没错,消费和医疗领域确实是物联网最显眼的舞台。但作为一名在工业自动…...

PasteMD:一键解决AI内容到Office文档的格式转换难题

1. 项目概述与痛点解析如果你经常需要写论文、做报告,或者整理从各种AI助手(比如ChatGPT、DeepSeek、Kimi)那里得到的答案,那你一定遇到过这个让人头疼的问题:辛辛苦苦从网页上复制下来的内容,一粘贴到Word…...

模拟电路延时触发音频振荡器:DIY电子蟋蟀的原理与实现

1. 项目概述:一场源于图书馆的“电子恶作剧”这个故事始于1977年,几个高中二年级的学生,在图书馆的参考书区发现了一本出版于40年代的“宝藏”书籍。书里充满了各种能让青春期男孩兴奋不已的内容:爆炸性混合物、自燃的纸飞机、三碘…...

Seabay:AI应用开发的一站式工具箱,解决配置、数据、服务化与监控难题

1. 项目概述:Seabay,一个面向AI应用开发的“一站式”工具集最近在GitHub上看到一个挺有意思的项目,叫seapex-ai/seabay。乍一看这个名字,可能会联想到“海贝”或者“海港”,但它的定位其实非常明确:一个为A…...