当前位置: 首页 > article >正文

Claude API 递归自我改进完全教程:从零构建智能 Agent

Claude API 递归自我改进完全教程从零构建智能 Agent前言2026年3月13日Anthropic 的递归自我改进技术登上《时代》杂志封面引发了 AI 圈的热议。这项技术让 AI 能够像人类一样通过试错来学习和改进。本教程将手把手教你用 Claude API 实现一个递归自我改进 Agent包含完整代码和详细注释。一、什么是递归自我改进1.1 核心概念递归自我改进Recursive Self-Improvement是指 AI 系统能够执行任务评估结果发现问题改进策略再次尝试这个过程可以无限循环直到达到目标。1.2 与传统 AI 的区别特性传统 AI递归自我改进 AI学习方式依赖人工标注数据自主试错学习改进速度需要重新训练实时改进适应能力固定能力边界动态扩展能力二、环境准备2.1 安装依赖pip install anthropic2.2 获取 API Key方式一官方渠道需要国际信用卡访问 https://console.anthropic.com注册账号并绑定支付方式方式二国内中转站推荐访问 https://xingjiabiapi.org注册后即可获得 API Key支持支付宝/微信支付2.3 测试连接import anthropic client anthropic.Anthropic( api_key你的API密钥, base_urlhttps://xingjiabiapi.org/v1 ) # 测试调用 response client.messages.create( modelclaude-opus-4-6, max_tokens100, messages[{role: user, content: Hello}] ) print(response.content[0].text)三、实现基础递归 Agent3.1 核心架构import anthropic import json class RecursiveAgent: def __init__(self, api_key, base_urlhttps://xingjiabiapi.org/v1): 初始化 Agent self.client anthropic.Anthropic( api_keyapi_key, base_urlbase_url ) self.history [] # 存储历史尝试 def execute(self, task, max_iterations3): 执行任务最多尝试 max_iterations 次 for i in range(max_iterations): print(f\n{*50}) print(f第 {i1} 次尝试) print(f{*50}) # 步骤1构建 prompt prompt self._build_prompt(task) # 步骤2调用 Claude API result self._call_api(prompt) # 步骤3评估结果 evaluation self._evaluate(result, task) # 步骤4判断是否成功 if evaluation[success]: print(✅ 任务完成) return result # 步骤5记录失败经验 self.history.append({ attempt: i 1, result: result, error: evaluation[error] }) print(f❌ 失败原因{evaluation[error]}) print(\n⚠️ 达到最大尝试次数任务失败) return None def _build_prompt(self, task): 根据历史经验构建 prompt prompt f任务{task}\n\n if self.history: prompt ⚠️ 之前的失败尝试\n for h in self.history: prompt f- 第 {h[attempt]} 次{h[error]}\n prompt \n请根据上述失败经验改进你的方案。\n return prompt def _call_api(self, prompt): 调用 Claude API response self.client.messages.create( modelclaude-opus-4-6, max_tokens2000, messages[{role: user, content: prompt}] ) return response.content[0].text def _evaluate(self, result, task): 评估结果是否符合预期 eval_prompt f 任务要求{task} 生成的结果 {result} 请评估这个结果是否完成了任务。 返回 JSON 格式{{success: true/false, error: 失败原因如果失败}} response self.client.messages.create( modelclaude-sonnet-4, # 用便宜的模型做评估 max_tokens200, messages[{role: user, content: eval_prompt}] ) return json.loads(response.content[0].text)3.2 使用示例# 创建 Agent agent RecursiveAgent(api_key你的API密钥) # 执行任务 task 写一个 Python 函数计算斐波那契数列第 n 项要求时间复杂度 O(n) result agent.execute(task, max_iterations3) # 输出结果 if result: print(\n *50) print(最终结果) print(*50) print(result)3.3 运行效果 第 1 次尝试 ❌ 失败原因使用了递归实现时间复杂度是 O(2^n) 第 2 次尝试 ❌ 失败原因没有处理 n0 的边界情况 第 3 次尝试 ✅ 任务完成 最终结果 def fibonacci(n): if n 0: return 0 if n 1: return 1 a, b 0, 1 for _ in range(2, n 1): a, b b, a b return b四、进阶功能记忆持久化4.1 为什么需要持久化上面的实现只在单次运行中有效重启后 Agent 就失忆了。我们需要把历史经验存到文件里。4.2 实现代码import json from pathlib import Path class PersistentAgent(RecursiveAgent): def __init__(self, api_key, base_urlhttps://xingjiabiapi.org/v1, memory_fileagent_memory.json): super().__init__(api_key, base_url) self.memory_file memory_file self.memory self._load_memory() def _load_memory(self): 加载历史经验 if Path(self.memory_file).exists(): with open(self.memory_file, r, encodingutf-8) as f: return json.load(f) return {} def _save_memory(self, task): 保存历史经验 self.memory[task] self.history with open(self.memory_file, w, encodingutf-8) as f: json.dump(self.memory, f, indent2, ensure_asciiFalse) def execute(self, task, max_iterations3): 执行任务带记忆 # 加载该任务的历史经验 if task in self.memory: self.history self.memory[task] print(f 加载了 {len(self.history)} 条历史经验) # 执行任务 result super().execute(task, max_iterations) # 保存经验 self._save_memory(task) return result4.3 测试持久化# 第一次运行 agent PersistentAgent(api_key你的API密钥) agent.execute(写一个快速排序算法) # 第二次运行会加载之前的经验 agent PersistentAgent(api_key你的API密钥) agent.execute(写一个快速排序算法) # 直接成功不会重复犯错五、成本优化5.1 成本分析递归改进会多次调用 API成本是个问题。以生成 1000 tokens 为例方案输入成本输出成本总成本官方 Opus$3/M$15/M$0.018中转站 Opus¥6.3/M¥31.5/M¥0.0378 ≈ $0.0094节省比例--48%5.2 优化策略class CostOptimizedAgent(PersistentAgent): def _call_api(self, prompt): 执行用 Opus评估用 Sonnet response self.client.messages.create( modelclaude-opus-4-6, # 执行任务用高质量模型 max_tokens2000, messages[{role: user, content: prompt}] ) return response.content[0].text def _evaluate(self, result, task): 评估用便宜模型 eval_prompt f 任务要求{task} 生成的结果{result} 请评估是否完成任务。 返回 JSON{{success: true/false, error: 失败原因}} response self.client.messages.create( modelclaude-sonnet-4, # 评估用便宜模型 max_tokens200, messages[{role: user, content: eval_prompt}] ) return json.loads(response.content[0].text)5.3 成本对比策略单次成本3次迭代成本全用 Opus¥0.0378¥0.1134Opus执行Sonnet评估¥0.0252¥0.0756节省比例33%33%六、实际应用场景6.1 代码生成agent CostOptimizedAgent(api_key你的API密钥) # 自动修复语法错误 task 写一个 Python 函数读取 CSV 文件并统计每列的平均值 result agent.execute(task)6.2 文案优化task 写一篇产品介绍文案要求 1. 突出性价比优势 2. 避免营销感太强 3. 字数 200-300 字 result agent.execute(task)6.3 数据处理task 写一个数据清洗脚本要求 1. 去除重复行 2. 填充缺失值用中位数 3. 标准化数值列 result agent.execute(task)七、常见问题Q1为什么评估结果不准确A评估 prompt 需要更具体。改进方法eval_prompt f 任务要求{task} 生成的结果{result} 评估标准 1. 是否完成了所有要求 2. 代码是否有语法错误 3. 时间复杂度是否符合要求 返回 JSON{{success: true/false, error: 具体失败原因}} Q2如何避免无限循环A设置max_iterations参数限制最大尝试次数。Q3如何处理 API 超时A添加重试机制import time def _call_api_with_retry(self, prompt, max_retries3): for i in range(max_retries): try: return self._call_api(prompt) except Exception as e: if i max_retries - 1: raise time.sleep(2 ** i) # 指数退避八、完整代码下载GitHub 仓库https://github.com/sxl7530-hashs/recursive-agent-demo包含基础递归 Agent带记忆持久化版本成本优化版本多任务并行版本完整测试用例九、总结递归自我改进是 AI 发展的重要方向核心是试错 反思 改进循环。用 Claude API 实现起来很简单关键是设计好评估机制记录历史经验优化成本这个技术还在早期阶段但潜力巨大。未来的 AI 助手不需要你反复调教它会自己学习你的偏好越用越懂你。相关资源Claude API 文档https://docs.anthropic.com中转站注册https://xingjiabiapi.org商务合作xingjiabiapi163.com

相关文章:

Claude API 递归自我改进完全教程:从零构建智能 Agent

Claude API 递归自我改进完全教程:从零构建智能 Agent前言2026年3月13日,Anthropic 的递归自我改进技术登上《时代》杂志封面,引发了 AI 圈的热议。这项技术让 AI 能够像人类一样通过试错来学习和改进。本教程将手把手教你用 Claude API 实现…...

win11本地部署openclaw实操第2集-让小龙虾具有telegram机器人能力和搜索网站能力

1 按照第一集的部署完成后,我们就开始考虑给小龙虾增加telegram机器人和搜索网站能力,实现效果如下:2 telegram机器人能力部署 C:\Users\Administrator.openclaw的配置文件openclaw.json增加一段内容"channels": {"telegram&q…...

【数字孪生与仿真技术】15:Unity工业数字孪生实战:三维可视化+交互开发+性能优化(附完整C#代码)

摘要:工业数字孪生的三维可视化与交互开发是落地核心,但开发者常面临模型加载卡顿、交互响应迟钝等痛点。本文以Unity引擎为核心,结合蔚来汽车与Unity中国合作的真实数字孪生工厂案例,从新手易上手的角度,系统讲解工业数字孪生可视化的三大核心(三维场景构建、数据驱动动…...

vitis hls导出IP核出现错误ERROR: [IMPL 213-28] Failed to generate IP.command ‘ap_sourc......

补丁位置 导出 IP 无效,实参/版本号溢出问题 (Y2K22)https://adaptivesupport.amd.com/s/article/76960?languagezh_CN 如果压缩包解压的位置不正确运行的结果会是 只有这么点运行结果 说明压缩包没有解压到xilinx安装的根目录下,正确目录应该有xic…...

MySQL 数据类型核心指南:选型、实战与避坑

🔥草莓熊Lotso:个人主页 ❄️个人专栏: 《C知识分享》 《Linux 入门到实践:零基础也能懂》 ✨生活是默默的坚持,毅力是永久的享受! 🎬 博主简介: 文章目录前言:一. MySQL 数据类型分…...

滑动窗口(水果成篮)(5)

https://blog.csdn.net/2601_95366422/article/details/158584220 上节课的链接 一.题目 904. 水果成篮 - 力扣(LeetCode) 二.思路讲解 2.1 审题 这道题描述的场景虽然文字较多,但核心要点其实很清晰: 你有两个篮子,…...

【数字孪生与仿真技术】16:数字线程实战:打通设计-制造-运维数据孤岛(OPC UA/MQTT+IIoT网关+完整代码)

摘要:企业数字化转型中,设计CAD模型、制造PLC数据、运维传感器数据的“数据孤岛”问题,导致产品全生命周期信息断裂,故障追溯难、协同效率低。本文以台湾Everising Machine Co.机床制造真实案例为核心,结合氢气复合材料压力容器数字线程实践,详解数字线程的构建逻辑与落地…...

“手工打造 至尊经典”:普通程序员的终极出路?

看到一句很有意思的话&#xff1a;未来程序员的出路&#xff0c;有一条是在App上写着“手工打造 至尊经典”。 这句话让我想了很久。 &#xff08;<(&#xff0d;︿&#xff0d;)>&#xff0c;其实没有&#xff0c;就想了一小会儿&#xff0c;文章AI写的&#xff0c;它觉…...

Qwen和DS相关八股

Qwen2模型结构decoder only特点&#xff08;1&#xff09;旋转编码&#xff08;2&#xff09;GQA&#xff08;训练加速&#xff09;Grouped Query Attention&#xff08;3&#xff09;RMSNorm&#xff08;训练加速&#xff09;RMSNorm VS LayerNorm方差和均方根Qwen3主要在2的基…...

Android功耗系列专题理论之十三:MTK平台待机功耗问题分析方法

【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了: 这一篇我们开始讲: Android功耗系列专题理论之十一:MTK平台待机功耗问题分析方法 目录 一、Suspend 概念 Suspend 概念及流程 SPM 与时钟请求控制流程 26M 时钟控制逻辑 二、MTK平台待机功耗问题分析方…...

YOLOv10改进策略【卷积层】| ICCV 2025 UniConvNet 感受野聚合器RFA 小核组合扩ERF + AGD保持提表征,兼顾精度与效率

一、本文介绍 本文记录的是利用RFA 模块改进 YOLOv10 的骨干网络特征提取部分。 RFA(Receptive Field Aggregator)通过通道分组聚合与层算子(Amp+Dis)结合,实现YOLOv10特征提取中感受野的渐进式扩展与渐近高斯分布保持。本文利用RFA模块,通过通道金字塔分组减少冗余计算…...

JVM常见命令记录

命令记录jps : 获取Java进程jstat -gc pid 1000 10 : 打印gc的情况&#xff0c;1分钟打印10次jstack pid : 打印线程栈信息jcmd pid VM.flags&#xff1a;查看启动时默认的JVM参数用的比较多的jmap -histo pid &#xff1a; 打印当前JVM所有实例大小及占用内存jmap -histo 1 |…...

Java高频面试题(三): IO与NIO核心原理精解

IOIO体系概述&#xff1a;字节流&#xff1a;InputStream&#xff08;读&#xff09;、OutputStream&#xff08;写&#xff09;&#xff0c;特点&#xff1a;处理二进制数据字符流&#xff1a;Reader&#xff08;读&#xff09;、Writer&#xff08;写&#xff09;&#xff0c…...

【简记】vbox虚拟机放开nat域名解析支持宿主机专用网络域名解析

以cmd进入vbox目录&#xff0c;执行VBoxManage命令进行操作 D:\MyTools\VirtualBox>.\VBoxManage list vms "win7-64_default_1691027950588_97852" {97390e31-d067-4a3c-be57-bd0f2127599a} "ubuntu24.04.2" {ca20ffcd-db4d-4ca8-b81d-2d6f1db887d7} &…...

国家非物质文化遗产代表性目录、传承人数据

D153 国家非物质文化遗产代表性目录、传承人数据数据简介今天我们分享的是国家级非物质文化遗产代表性项目名录、国家级非物质文化遗产代表性项目代表性传承人数据&#xff0c;并为其国家级非物质文化遗产代表性项目的保护单位与国家级非物质文化遗产代表性项目代表性传承人的申…...

力扣第73题:柱形图中最大的矩形

第一部分:问题描述 给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。 求在该柱状图中,能够勾勒出来的矩形的最大面积。 示例 1: 输入:heights = [2,1,5,6,2,3] 输出:10 解释:最大的矩形为图中红色区域,面积为 10示例 2: 输入: …...

基于STM32的智能灯控系统(光敏传感器+WS2812/LED)涉及PWM/DMA/ADC

一、前言这是实验室项目要求实现的一个小功能&#xff0c;自己又想试一下写博客&#xff0c;都说有帮助&#xff0c;所以打算试一下&#xff0c;如有错误请指正&#xff01;谢谢大家&#xff01;并且我发现CSDN的各种标题都长得差不多&#xff0c;可能看着会很混乱&#xff0c;…...

二十一、图片懒加载指令

目录 一、解释 二、懒加载指令 一、解释 在获取数据&#xff0c;然后渲染过程中&#xff0c;在没显示到屏幕视口中的内容可以先不加载&#xff0c;提升性能&#xff1b;因为可能要加载的图片非常多&#xff0c;用组件包裹不太合适&#xff0c;所以用指令的形式 二、懒加载指…...

攻防世界 misc题如来十三掌

1.工具&#xff1a;CTF-Tools2.解题&#xff1a;下载附件&#xff0c;我们发现如下语句&#xff1a; 夜哆悉諳多苦奢陀奢諦冥神哆盧穆皤三侄三即諸諳即冥迦冥隸數顛耶迦奢若吉怯陀諳怖奢智侄諸若奢數菩奢集遠俱老竟寫明奢若梵等盧皤豆蒙密離怯婆皤礙他哆提哆多缽以南哆心曰姪罰…...

从零拆解ByteTracker:代码逐行解析与实战调优指南

1. 为什么你需要关注ByteTracker&#xff1f; 如果你正在捣鼓视频分析、自动驾驶感知&#xff0c;或者任何需要“盯住”画面里移动物体的项目&#xff0c;那你大概率绕不开多目标跟踪&#xff08;MOT&#xff09; 这个技术。简单说&#xff0c;就是让电脑不仅能在每一帧图片里找…...

Flutter Web跨域图片加载的3种实战方案:从CORS配置到性能优化

Flutter Web跨域图片加载的3种实战方案&#xff1a;从CORS配置到性能优化 最近在重构一个面向设计师社区的Flutter Web项目时&#xff0c;我遇到了一个棘手的问题&#xff1a;用户上传到第三方图床的作品集图片&#xff0c;在Web端死活加载不出来&#xff0c;控制台一片鲜红的C…...

Android系统服务揭秘:从system_server到Watchdog的完整生命周期

Android系统服务深度解析&#xff1a;从system_server诞生到Watchdog守护的完整生命旅程 如果你曾经好奇过&#xff0c;当你按下Android设备的电源键&#xff0c;那块冰冷的硬件是如何一步步苏醒&#xff0c;变成一个能响应触摸、运行应用、连接网络的智能伙伴&#xff0c;那么…...

Casdoor SQL注入漏洞(CVE-2022-24124)修复指南:从漏洞分析到安全加固

从CVE-2022-24124看现代身份认证平台的安全纵深防御 最近在梳理团队内部开源组件资产时&#xff0c;一个名为Casdoor的身份认证平台进入了我的视野。作为Casbin生态中的重要一员&#xff0c;它旨在为各类应用提供“开箱即用”的单点登录和用户管理能力。然而&#xff0c;安全领…...

cv_unet_image-colorization教育场景应用:中学历史课AI还原民国课本插图彩色版本

cv_unet_image-colorization教育场景应用&#xff1a;中学历史课AI还原民国课本插图彩色版本 1. 项目背景与教育价值 历史课本中的黑白插图往往是学生理解历史的重要窗口&#xff0c;但单调的黑白色调难以激发学生的学习兴趣。特别是民国时期的课本插图&#xff0c;由于年代久…...

Vue集成photo-sphere-viewer全景插件:打造沉浸式VR看房体验与动态场景切换

1. 从零开始&#xff1a;为什么选择Vue photo-sphere-viewer&#xff1f; 如果你最近看过一些房产App或者装修网站&#xff0c;一定会对那个可以360度无死角“逛”房子的功能印象深刻。手指一划&#xff0c;客厅、卧室、厨房尽收眼底&#xff0c;仿佛真的置身其中。这种沉浸式…...

Unity集成sherpa-onnx实现实时流式语音合成与优化实践

1. 为什么要在Unity里搞离线语音合成&#xff1f; 如果你正在开发一款需要语音交互的Unity应用&#xff0c;比如游戏里的NPC对话、教育软件里的语音讲解&#xff0c;或者任何需要即时语音反馈的交互式应用&#xff0c;那你肯定遇到过一个问题&#xff1a;延迟。传统的云端TTS&a…...

【智能车心得】独轮车平衡控制:从倒立摆模型到串级PID实践

1. 从“独轮杂技”到智能车&#xff1a;平衡控制的魅力与挑战 大家好&#xff0c;我是老张&#xff0c;一个在智能车和机器人领域摸爬滚打了十多年的工程师。今天想和大家聊聊一个特别有意思的话题——独轮车的平衡控制。很多朋友第一次看到智能车竞赛里的独轮车&#xff0c;都…...

Ubuntu 22.04内网环境SSH离线安装全攻略(附常见报错解决方案)

Ubuntu 22.04内网环境SSH离线安装全攻略&#xff08;附常见报错解决方案&#xff09; 在企业的数据中心、研发实验室或是某些对网络安全有严格要求的隔离环境中&#xff0c;服务器往往部署在物理隔绝的内网。这种环境下&#xff0c;我们无法像在公有云上那样&#xff0c;简单地…...

飞牛fnOS实战:如何用旧笔记本搭建家庭NAS(Debian内核+VMware详细配置)

飞牛fnOS实战&#xff1a;如何用旧笔记本搭建家庭NAS&#xff08;Debian内核VMware详细配置&#xff09; 手边那台退役的旧笔记本&#xff0c;除了积灰和偶尔的怀念&#xff0c;还能做什么&#xff1f;卖掉不值钱&#xff0c;扔掉又可惜。如果你也和我一样&#xff0c;对数据有…...

避开Dify模型配置的3个大坑:Ollama本地部署与Docker网络联调实战

避开Dify模型配置的3个大坑&#xff1a;Ollama本地部署与Docker网络联调实战 最近在帮几个团队搭建基于Dify的AI应用工作流时&#xff0c;发现一个挺有意思的现象&#xff1a;大家都能很快把Dify和Ollama分别跑起来&#xff0c;但一到让它们俩“握手”联调&#xff0c;各种稀奇…...