当前位置: 首页 > article >正文

AI Agent设计模式:从ReAct到Plan-and-Execute

Agent 设计模式ReAct 与 Plan-Execute 讲透Function Calling 让 Agent 会用工具但真正让 Agent「聪明」的是它的思考模式。这就像给你一本字典不意味着你会写文章——你需要方法论。ReAct 和 Plan-Execute 就是 Agent 的两种核心方法论。一、什么是 Agent 的「思考模式」看一个例子用户写一个 Python 脚本从 CSV 读取销售数据计算月度汇总生成图表 普通 LLM直接写一堆代码可能缺少依赖、路径写死、图表类型不合适 有思考的 Agent 思考我需要分几步做这件事 步骤1先看看 CSV 长什么样调 read_file 步骤2用 pandas 读取和计算写代码 步骤3用 matplotlib 生成图表写代码 步骤4跑一遍验证执行 结果完整、可运行的方案这就是 Agent 的核心价值——不是一步到位而是分步执行、观察结果、修正方向。二、ReAct边想边做ReAct Reasoning Acting是 2023 年 Google 提出的范式至今仍是 Agent 设计的基础。ReAct 循环┌──────────────┐ │ 观察环境 │←─────────────┐ └──────┬───────┘ │ ▼ │ ┌──────────────┐ │ │ 推理思考 │ │ └──────┬───────┘ │ ▼ │ ┌──────────────┐ │ │ 执行动作 │──────────────┘ └──────────────┘ 循环直到完成手写 ReAct AgentimportjsonfromopenaiimportOpenAI clientOpenAI(api_keyyour-key,base_urlhttps://api.deepseek.com/v1)# ── 工具定义 ──tools[...]# 同上一篇的天气和计算工具# ── ReAct System Prompt ──REACT_PROMPT你是一个 ReAct Agent。按以下格式思考和行动 Thought: 分析当前情况决定下一步做什么 Action: 调用的工具名称 Action Input: 工具参数JSON 格式 Observation: 工具返回的结果 ...重复 Thought/Action/Action Input/Observation Thought: 我已经有足够的信息回答用户了 Final Answer: 最终回答 可用工具 - get_weather(city: str): 查询城市天气 - calculate(expression: str): 执行数学计算 开始defreact_agent(user_input:str,max_steps:int5)-str:messages[{role:system,content:REACT_PROMPT},{role:user,content:user_input}]forstepinrange(max_steps):print(f\n--- Step{step1}---)responseclient.chat.completions.create(modeldeepseek-chat,messagesmessages,toolstools,tool_choiceauto)msgresponse.choices[0].message contentmsg.contentorprint(content[:200])# 如果 LLM 输出 Final Answer结束ifFinal Answer:incontent:returncontent.split(Final Answer:)[-1].strip()# 如果有工具调用执行ifmsg.tool_calls:fortool_callinmsg.tool_calls:func_nametool_call.function.name func_argsjson.loads(tool_call.function.arguments)print(f 调用{func_name}({func_args}))# 执行工具resultexecute_tool(func_name,func_args)print(f 结果{result})# 追加入对话messages.append(msg)messages.append({role:tool,tool_call_id:tool_call.id,content:result})return未能完成超过最大步骤数# ── 复杂任务测试 ──resultreact_agent(北京今天什么天气如果温度超过 20 度帮我把 100 200 算一下)print(f\n✅ 最终答案{result})执行过程--- Step 1 --- Thought: 用户问了两个问题。先查北京天气。 Action: get_weather 调用get_weather({city: 北京}) 结果北京晴25°C --- Step 2 --- Thought: 温度超过 20 度需要计算 100 200 Action: calculate 调用calculate({expression: 100 200}) 结果300 --- Step 3 --- Thought: 两个问题都有了结果 Final Answer: 北京今天晴天温度 25°C。由于超过 20 度100 200 300。三、Plan-Execute先规划后执行ReAct 是「走一步看一步」Plan-Execute 是「谋定而后动」。Plan-Execute 流程 ① Planner规划器 分析任务 → 生成步骤清单 ② Executor执行器 逐步执行计划中的每一步 ③ Monitor监控器 检查执行结果必要时让 Planner 重新规划Plan-Execute 代码框架PLANNER_PROMPT你是任务规划器。请将用户需求分解为可执行的步骤清单。 每步应该是单一的、可独立完成的动作。 输出格式 { steps: [ {step: 1, action: 描述动作, tool: 工具名, args: {}}, {step: 2, ...} ] }EXECUTOR_PROMPT你是任务执行器。执行给定的步骤报告结果。asyncdefplan_execute_agent(user_input:str):# 1. 规划plan_responseclient.chat.completions.create(modeldeepseek-chat,messages[{role:system,content:PLANNER_PROMPT},{role:user,content:user_input}],response_format{type:json_object})planjson.loads(plan_response.choices[0].message.content)print(f 规划了{len(plan[steps])}个步骤)# 2. 逐步执行results[]forsinplan[steps]:print(f 执行步骤{s[step]}:{s[action]})resultexecute_tool(s[tool],s[args])results.append(result)# 3. 汇总summary_promptf根据以下执行结果生成最终回复\n{json.dumps(results)}finalclient.chat.completions.create(modeldeepseek-chat,messages[{role:user,content:summary_prompt}])returnfinal.choices[0].message.content四、ReAct vs Plan-Execute维度ReActPlan-Execute决策方式每步看结果再决定下一步一次性规划逐步执行灵活性高——能应对意外低——按计划走效率步骤可能多步骤少不反复适用场景需要试错、探索性任务步骤明确、流程化任务风险可能「迷路」无限循环第一步规划错就全错实战建议简单任务用 ReAct流程明确的任务用 Plan-Execute。复杂任务可以混合——先用 Plan-Execute 规划大框架每个子任务内部用 ReAct。五、进阶Reflection反思模式在 ReAct 基础上加一层「回头看」ReAct 循环 ↓ 暂停 → 自我检查 我做对了吗有没有遗漏有没有更简单的做法 ↓ 有问题 → 修正 → 继续 没问题 → 输出最终答案REFLECTION_PROMPT 请检查你刚才的推理和行动 1. 是否遗漏了用户需求 2. 工具调用结果是否正确理解 3. 最终回答是否完整 如果发现问题请修正后重新输出。 六、实战用 ReAct 做一个代码助手 Agent# 工具集tools[{name:read_file,description:读取文件内容},{name:write_file,description:写入文件},{name:run_tests,description:运行测试},{name:search_docs,description:搜索技术文档},]# 场景修 bugtask 用户报告app.py 第 42 行的 login 函数当用户名为空时没有返回错误。 请修复这个 bug并确保所有测试通过。 # Agent 的执行过程# Thought: 先看看 app.py 长什么样# Action: read_file(app.py)# Observation: [文件内容]# Thought: 第 42 行确实没有处理空用户名。需要加校验。# Action: write_file(app.py, [修改后的内容])# Observation: 写入成功# Thought: 跑测试确认# Action: run_tests()# Observation: 全部通过 ✅# Final Answer: 已在 login 函数开头添加了空用户名校验测试全部通过。七、总结ReAct 是 Agent 的基础循环思考→行动→观察→再思考Plan-Execute 适合确定性任务先列计划逐步执行Reflection 提升准确率执行后自我检查生产环境通常混合使用外层 Plan-Execute子任务 ReAct设置 max_steps防止 Agent 无限循环八、生产实战Agent 上线后才知道的事8.1 Agent 无限循环——每月至少遇到一次ReAct Agent 最常见的 bugLLM 反复调用同一个工具永远到不了 Final Answer。一个代码审查 Agent 因为 LLM 对修复不满意连续调了 14 次 read_file write_file烧了 $2 Token什么都没改好MAX_STEPS5STAGNATION_LIMIT3# 连续同一动作超过 3 次 → 强制终止defdetect_loop(action_history:list)-bool:iflen(action_history)STAGNATION_LIMIT:returnFalserecentaction_history[-STAGNATION_LIMIT:]# 检查最近 3 次是否都在做一模一样的事returnlen(set((a[tool],str(a[args]))forainrecent))1# 在主循环中检测ifdetect_loop(action_history):messages.append({role:system,content:你陷入了循环。直接输出 Final Answer说明无法完成的原因。})8.2 成本失控——Agent 偷偷帮你花钱电商客服 Agent日均 200 次对话 每次对话3250 Token 月消耗2000 万 Token Claude Opus: $300/月 Claude Sonnet: $60/月 DeepSeek V3: ¥20/月经验Agent 开发阶段用便宜模型。上线后对任务分级——简单意图识别用 DeepSeek复杂推理才切 Claude。定时拉 API 账单发现异常立即排查。8.3 Human-in-the-Loop不该让 Agent 自己做决定的事DANGEROUS_ACTIONS[delete_file,drop_table,send_email_to_all,publish_article]defrequires_approval(action:dict)-bool:ifaction[tool]inDANGEROUS_ACTIONS:returnTrueifestimate_cost(action)0.5:# 预估成本 $0.5returnTruereturnFalse一个真实事件Agent 在测试环境自动 DROP 了一张表因为 LLM 把「清理测试数据」理解成了 DROP TABLE。从那以后所有 DROP/TRUNCATE 操作都加了人工确认。8.4 Agent 输出质量的评估Agent 不像传统代码那么容易测评估维度问题怎么测任务完成率用户需求被满足了吗人工标注 100 个 case工具选择选的工具对吗有没有多调/漏调对比最优调用路径效率步骤数合理吗有没有绕弯路统计平均步骤数安全有没有危险操作敏感操作审计日志成本Token 消耗合理吗监控 API 账单下一篇《LangGraph 入门用状态图构建 Agent》——告别手写循环用声明式的方式定义 Agent 的行为逻辑。系列文章00-总纲 → ①-LLM 原理 → ②-Prompt 工程 → ③-Function Calling → ④-RAG → ⑤-Agent 模式 → ⑥-LangGraph → ⑦-MCP → ⑧-Multi-Agent

相关文章:

AI Agent设计模式:从ReAct到Plan-and-Execute

Agent 设计模式:ReAct 与 Plan-Execute 讲透Function Calling 让 Agent 会用工具,但真正让 Agent「聪明」的,是它的思考模式。这就像给你一本字典不意味着你会写文章——你需要方法论。ReAct 和 Plan-Execute 就是 Agent 的两种核心方法论。一…...

OpenClaw 上下文瘦身:3 个实验

这篇不是讲“提示词怎么写得更优雅”。我只看一个更硬的问题:Agent 跑久以后,上下文到底是怎么胖起来的,哪一刀最值得先砍。实验脚本和结果都放在本地目录里,可以复跑。你大概见过这种故障: Agent 前 10 分钟很听话&am…...

避坑指南:解决RK3588编译ZLMediaKit时OpenSSL等依赖库路径找不到的问题

RK3588交叉编译ZLMediaKit实战:系统性解决OpenSSL依赖路径问题 第一次在RK3588开发板上尝试编译ZLMediaKit时,我遇到了一个看似简单却令人抓狂的问题——CMake死活找不到OpenSSL库。屏幕上不断跳出的Could NOT find OpenSSL错误提示,让我意识…...

前端开发自救指南:不用写测试代码,5分钟用Playwright录制生成E2E测试脚本

前端开发自救指南:5分钟零代码生成E2E测试脚本的Playwright实战 最近在重构公司后台管理系统时,我遇到了一个典型的前端开发困境:每次修改表单验证逻辑后,都需要手动点击十几个字段组合来验证是否会影响其他功能。直到团队里的测…...

华为擎云L420变身MCU开发主力机:VSCode + Cortex-Debug + 自编译工具链玩转雅特力AT32

华为擎云L420打造高效MCU开发环境:VSCodeCortex-Debug全流程实战 在嵌入式开发领域,效率工具的选择往往能决定项目的成败。当国产化浪潮席卷技术圈,越来越多的开发者开始尝试在纯国产硬件上构建完整的工作流。华为擎云L420作为一款基于ARM架构…...

如何高效使用AutoHotkey编译器:Ahk2Exe完整指南与实战技巧

如何高效使用AutoHotkey编译器:Ahk2Exe完整指南与实战技巧 【免费下载链接】Ahk2Exe Official AutoHotkey script compiler - written itself in AutoHotkey 项目地址: https://gitcode.com/gh_mirrors/ah/Ahk2Exe 对于Windows自动化脚本开发者而言&#xff…...

ESPHome安装后,你的第一个智能设备可以不是开关或灯

ESPHome创意实践:从温控风扇到植物管家,解锁智能设备的无限可能 当你完成ESPHome的基础安装后,脑海中浮现的第一个项目是什么?大多数人会想到开关或灯泡——这些确实是智能家居的经典起点。但ESP8266/ESP32开发板的潜力远不止于此…...

AMP插件开发者工具完全指南:如何快速诊断和修复AMP验证问题

AMP插件开发者工具完全指南:如何快速诊断和修复AMP验证问题 【免费下载链接】amp-wp Enable AMP on your WordPress site, the WordPress way. 项目地址: https://gitcode.com/gh_mirrors/am/amp-wp 你是否正在为WordPress网站的AMP验证问题而烦恼&#xff1…...

AI Agent的推理能力边界:大模型之外的关键技术突破

AI Agent的推理能力边界:大模型之外的关键技术突破 关键词:AI Agent、推理能力边界、工具增强推理、神经符号推理、自主规划、多Agent协同、幻觉抑制 摘要:本文针对当前行业普遍存在的「大模型参数堆得越高,AI Agent推理能力就越强」的认知误区,系统拆解了大模型原生推理能…...

51c自动驾驶~合集57

我自己的原文哦~ https://blog.51cto.com/whaosoft/13960249 #端到端自动驾驶算法实现原理 1从传感器数据到控制策略的端到端方法 端到端自动驾驶基本流程: (1)子任务模型被更大规模的神经网络模型取代,最终即为端到端神经网络模型; (2)…...

长期使用Taotoken聚合API在服务稳定性方面的体验分享

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 长期使用Taotoken聚合API在服务稳定性方面的体验分享 作为一家长期依赖大模型能力进行产品开发的团队,我们在过去数月里…...

PTA天梯赛L2-007家庭房产题解:用C++并查集+结构体搞定复杂家庭关系统计(附完整代码)

PTA天梯赛L2-007家庭房产题解:C并查集与结构体的高效应用 在算法竞赛中,处理复杂关系网络是常见挑战。PTA天梯赛L2-007"家庭房产"题目正是这类问题的典型代表,要求选手统计每个家庭的人口、房产套数和人均面积。这道题看似简单&am…...

深入理解LZFSE核心技术:Lempel-Ziv与FSE编码的完美结合

深入理解LZFSE核心技术:Lempel-Ziv与FSE编码的完美结合 【免费下载链接】lzfse LZFSE compression library and command line tool 项目地址: https://gitcode.com/gh_mirrors/lz/lzfse LZFSE(Lempel-Ziv Finite State Entropy)是苹果…...

别再手动改文献了!手把手教你定制Mendeley的GB/T 7714-2005引用格式(附常见问题修复)

深度定制Mendeley文献引用格式:GB/T 7714-2005实战指南 科研写作中,文献引用格式的规范性直接影响论文的专业程度。许多研究者在使用Mendeley内置的GB/T 7714-2005格式时,常遇到作者名全大写、et al.显示异常等问题。本文将提供一套完整的解…...

WordPress Playground部署实战:从开发到生产的完整流程指南

WordPress Playground部署实战:从开发到生产的完整流程指南 【免费下载链接】wordpress-playground Run WordPress in the browser via WebAssembly PHP 项目地址: https://gitcode.com/gh_mirrors/wo/wordpress-playground WordPress Playground 是一个革命…...

抖音视频收藏革命:从水印困扰到纯净收藏的完美蜕变

抖音视频收藏革命:从水印困扰到纯净收藏的完美蜕变 【免费下载链接】douyin_downloader 抖音短视频无水印下载 win编译版本下载:https://www.lanzous.com/i9za5od 项目地址: https://gitcode.com/gh_mirrors/dou/douyin_downloader 你是否曾经在抖…...

CLI-Anything与MCP服务器:打造强大后端的实战教程

CLI-Anything与MCP服务器:打造强大后端的实战教程 【免费下载链接】CLI-Anything "CLI-Anything: Making ALL Software Agent-Native" -- CLI-Hub: https://clianything.cc/ 项目地址: https://gitcode.com/GitHub_Trending/cl/CLI-Anything CLI-A…...

Few-shot vid2vid自定义数据集训练指南:从标签图到真实视频的转换

Few-shot vid2vid自定义数据集训练指南:从标签图到真实视频的转换 【免费下载链接】few-shot-vid2vid Pytorch implementation for few-shot photorealistic video-to-video translation. 项目地址: https://gitcode.com/gh_mirrors/fe/few-shot-vid2vid Few…...

Jupyter Notebook 云GPU配置全解析(含实操+选型指南)

一、前言:为什么需要Jupyter Notebook云GPU配置?Jupyter Notebook作为交互式编程工具,广泛应用于AI训练、数据建模、算法调试等场景,其“代码文本”一体化特性,大幅提升开发效率。但本地环境存在明显局限:普…...

国产多模态大模型:产业协同全景与实战指南

国产多模态大模型:产业协同全景与实战指南 引言 在人工智能浪潮席卷全球的背景下,国产多模态大模型正从技术探索迈向广泛的产业协同应用。与只能处理文本或图像的单一模态模型相比,多模态大模型能同时理解、关联和生成文本、图像、音频、视频…...

智慧树自动刷课插件终极指南:如何3分钟实现免手动学习

智慧树自动刷课插件终极指南:如何3分钟实现免手动学习 【免费下载链接】zhihuishu 智慧树刷课插件,自动播放下一集、1.5倍速度、无声 项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台的重复性操作而烦恼吗?智…...

vscode-mssql架构设计器:无代码可视化建模数据库架构的终极工具

vscode-mssql架构设计器:无代码可视化建模数据库架构的终极工具 【免费下载链接】vscode-mssql Visual Studio Code SQL Server extension. 项目地址: https://gitcode.com/gh_mirrors/vs/vscode-mssql vscode-mssql是Visual Studio Code的SQL Server扩展&am…...

如何在 5 分钟内集成 human-panic:为你的 Rust CLI 应用添加专业级错误处理

如何在 5 分钟内集成 human-panic:为你的 Rust CLI 应用添加专业级错误处理 【免费下载链接】human-panic Panic messages for humans. 项目地址: https://gitcode.com/gh_mirrors/hu/human-panic human-panic 是一个专为 Rust CLI 应用设计的错误处理库&…...

掌握视频时间:如何用3个步骤将视频学习效率提升300%

掌握视频时间:如何用3个步骤将视频学习效率提升300% 【免费下载链接】videospeed HTML5 video speed controller (for Google Chrome) 项目地址: https://gitcode.com/gh_mirrors/vi/videospeed 你是否曾经在观看在线课程时感到节奏太慢?是否在回…...

JetBrains IDE试用期重置终极指南:三步实现无限开发体验

JetBrains IDE试用期重置终极指南:三步实现无限开发体验 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 还在为JetBrains IDE试用期到期而烦恼吗?ide-eval-resetter是你的理想解决方案&…...

语义搜索失效?NotebookLM这4类文档结构陷阱正悄悄拖垮你的研究效率,立即排查!

更多请点击: https://intelliparadigm.com 第一章:语义搜索失效?NotebookLM这4类文档结构陷阱正悄悄拖垮你的研究效率,立即排查! NotebookLM 的语义搜索能力依赖于底层文档的语义连贯性与结构清晰度。当文档存在隐性结…...

高效AI专著生成:20万字专著一键搞定,AI写专著工具实测推荐!

学术专著写作挑战与AI工具助力 对于初次尝试编写学术专著的研究者来说,写作过程就像是在“摸索着走过一条未知的小路”,处处都有挑战等待着他们。在选题上常常感到迷惘,难以在“有意义”与“可操作性”之间找到合适的平衡:有的研…...

终极 Node.js 路径管理神器:module-alias 完全指南

终极 Node.js 路径管理神器:module-alias 完全指南 【免费下载链接】module-alias Register aliases of directories and custom module paths in Node 项目地址: https://gitcode.com/gh_mirrors/mo/module-alias 你是否厌倦了在 Node.js 项目中看到像 requ…...

CVPR2021明星算法LoFTR实战:在Ubuntu 20.04上从零搭建Python 3.7+Pytorch 1.6.0环境,跑通第一个图像匹配Demo

CVPR2021明星算法LoFTR实战:在Ubuntu 20.04上从零搭建Python 3.7Pytorch 1.6.0环境,跑通第一个图像匹配Demo 计算机视觉领域每年都会涌现出大量创新算法,而CVPR2021上发表的LoFTR(Detector-Free Local Feature Matching with Tran…...

AB3DMOT性能优化技巧:10个提升跟踪精度的关键参数

AB3DMOT性能优化技巧:10个提升跟踪精度的关键参数 【免费下载链接】AB3DMOT (IROS 2020, ECCVW 2020) Official Python Implementation for "3D Multi-Object Tracking: A Baseline and New Evaluation Metrics" 项目地址: https://gitcode.com/gh_mirr…...