当前位置：首页 > article >正文

再谈Agent核心模式：ReAct、Plan-and-Solve 与 ToT

article 2026/4/25 21:55:11

很多 Agent 原型跑得很顺一进真实业务长链路就开始失控。它能查一个订单也能调用一个工具但一旦任务变成“先判断客户等级再查合同再核对 SLA再生成补偿方案再发起审批”简单的边想边做就会暴露短板。ReAct 的价值是把推理和行动接成一个循环。模型先想一步再调用工具再根据观察结果继续下一步。这种结构适合短任务和探索型问答但复杂任务需要更早看到全局依赖、候选路径、失败回退和人工检查点。Plan-and-Solve、Tree of Thoughts 和 Graph of Thoughts 真正带来的变化是让 Agent 从局部反应式执行升级成带规划层、搜索层和状态机的执行系统。复杂 Agent 的核心升级是把“下一步做什么”提前拆成“任务依赖图怎么建、候选路径怎么选、执行状态怎么收口”。一、ReAct 的边界出现在长链路任务里ReAct 指的是 reasoning and acting也就是让模型在每轮里先推理再行动再读取工具返回的观察结果。它把大模型从纯文本回答拉进了外部世界搜索、查库、调用 API、读文件都可以进入同一个循环。这个循环很适合局部不确定的任务。比如查一条知识、补一段代码、读取一个页面、对一个订单做单点判断模型可以边看边改直到拿到答案。长链路任务的压力来自另一类问题。任务之间有前后依赖有些分支可以并行有些动作必须等人工审批有些路径失败后需要补偿。此时只让模型在当前观察结果上决定下一步很容易把全局问题压成局部贪心。ReAct 在复杂任务中的 4 个常见失效信号任务越做越散模型不断补新步骤但看不到完整依赖关系。工具调用顺序受最近一次观察影响容易错过更优路径或并行机会。中途失败后只能继续试探很难知道应当重试、回滚、换路还是升级给人工。过程记录像一串对话日志无法稳定恢复成可审计的业务状态。因此复杂任务的第一步是先把任务从“一串动作”提升成“一张图”。这就是 Plan-and-Solve 可以落地的地方。二、Plan-and-Solve 先把任务拆成依赖图Plan-and-Solve 的核心思路是先规划再求解。模型不急着执行第一步而是先把问题拆成若干子问题明确每个子问题要产出什么再按计划逐步完成。落到工程里这个计划不应该只是自然语言清单。它更适合被整理成任务依赖图。每个节点都有任务编号、输入、预期输出、依赖节点、可用工具、验收标准和失败处理。这样后面的执行器才知道哪些节点可以并行哪些节点必须等待上游结果。一个投诉处理 Agent 的任务依赖图先规划成依赖图再进入执行接收投诉与识别目标查询客户等级CRM / 会员系统核对合同 SLA合同库 / 条款抽取拉取故障证据工单 / 日志 / 监控生成补偿方案候选依赖客户等级、SLA 与故障证据提交审批或升级人工这张图表达的重点是计划层先决定哪些信息必须拿到哪些任务可以并行哪些输出会共同约束最终方案。图建出来之后执行器拿到的是一组可调度、可恢复、可验收的节点而不是一句无法直接落地的“处理投诉”。Plan-and-Solve 解决的是结构问题。它让 Agent 先拥有任务地图。但地图只有一张时系统仍然可能走进次优路线。复杂场景还需要比较多条路径这就进入 ToT 和 GoT 的位置。三、ToT 和 GoT 把计划变成可搜索的候选空间Tree of Thoughts也就是思维树把中间推理结果当成可展开、可评分、可回溯的状态。模型不再只生成一条推理链而是在关键节点生成多个候选想法再用评分器挑出更值得继续展开的分支。Graph of Thoughts 进一步放宽结构。候选想法可以合并、改写、聚合和循环改进。对于企业任务这一点很重要。合同条款、故障证据和客户价值会反复互相修正很多场景天然更接近图结构。工程落地时ToT 和 GoT 可以被理解为三件事候选路径生成、路径评分、预算内剪枝。系统允许模型提出多种处理方案但每一种方案都必须带着成本、风险、证据完整度和可执行性进入评分。模式适合解决的问题工程形态ReAct短链路、强交互、工具结果会快速改变下一步思考、行动、观察循环Plan-and-Solve多步骤任务、依赖清晰、需要先看全局任务依赖图、节点验收、并行调度ToT / GoT存在多条候选路径需要比较、剪枝和回溯候选路径搜索、评分器、预算控制、状态合并这一层最容易写得很玄。真正能落地的关键是把“想法”降成结构化候选项。每个候选项都要说明它依赖哪些证据、会调用哪些工具、预计成本是多少、失败后如何退出。四、状态机是规划和搜索的落地点规划层生成的是任务图搜索层生成的是候选路径真正承接执行的是状态机。没有状态机计划只会停留在模型上下文里。一旦进程重启、工具超时、审批暂停系统就很难恢复到正确位置。复杂 Agent 的状态机至少要记录三类状态。第一类是任务节点状态例如已计划、待运行、运行中、被阻塞、待审批、已完成、已失败。第二类是证据状态例如数据已读取、证据不足、证据冲突、需要补充检索。第三类是治理状态例如需要人工确认、已授权、已拒绝、已补偿。复杂任务状态机的最小字段node_id当前子任务节点便于恢复、重试和审计。dependencies上游依赖和可并行节点决定调度顺序。evidence已获得证据和证据来源决定下一步是否可信。candidate_pathsToT 或 GoT 生成的候选路径及评分。approval_state人工中断、批准、拒绝和修改意见。checkpoint可恢复快照支撑长任务断点续跑。LangGraph 这类状态图框架的价值就在于把节点、边、检查点和人工中断变成运行时能力。AutoGen 的 GraphFlow 也在强调用图来表达多智能体流程。它们共同指向一个工程事实复杂 Agent 需要被状态图管理对话历史只适合保留上下文不适合承担生产调度职责。五、评分器决定搜索会不会变成烧钱试错ToT 和 GoT 一旦进入生产系统第一道边界就是成本。每个候选分支都可能触发模型调用、工具调用、数据库查询、沙箱执行和人工审批。搜索空间如果不收口很快会把质量提升变成延迟和费用问题。评分器要回答的问题比“哪个答案看起来更好”更具体。它应该同时评估证据完整度、业务风险、工具成本、可回滚性、用户体验和成功概率。低风险读操作可以多探索几步高风险写操作必须更早进入审批或停止。生产可用评分器的 5 个维度证据分关键输入是否来自可信系统是否存在冲突证据。风险分是否涉及金额、权限、合同、客户通知和不可逆副作用。成本分模型调用次数、工具调用次数、预计耗时和人工等待成本。可恢复分失败后能否重试、补偿、回滚或保留草稿。完成分方案是否满足用户目标和业务验收标准。评分器的输出应当进入状态机而不是只停在模型回复里。系统需要知道为什么保留 A 路径、剪掉 B 路径、升级 C 路径。这样后续审计、调参和复盘才有证据。六、综合图复杂任务 Agent 的四层执行架构把前面的层次合在一起复杂任务 Agent 可以拆成四层规划层先生成依赖图搜索层比较候选路径状态机层承接执行与恢复治理层控制风险与审计。点击图片可放大查看高清架构。复杂任务 Agent 的四层执行架构用户目标与业务约束目标、权限、时间、成本、风险等级规划层Plan-and-Solve 生成子任务依赖图节点、输入、输出、依赖、验收标准搜索层ToT / GoT 生成、评分、剪枝候选路径保留最值得继续执行的方案状态机层ready / running / blockedreviewing / done / failedcheckpoint 支撑断点续跑治理层审批、预算、权限、补偿trace_id、审计日志、人工接管控制自动化边界工具层与业务系统搜索、数据库、CRM、ERP、工单、审批流这张图里的关键关系是规划层和搜索层都不直接落到业务系统。它们先把决策压成可执行状态再由状态机决定何时调工具、何时暂停、何时恢复、何时让人接管。治理层也不是最后补上的日志。它从一开始就参与预算、权限和风险控制。低风险节点可以自动跑高风险节点必须等待审批搜索分支超过预算就要剪掉。这样复杂 Agent 才能既聪明又可控。七、落地顺序从一条可恢复链路开始团队不需要一开始就实现完整 GoT。更稳的路径是先选一条真实业务链路把 ReAct 执行过程改造成可恢复的状态机再把任务前置拆成依赖图最后只在关键决策节点引入候选搜索。这条顺序能避免过早复杂化。很多任务只需要 Plan-and-Solve不需要 ToT。很多 ToT 只需要在两个关键分支上做候选比较不需要展开几十个节点。工程系统追求的是可验证的完成率不是把所有论文结构都搬进运行时。给技术负责人的 4 个落地动作选一条 5 步以上、经常失败、需要人工确认的业务链路例如退款审批、故障补偿、合同审查或数据分析报告。把现有 ReAct 日志拆成节点状态明确每一步的输入、输出、依赖和失败处理。在计划层加入依赖图生成让系统先判断哪些节点可以并行哪些节点必须等待。只在高价值决策点引入 ToT 或 GoT用评分器控制候选数量、成本和风险。复杂 Agent 的上限不只取决于模型会不会推理更取决于系统能不能把推理组织成计划、搜索和可恢复的执行状态。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

再谈Agent核心模式：ReAct、Plan-and-Solve 与 ToT

相关文章：

再谈Agent核心模式：ReAct、Plan-and-Solve 与 ToT

二叉树中序线索化及中序线索二叉树找前驱/后继

Agent文件系统检索核心：Grep和Glob工具

DeepSeek‑V4 预览版：1M 上下文暴打西方闭源模型阵营，GPT/Gemini 这次真有压力了

microeco：突破微生物功能预测精度瓶颈的R包创新方案

机器学习交叉验证优化7大实战技巧

Delphi7 编译EXE报毒 Virus/Induc.a？一招根治（附详细步骤）

微信聊天记录导出终极指南：无需越狱，永久保存珍贵对话

光储并网Simulink仿真模型与直流微电网研究

创采德航--采购数智化转型专家

Unity WebCamTexture实战：从权限申请到区域截图，一个完整AR证件照项目的避坑实录

XGBoost多线程优化实战与性能调优指南

机器学习重采样方法：原理、实现与工程实践

从PLC抓包到JSON Schema自动生成：VSCode 2026工业协议插件的7大不可替代能力（附Gitee私有仓迁移教程）

【Docker AI Toolkit 2026避坑红宝书】：20年DevOps专家亲测的7大高频崩溃场景与秒级修复清单

如何3分钟解锁QQ音乐加密文件：终极免费工具使用指南

【深度架构解析】高并发 AI 视频管理平台：兼容 GB28181/RTSP，支持 X86/ARM+GPU/NPU 异构部署与源码交付

重磅！万众瞩目的DeepSeek V4十分钟前开源了，曾经的王又回来了！

轻松解锁网易云NCM音乐文件：ncmdumpGUI图形化转换工具完全攻略

HEIF Utility：让Windows用户轻松驾驭苹果HEIF图片格式的实用指南

5个关键策略让MacBook电池寿命延长2倍：AlDente深度使用指南

如何快速为PDF添加智能书签？pdfdir终极指南

技术突破：Pentaho Kettle如何实现异构数据源高效集成与ETL处理

安卓虚拟摄像头完整指南：3分钟实现摄像头画面替换

VSCode 2026高内存场景生存指南，专治多根工作区+Docker Compose+Jupyter Notebook三重压测：实测7类组合负载下的最优GC阈值配置表

PyAutoGUI 第3章弹窗交互功能教程（GUI交互，核心3）

如何用Seraphine实现终极英雄联盟BP自动化：告别手忙脚乱的对局准备

别再搞混了！C++里printf和setprecision控制小数位，到底有啥区别？

Vue3项目实战：5分钟给你的后台管理系统加上动态实时水印（支持暗黑模式）

机器学习评估指标全解析：从原理到Python实战