当前位置: 首页 > article >正文

再谈Agent核心模式:ReAct、Plan-and-Solve 与 ToT

很多 Agent 原型跑得很顺一进真实业务长链路就开始失控。它能查一个订单也能调用一个工具但一旦任务变成“先判断客户等级再查合同再核对 SLA再生成补偿方案再发起审批”简单的边想边做就会暴露短板。ReAct 的价值是把推理和行动接成一个循环。模型先想一步再调用工具再根据观察结果继续下一步。这种结构适合短任务和探索型问答但复杂任务需要更早看到全局依赖、候选路径、失败回退和人工检查点。Plan-and-Solve、Tree of Thoughts 和 Graph of Thoughts 真正带来的变化是让 Agent 从局部反应式执行升级成带规划层、搜索层和状态机的执行系统。复杂 Agent 的核心升级是把“下一步做什么”提前拆成“任务依赖图怎么建、候选路径怎么选、执行状态怎么收口”。一、ReAct 的边界出现在长链路任务里ReAct 指的是 reasoning and acting也就是让模型在每轮里先推理再行动再读取工具返回的观察结果。它把大模型从纯文本回答拉进了外部世界搜索、查库、调用 API、读文件都可以进入同一个循环。这个循环很适合局部不确定的任务。比如查一条知识、补一段代码、读取一个页面、对一个订单做单点判断模型可以边看边改直到拿到答案。长链路任务的压力来自另一类问题。任务之间有前后依赖有些分支可以并行有些动作必须等人工审批有些路径失败后需要补偿。此时只让模型在当前观察结果上决定下一步很容易把全局问题压成局部贪心。ReAct 在复杂任务中的 4 个常见失效信号任务越做越散模型不断补新步骤但看不到完整依赖关系。工具调用顺序受最近一次观察影响容易错过更优路径或并行机会。中途失败后只能继续试探很难知道应当重试、回滚、换路还是升级给人工。过程记录像一串对话日志无法稳定恢复成可审计的业务状态。因此复杂任务的第一步是先把任务从“一串动作”提升成“一张图”。这就是 Plan-and-Solve 可以落地的地方。二、Plan-and-Solve 先把任务拆成依赖图Plan-and-Solve 的核心思路是先规划再求解。模型不急着执行第一步而是先把问题拆成若干子问题明确每个子问题要产出什么再按计划逐步完成。落到工程里这个计划不应该只是自然语言清单。它更适合被整理成任务依赖图。每个节点都有任务编号、输入、预期输出、依赖节点、可用工具、验收标准和失败处理。这样后面的执行器才知道哪些节点可以并行哪些节点必须等待上游结果。一个投诉处理 Agent 的任务依赖图先规划成依赖图再进入执行接收投诉与识别目标查询客户等级CRM / 会员系统核对合同 SLA合同库 / 条款抽取拉取故障证据工单 / 日志 / 监控生成补偿方案候选依赖客户等级、SLA 与故障证据提交审批或升级人工这张图表达的重点是计划层先决定哪些信息必须拿到哪些任务可以并行哪些输出会共同约束最终方案。图建出来之后执行器拿到的是一组可调度、可恢复、可验收的节点而不是一句无法直接落地的“处理投诉”。Plan-and-Solve 解决的是结构问题。它让 Agent 先拥有任务地图。但地图只有一张时系统仍然可能走进次优路线。复杂场景还需要比较多条路径这就进入 ToT 和 GoT 的位置。三、ToT 和 GoT 把计划变成可搜索的候选空间Tree of Thoughts也就是思维树把中间推理结果当成可展开、可评分、可回溯的状态。模型不再只生成一条推理链而是在关键节点生成多个候选想法再用评分器挑出更值得继续展开的分支。Graph of Thoughts 进一步放宽结构。候选想法可以合并、改写、聚合和循环改进。对于企业任务这一点很重要。合同条款、故障证据和客户价值会反复互相修正很多场景天然更接近图结构。工程落地时ToT 和 GoT 可以被理解为三件事候选路径生成、路径评分、预算内剪枝。系统允许模型提出多种处理方案但每一种方案都必须带着成本、风险、证据完整度和可执行性进入评分。模式适合解决的问题工程形态ReAct短链路、强交互、工具结果会快速改变下一步思考、行动、观察循环Plan-and-Solve多步骤任务、依赖清晰、需要先看全局任务依赖图、节点验收、并行调度ToT / GoT存在多条候选路径需要比较、剪枝和回溯候选路径搜索、评分器、预算控制、状态合并这一层最容易写得很玄。真正能落地的关键是把“想法”降成结构化候选项。每个候选项都要说明它依赖哪些证据、会调用哪些工具、预计成本是多少、失败后如何退出。四、状态机是规划和搜索的落地点规划层生成的是任务图搜索层生成的是候选路径真正承接执行的是状态机。没有状态机计划只会停留在模型上下文里。一旦进程重启、工具超时、审批暂停系统就很难恢复到正确位置。复杂 Agent 的状态机至少要记录三类状态。第一类是任务节点状态例如已计划、待运行、运行中、被阻塞、待审批、已完成、已失败。第二类是证据状态例如数据已读取、证据不足、证据冲突、需要补充检索。第三类是治理状态例如需要人工确认、已授权、已拒绝、已补偿。复杂任务状态机的最小字段node_id当前子任务节点便于恢复、重试和审计。dependencies上游依赖和可并行节点决定调度顺序。evidence已获得证据和证据来源决定下一步是否可信。candidate_pathsToT 或 GoT 生成的候选路径及评分。approval_state人工中断、批准、拒绝和修改意见。checkpoint可恢复快照支撑长任务断点续跑。LangGraph 这类状态图框架的价值就在于把节点、边、检查点和人工中断变成运行时能力。AutoGen 的 GraphFlow 也在强调用图来表达多智能体流程。它们共同指向一个工程事实复杂 Agent 需要被状态图管理对话历史只适合保留上下文不适合承担生产调度职责。五、评分器决定搜索会不会变成烧钱试错ToT 和 GoT 一旦进入生产系统第一道边界就是成本。每个候选分支都可能触发模型调用、工具调用、数据库查询、沙箱执行和人工审批。搜索空间如果不收口很快会把质量提升变成延迟和费用问题。评分器要回答的问题比“哪个答案看起来更好”更具体。它应该同时评估证据完整度、业务风险、工具成本、可回滚性、用户体验和成功概率。低风险读操作可以多探索几步高风险写操作必须更早进入审批或停止。生产可用评分器的 5 个维度证据分关键输入是否来自可信系统是否存在冲突证据。风险分是否涉及金额、权限、合同、客户通知和不可逆副作用。成本分模型调用次数、工具调用次数、预计耗时和人工等待成本。可恢复分失败后能否重试、补偿、回滚或保留草稿。完成分方案是否满足用户目标和业务验收标准。评分器的输出应当进入状态机而不是只停在模型回复里。系统需要知道为什么保留 A 路径、剪掉 B 路径、升级 C 路径。这样后续审计、调参和复盘才有证据。六、综合图复杂任务 Agent 的四层执行架构把前面的层次合在一起复杂任务 Agent 可以拆成四层规划层先生成依赖图搜索层比较候选路径状态机层承接执行与恢复治理层控制风险与审计。点击图片可放大查看高清架构。复杂任务 Agent 的四层执行架构用户目标与业务约束目标、权限、时间、成本、风险等级规划层Plan-and-Solve 生成子任务依赖图节点、输入、输出、依赖、验收标准搜索层ToT / GoT 生成、评分、剪枝候选路径保留最值得继续执行的方案状态机层ready / running / blockedreviewing / done / failedcheckpoint 支撑断点续跑治理层审批、预算、权限、补偿trace_id、审计日志、人工接管控制自动化边界工具层与业务系统搜索、数据库、CRM、ERP、工单、审批流这张图里的关键关系是规划层和搜索层都不直接落到业务系统。它们先把决策压成可执行状态再由状态机决定何时调工具、何时暂停、何时恢复、何时让人接管。治理层也不是最后补上的日志。它从一开始就参与预算、权限和风险控制。低风险节点可以自动跑高风险节点必须等待审批搜索分支超过预算就要剪掉。这样复杂 Agent 才能既聪明又可控。七、落地顺序从一条可恢复链路开始团队不需要一开始就实现完整 GoT。更稳的路径是先选一条真实业务链路把 ReAct 执行过程改造成可恢复的状态机再把任务前置拆成依赖图最后只在关键决策节点引入候选搜索。这条顺序能避免过早复杂化。很多任务只需要 Plan-and-Solve不需要 ToT。很多 ToT 只需要在两个关键分支上做候选比较不需要展开几十个节点。工程系统追求的是可验证的完成率不是把所有论文结构都搬进运行时。给技术负责人的 4 个落地动作选一条 5 步以上、经常失败、需要人工确认的业务链路例如退款审批、故障补偿、合同审查或数据分析报告。把现有 ReAct 日志拆成节点状态明确每一步的输入、输出、依赖和失败处理。在计划层加入依赖图生成让系统先判断哪些节点可以并行哪些节点必须等待。只在高价值决策点引入 ToT 或 GoT用评分器控制候选数量、成本和风险。复杂 Agent 的上限不只取决于模型会不会推理更取决于系统能不能把推理组织成计划、搜索和可恢复的执行状态。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

再谈Agent核心模式:ReAct、Plan-and-Solve 与 ToT

很多 Agent 原型跑得很顺,一进真实业务长链路就开始失控。它能查一个订单,也能调用一个工具,但一旦任务变成“先判断客户等级,再查合同,再核对 SLA,再生成补偿方案,再发起审批”,简单…...

二叉树中序线索化及中序线索二叉树找前驱/后继

#include <stdio.h> #include <stdlib.h>// 线索二叉树结点 typedef struct ThreadNode {int data;struct ThreadNode *lchild, *rchild;int ltag, rtag; } ThreadNode, *ThreadTree;ThreadNode *pre NULL;void create(ThreadTree &T) {T (ThreadNode *)mal…...

Agent文件系统检索核心:Grep和Glob工具

在Harness的定义中&#xff0c;Agent的文件系统是核心之一 在文件系统的帮助下&#xff0c;Agent表现出来的搜索能力是非常出色的&#xff0c;用户和开发者不定义搜索路径&#xff0c;只提供输入驱动&#xff0c;而具体的搜索路径是由Agent根据每一次的工具调用动态决定的 Ag…...

DeepSeek‑V4 预览版:1M 上下文暴打西方闭源模型阵营,GPT/Gemini 这次真有压力了

DeepSeek‑V4 预览版发布4 月 24 日&#xff0c;DeepSeek 正式发布新一代系列模型 DeepSeek‑V4 预览版&#xff0c;并同步开放 API 与开源权重&#xff0c;主打「1M 超长上下文 顶级推理 高性价比」。 这一代模型分为 DeepSeek‑V4‑Pro 和 DeepSeek‑V4‑Flash 两个版本&am…...

microeco:突破微生物功能预测精度瓶颈的R包创新方案

microeco&#xff1a;突破微生物功能预测精度瓶颈的R包创新方案 【免费下载链接】microeco An R package for downstream data analysis of microbiome omics data 项目地址: https://gitcode.com/gh_mirrors/mi/microeco microeco是一个专为微生物组学数据下游分析设计…...

机器学习交叉验证优化7大实战技巧

1. 交叉验证优化入门&#xff1a;从基础到进阶交叉验证是机器学习模型评估的黄金标准&#xff0c;但很多从业者只停留在基础用法。我在实际项目中发现&#xff0c;合理优化交叉验证流程可以使模型评估效率提升3-5倍&#xff0c;同时获得更可靠的性能指标。让我们从一个基础示例…...

Delphi7 编译EXE报毒 Virus/Induc.a?一招根治(附详细步骤)

在使用 Delphi7 开发程序时&#xff0c;很多开发者会遇到一个棘手问题&#xff1a;编译生成的 EXE 运行时&#xff0c;被火绒、360 等杀毒软件拦截&#xff0c;提示“发现风险 Virus/Induc.a”&#xff0c;即便将 EXE 加入白名单&#xff0c;仍会拦截程序修改注册表、内存加载等…...

微信聊天记录导出终极指南:无需越狱,永久保存珍贵对话

微信聊天记录导出终极指南&#xff1a;无需越狱&#xff0c;永久保存珍贵对话 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 还在为微信聊天记录丢失而烦恼吗&#xff1…...

光储并网Simulink仿真模型与直流微电网研究

光储并网simulink仿真模型&#xff0c;直流微电网。 光伏系统采用扰动观察法是实现mppt控制&#xff0c;储能可由单独蓄电池构成&#xff0c;也可由蓄电池和超级电容构成的混合储能系统&#xff0c;并采用lpf进行功率分配。 并网采用pq控制实现稳定功率输送。 附对应wen献光伏和…...

创采德航--采购数智化转型专家

大连创采德航信息技术有限公司是一家专注采购数智化领域的专业咨询服务机构。公司始终秉承 "诚信、严谨、专业、创新" 的服务理念&#xff0c;深度聚焦企业采购管理升级与数字化变革&#xff0c;致力于为客户提供体系化、专业化、智能化的采购数智化转型整体解决方案…...

Unity WebCamTexture实战:从权限申请到区域截图,一个完整AR证件照项目的避坑实录

Unity WebCamTexture实战&#xff1a;从权限申请到区域截图&#xff0c;一个完整AR证件照项目的避坑实录 在移动应用开发中&#xff0c;AR证件照功能正成为教育、社交和电商平台的热门需求。想象一下&#xff0c;用户只需打开手机摄像头&#xff0c;就能自动生成符合标准的证件…...

XGBoost多线程优化实战与性能调优指南

1. 理解XGBoost多线程优化的核心价值XGBoost作为机器学习竞赛中的常胜将军&#xff0c;其性能优势很大程度上来自于对多核CPU的充分利用。但在实际项目中&#xff0c;很多开发者只是简单设置n_jobs-1就认为万事大吉&#xff0c;这往往无法发挥硬件的最佳性能。我在金融风控领域…...

机器学习重采样方法:原理、实现与工程实践

1. 理解重采样方法的核心价值在机器学习实践中&#xff0c;我们经常面临一个根本性矛盾&#xff1a;模型需要在训练数据上学习规律&#xff0c;但最终要在未见过的数据上表现良好。这就引出了机器学习中最关键的挑战之一——如何准确评估模型在真实场景中的表现&#xff1f;重采…...

从PLC抓包到JSON Schema自动生成:VSCode 2026工业协议插件的7大不可替代能力(附Gitee私有仓迁移教程)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;从PLC抓包到JSON Schema自动生成&#xff1a;VSCode 2026工业协议插件的演进逻辑 工业现场协议解析长期面临“协议黑盒化”困境&#xff1a;Modbus TCP、S7Comm、EtherNet/IP 等流量虽可捕获&#xff0…...

【Docker AI Toolkit 2026避坑红宝书】:20年DevOps专家亲测的7大高频崩溃场景与秒级修复清单

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Docker AI Toolkit 2026核心架构演进与避坑认知升级 Docker AI Toolkit 2026 不再是简单封装 PyTorch/TensorFlow 的 CLI 工具集&#xff0c;而是基于 eBPF 驱动的容器原生 AI 编排层&#xff0c;深度融…...

如何3分钟解锁QQ音乐加密文件:终极免费工具使用指南

如何3分钟解锁QQ音乐加密文件&#xff1a;终极免费工具使用指南 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac&#xff0c;qmc0,qmc3转mp3, mflac,mflac0等转flac)&#xff0c;仅支持macOS&#xff0c;可自动识别到QQ音乐下载目录&#xff0c;默认转换…...

【深度架构解析】高并发 AI 视频管理平台:兼容 GB28181/RTSP,支持 X86/ARM+GPU/NPU 异构部署与源码交付

前言&#xff1a;安防碎片化时代的破局之道 在传统的安防集成项目中&#xff0c;架构师常面临三大痛点&#xff1a;硬件生态割裂&#xff08;不同芯片厂商驱动不通&#xff09;、协议黑盒化&#xff08;GB28181接入复杂&#xff09;、以及开发周期冗长。为了实现一个稳健的 AI…...

重磅!万众瞩目的DeepSeek V4十分钟前开源了,曾经的王又回来了!

就在刚刚&#xff0c;DeepSeek 正式发布了全新一代大模型 DeepSeek-V4 预览版&#xff0c;并宣布同步开源。这一次&#xff0c;DeepSeek喊出了一个响亮的口号&#xff1a;迈入百万上下文普惠时代。从今天起&#xff0c;100万的超长上下文将成为DeepSeek所有官方服务的标配。两个…...

轻松解锁网易云NCM音乐文件:ncmdumpGUI图形化转换工具完全攻略

轻松解锁网易云NCM音乐文件&#xff1a;ncmdumpGUI图形化转换工具完全攻略 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换&#xff0c;Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐的NCM格式文件无法…...

HEIF Utility:让Windows用户轻松驾驭苹果HEIF图片格式的实用指南

HEIF Utility&#xff1a;让Windows用户轻松驾驭苹果HEIF图片格式的实用指南 【免费下载链接】HEIF-Utility HEIF Utility - View/Convert Apple HEIF images on Windows. 项目地址: https://gitcode.com/gh_mirrors/he/HEIF-Utility 在苹果设备全面采用HEIF格式的时代&…...

5个关键策略让MacBook电池寿命延长2倍:AlDente深度使用指南

5个关键策略让MacBook电池寿命延长2倍&#xff1a;AlDente深度使用指南 【免费下载链接】AlDente-Battery_Care_and_Monitoring Menubar Tool to set Charge Limits and Prolong Battery Lifespan 项目地址: https://gitcode.com/gh_mirrors/al/AlDente-Battery_Care_and_Mon…...

如何快速为PDF添加智能书签?pdfdir终极指南

如何快速为PDF添加智能书签&#xff1f;pdfdir终极指南 【免费下载链接】pdfdir PDF导航&#xff08;大纲/目录&#xff09;添加工具 项目地址: https://gitcode.com/gh_mirrors/pd/pdfdir 你是否曾经在阅读长篇PDF文档时迷失在密密麻麻的页面中&#xff1f;是否因为找不…...

技术突破:Pentaho Kettle如何实现异构数据源高效集成与ETL处理

技术突破&#xff1a;Pentaho Kettle如何实现异构数据源高效集成与ETL处理 【免费下载链接】pentaho-kettle Pentaho Data Integration ( ETL ) a.k.a Kettle 项目地址: https://gitcode.com/gh_mirrors/pe/pentaho-kettle Pentaho Kettle&#xff08;现称Pentaho Data …...

安卓虚拟摄像头完整指南:3分钟实现摄像头画面替换

安卓虚拟摄像头完整指南&#xff1a;3分钟实现摄像头画面替换 【免费下载链接】com.example.vcam 虚拟摄像头 virtual camera 项目地址: https://gitcode.com/gh_mirrors/co/com.example.vcam 想在安卓设备上使用自定义视频或图片作为摄像头输入吗&#xff1f;android_v…...

VSCode 2026高内存场景生存指南,专治多根工作区+Docker Compose+Jupyter Notebook三重压测:实测7类组合负载下的最优GC阈值配置表

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;VSCode 2026内存治理的底层逻辑与演进变革 VSCode 2026 版本重构了其核心内存生命周期管理模型&#xff0c;将传统的“进程级内存池后台垃圾回收”范式&#xff0c;升级为基于 WebAssembly 边界隔离与实…...

PyAutoGUI 第3章 弹窗交互功能教程(GUI交互,核心3)

PyAutoGUI 弹窗交互功能教程&#xff08;GUI交互&#xff0c;核心3&#xff09; 说明&#xff1a;本教程为 PyAutoGUI 核心操作专项教程&#xff0c;聚焦 GUI 弹窗交互功能&#xff0c;涵盖各类弹窗的使用方法、参数配置、返回值判断&#xff0c;结合实操代码和场景示例&#x…...

如何用Seraphine实现终极英雄联盟BP自动化:告别手忙脚乱的对局准备

如何用Seraphine实现终极英雄联盟BP自动化&#xff1a;告别手忙脚乱的对局准备 【免费下载链接】Seraphine 英雄联盟战绩查询工具 项目地址: https://gitcode.com/gh_mirrors/se/Seraphine 你是否曾在排位赛中因为错过对局接受而懊恼不已&#xff1f;是否在BP阶段面对眼…...

别再搞混了!C++里printf和setprecision控制小数位,到底有啥区别?

别再搞混了&#xff01;C里printf和setprecision控制小数位&#xff0c;到底有啥区别&#xff1f; 在财务系统开发中&#xff0c;一个工程师因为混淆了printf和setprecision的精度控制逻辑&#xff0c;导致公司报表出现数百万的误差。这个真实案例揭示了C数值格式化中一个关键但…...

Vue3项目实战:5分钟给你的后台管理系统加上动态实时水印(支持暗黑模式)

Vue3动态水印实战&#xff1a;5分钟打造智能防泄密系统 在数字化办公时代&#xff0c;敏感数据保护已成为企业管理系统的刚需。某金融科技公司的前端团队曾发现&#xff0c;内部系统截图在外泄后无法追踪来源&#xff0c;导致三个月内发生两次商业信息泄露事件。而引入动态水印…...

机器学习评估指标全解析:从原理到Python实战

1. 机器学习算法评估指标全景解读在数据科学项目中&#xff0c;选择合适的评估指标往往比模型选择本身更重要。想象一下这样的场景&#xff1a;你花费两周时间优化了一个准确率达到95%的欺诈检测模型&#xff0c;上线后却发现漏掉了80%的真实欺诈案例——这就是错误选择评估指标…...