当前位置: 首页 > article >正文

大模型---ReAct

目录1.ReAct的定义2.ReAct的基本形式3.ReAct与普通CoT、Toolformer的区别4.ReAct与Plan-and-Solve5.ReAct的局限深入学习会继续补充~1.ReAct的定义ReAct是Agent编排(Orchestration)的逻辑循环(Reasoning Loop)中最经典的实现方式编排是Agent的“神经系统”定义了思考、行动、观察和记忆的工作流程与逻辑循环。它决定了整个系统如何运作主要包括指令(Instructions)通过自然语言为Agent设定清晰的目标、行为准则和分步行动计划。把复杂任务拆解成清晰的步骤能极大提升Agent的可靠性。逻辑循环(Reasoning Loop)Agent的核心运行模式即“思考-行动-观察”(ReAct)循环。它不断重复这个过程分析当前状态(思考)--调用一个工具(行动)--获取结果(观察)直到任务完成。流程模式(Workflow Patterns)对于复杂任务可以设计不同的协作模式。单Agent模式一个Agent配备多个工具独立处理一个完整的任务流程。管理者模式(Manager Pattern)一个中央管理者Agent负责接收任务分解后分发给不同的专家Agent执行。去中心化模式(Decentralized Pattern)Agent之间通过“移交”机制将任务传递给最合适的下一个Agent。原论文把 ReAct 定义为一种让语言模型交错生成 reasoning traces推理轨迹和 task-specific actions任务动作的范式。作者指出推理可以帮助模型制定、跟踪和更新计划也能处理异常行动则让模型接入外部知识源或环境获取额外信息。原论文如下[2210.03629] ReAct: Synergizing Reasoning and Acting in Language ModelsReAct 要解决的是早期两条路线各自的短板。一条路线是Chain-of-ThoughtCoT式推理模型会一步步“想”但如果它推理过程中依赖的事实不对就可能一路错下去出现幻觉或错误传播。另一条路线是“只做动作”的方法模型可以检索、点击、执行操作但缺少明确的中间推理容易盲目试错也不够可解释。ReAct的出发点就是把这两者结合起来。原论文明确写到ReAct相比只推理或只行动的方法能在语言推理和决策任务上带来协同收益并提升可解释性与可信度。为什么两者结合会更强① 首先推理帮助行动如果模型先明确“我现在缺什么信息”“下一步该查什么”动作会更有方向感不容易乱用工具。论文直接说reasoning traces帮助模型诱导、跟踪和更新action plans并处理异常② 行动帮助推理如果模型只在自己脑子里推理它可能会用错事实而动作让它能去查Wikipedia、知识库、网页或其他环境从外部拿回信息减少“闭门造车”。ReAct经常被当作workflow 走向 agent 的桥梁因为它已经不只是静态流程而是一个带反馈循环的决策机制。2.ReAct的基本形式ReAct的典型运行模式可以写成一个循环Thought--Action--Observation--Thought--Action--Observation ... -- Final Answer。其中Thought模型先写出当前的想法、计划、判断。Action模型根据当前判断调用某个动作或工具。Observation环境返回结果模型把这个结果当成新信息。然后模型再继续下一轮Thought。这和普通单轮问答最大的不同是模型不是一上来直接给最终答案而是会先想、再查、再根据查到的结果继续想。也就是说ReAct让模型用自然语言推理来引导行动同时用行动结果来修正后续推理。3.ReAct与普通CoT、Toolformer的区别CoT的重点是让模型把思考过程写出来ReAct的重点是让模型把思考过程和外部动作交替写出来。如果任务只需要纯内部推理比如一道数学题ReAct 不一定总比 CoT 更合适但如果任务需要外部信息、环境交互、网页搜索、工具使用ReAct 往往更自然。ReAct与Toolformer都和工具使用有关但关注点不一样。Toolformer更像是在研究模型如何学会“什么时候调用工具、调什么工具、传什么参数”。ReAct更像是在研究模型如何在多步任务里把“思考--行动--观察”组织成一个循环。也就是说Toolformer偏“工具调用能力学习”ReAct偏“任务执行过程组织”。4.ReAct与Plan-and-SolvePlan-and-Solve是先计划再求解。它由两个部分组成先devise a plan把整个任务分成更小的 subtasks再按照这个plan去完成这些subtasks。它提出的直接动机是改进zero-shot CoT里的missing-step errors也就是“中间步骤漏掉了”。它本质上还是在模型内部完成推理不依赖外部工具或环境。而ReAct是推理和行动交替。其能让LLM交错生成推理轨迹和任务特定动作。这里的动作不是单纯思考下一步而是可以去访问外部知识源或环境如Wikipedia API、交互环境等。模型利用观察结果继续推理。两者都可以出现在 Agent 的编排中但 ReAct 更像 Agent 的执行循环Plan-and-Solve 更像 Agent 的规划策略。例如先用 Plan-and-Solve 做高层任务分解再用 ReAct 在每个子任务里边推理边行动。比如一个 agent 要完成“帮我写一份行业调研报告”。上层先用 Plan-and-Solve先把任务拆成1.收集行业背景2.找主要竞争对手3.比较产品特点4.总结趋势5.写报告。下层每一步用ReAct比如在“找竞争对手”这一步agent采用ReActThought先查头部公司名单--Action调用搜索工具--Observation拿到搜索结果--Thought发现还缺国内厂商--Action继续搜索。也就是PS 负责“先规划”ReAct 负责“边执行边调整”。但是对于很多中小型agent任务只靠ReAct就够了调用工具想一下下一步看结果再继续这时没有显式“总计划”而是边做边决定。两者关系可以理解为递进关系Plan-and-Solve先把“多步推理”组织好ReAct在“多步推理”的基础上再把“外部动作/观察”纳入循环。两者适用场景不同PS更适合数学推理、逻辑推理、多步问答这类主要靠内部规划和分步求解的任务。ReAct更适合知识密集型问答、事实核查、交互式决策、工具使用这类需要外部检索或环境反馈的任务。5.ReAct的局限1它更依赖工具和环境质量。如果搜索工具不准、检索结果差、环境反馈混乱ReAct也会沿着错误观察继续推理。2步骤变多成本和延迟会上升。因为它不是一次完成而是多轮循环想一下、做一下、再想一下。LangChain文档也强调agent会在循环中持续运行直到停止条件满足。3显式thought轨迹在产品环境里不一定总该暴露。研究里这样做有助于解释和调试但生产系统中常常需要把内部推理和用户可见输出分开。

相关文章:

大模型---ReAct

目录 1.ReAct的定义 2.ReAct的基本形式 3.ReAct与普通CoT、Toolformer的区别 4.ReAct与Plan-and-Solve 5.ReAct的局限 深入学习会继续补充~ 1.ReAct的定义 ReAct是Agent编排(Orchestration)的逻辑循环(Reasoning Loop)中最经典的实现方式,编排是Agent的“神经…...

5分钟快速解密网易云音乐NCM格式:免费工具实现音乐自由播放

5分钟快速解密网易云音乐NCM格式:免费工具实现音乐自由播放 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM格式文件无法在其他播放器使用而烦恼吗?ncmdump是一款高效便捷的NCM格式…...

海康工业相机C语言SDK实战:从零配置一个完整的视觉采集程序(附完整代码)

海康工业相机C语言SDK实战:从零构建视觉采集系统的完整指南 工业视觉系统在现代制造业中扮演着越来越重要的角色,而相机作为系统的"眼睛",其稳定高效的采集能力直接影响整个系统的性能。本文将带您从零开始,使用海康工业…...

从STM32 HAL库转战逐飞TC264:GPIO配置的5个关键差异与实战避坑指南

从STM32 HAL库转战逐飞TC264:GPIO配置的5个关键差异与实战避坑指南 如果你已经习惯了STM32 HAL库的开发方式,初次接触逐飞TC264的GPIO配置可能会感到既熟悉又陌生。就像从自动挡汽车换到手动挡,虽然都是驾驶,但操作逻辑和细节处理…...

香橙派5Plus内核编译踩坑实录:从WSL报错到板端编译卡死的完整解决方案

香橙派5Plus内核编译实战:破解WSL兼容性与板端卡死难题 当我在工作室里第一次点亮香橙派5Plus时,这块搭载Rockchip RK3588的开发板立刻吸引了我的注意。作为一款性能强劲的ARM开发平台,它本应成为嵌入式开发的理想选择——直到我尝试为其编译…...

PMD大数据处理终极指南:如何高效分析TB级代码仓库的10个技巧

PMD大数据处理终极指南:如何高效分析TB级代码仓库的10个技巧 【免费下载链接】pmd An extensible multilanguage static code analyzer. 项目地址: https://gitcode.com/gh_mirrors/pm/pmd PMD作为一款可扩展的多语言静态代码分析工具,能够帮助开…...

终极指南:PointNet激活函数性能大比拼 ReLU、LeakyReLU与Swish深度测试

终极指南:PointNet激活函数性能大比拼 ReLU、LeakyReLU与Swish深度测试 【免费下载链接】pointnet PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation 项目地址: https://gitcode.com/gh_mirrors/po/pointnet PointNet作为3D点…...

3个致命对比:C# vs Python,谁才是真“香“?

🔥关注墨瑾轩,带你探索编程的奥秘!🚀 🔥超萌技术攻略,轻松晋级编程高手🚀 🔥技术宝库已备好,就等你来挖掘🚀 🔥订阅墨瑾轩,智趣学习不…...

5个关键步骤:C# OpenCVSharp如何让背景分割快10倍?

🔥关注墨瑾轩,带你探索编程的奥秘!🚀 🔥超萌技术攻略,轻松晋级编程高手🚀 🔥技术宝库已备好,就等你来挖掘🚀 🔥订阅墨瑾轩,智趣学习不…...

如何快速构建电商库存扫描系统:QuaggaJS条形码识别终极指南

如何快速构建电商库存扫描系统:QuaggaJS条形码识别终极指南 【免费下载链接】quaggaJS An advanced barcode-scanner written in JavaScript 项目地址: https://gitcode.com/gh_mirrors/qu/quaggaJS 在电商运营中,高效的库存管理是提升效率和降低…...

终极指南:用Universal x86 Tuning Utility轻松解锁AMD/Intel处理器潜能

终极指南:用Universal x86 Tuning Utility轻松解锁AMD/Intel处理器潜能 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility …...

Apollo Client 终极指南:从零构建宝可梦图鉴应用的完整教程

Apollo Client 终极指南:从零构建宝可梦图鉴应用的完整教程 【免费下载链接】learnapollo 👩🏻‍🏫 Learn Apollo - A hands-on tutorial for Apollo GraphQL Client (created by Graphcool) 项目地址: https://gitcode.com/gh_…...

Ollama+Llama-3.2-3B实战:快速搭建本地写作助手,帮你写邮件、周报、文案

OllamaLlama-3.2-3B实战:快速搭建本地写作助手,帮你写邮件、周报、文案 1. 告别“憋稿子”,让AI成为你的专属写作秘书 你有没有过这样的经历?周五下午,对着空白的Word文档,绞尽脑汁想周报怎么写&#xff…...

10个jQuery Form性能监控技巧:如何精确测量表单提交性能指标

10个jQuery Form性能监控技巧:如何精确测量表单提交性能指标 【免费下载链接】form jQuery Form Plugin 项目地址: https://gitcode.com/gh_mirrors/fo/form jQuery Form Plugin(src/jquery.form.js)是一款轻量级的表单处理工具&#…...

数据库运维工具

数据库运维工具:高效管理的智能助手 在数据驱动的时代,数据库作为企业核心信息的存储载体,其稳定性与性能直接影响业务运行。随着数据量激增和架构复杂化,传统人工运维已难以满足需求。数据库运维工具应运而生,通过自…...

GLM-4-9B-Chat-1M效果展示:100万token下跨章节逻辑推理能力实测

GLM-4-9B-Chat-1M效果展示:100万token下跨章节逻辑推理能力实测 1. 引言:当大模型遇上“超长待机” 想象一下,你手里有一本300页的小说,或者一个包含几十个文件的代码项目。你想让AI帮你分析整个故事的情节脉络,或者…...

Teldrive代码架构解析:从cmd到pkg的完整项目结构

Teldrive代码架构解析:从cmd到pkg的完整项目结构 【免费下载链接】teldrive Teldrive 项目地址: https://gitcode.com/gh_mirrors/te/teldrive Teldrive是一个功能强大的文件管理系统,它允许用户通过直观的界面管理、预览和分享各种类型的文件。本…...

FlowLayout在实际项目中的应用:从标签云到动态表单的完整实现

FlowLayout在实际项目中的应用:从标签云到动态表单的完整实现 【免费下载链接】FlowLayout A flow layout for Android with auto-spacing. 项目地址: https://gitcode.com/gh_mirrors/flo/FlowLayout FlowLayout是一款专为Android平台设计的流式布局库&…...

AppScale GTS核心组件深度解析:从数据存储到任务队列

AppScale GTS核心组件深度解析:从数据存储到任务队列 【免费下载链接】gts AppScale is an easy-to-manage serverless platform for building and running scalable web and mobile applications on any infrastructure. 项目地址: https://gitcode.com/gh_mirro…...

3步解决NVIDIA Profile Inspector配置难题:从诊断到修复的完整指南

3步解决NVIDIA Profile Inspector配置难题:从诊断到修复的完整指南 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector NVIDIA Profile Inspector作为一款强大的显卡配置管理工具,允…...

故障排查手册从现象到根因分析

故障排查手册:从现象到根因的精准拆解 在复杂的系统运维或设备维护中,故障往往像一场突如其来的风暴,而一本结构化的故障排查手册就是工程师的“导航仪”。它通过从表面现象逐层深入,最终锁定根因,不仅能快速恢复系统…...

Qwen3智能字幕系统入门必看:从零部署清音刻墨镜像详细步骤

Qwen3智能字幕系统入门必看:从零部署清音刻墨镜像详细步骤 你是不是也遇到过这样的烦恼?自己录制的视频,或者下载的课程,想配上精准的字幕,结果发现自动生成的字幕时间轴对不上,要么字幕提前了&#xff0c…...

Qwen3.5-9B提示词工程入门:编写高效指令激发模型潜能

Qwen3.5-9B提示词工程入门:编写高效指令激发模型潜能 1. 为什么需要学习提示词工程 如果你用过AI大模型,可能遇到过这样的情况:明明是个很强大的模型,但给你的回答却总是不尽如人意。问题很可能出在你给它的"指令"上—…...

django-activity-stream扩展开发:自定义活动处理器与信号机制

django-activity-stream扩展开发:自定义活动处理器与信号机制 【免费下载链接】django-activity-stream Generate generic activity streams from the actions on your site. Users can follow any actors activities for personalized streams. 项目地址: https:…...

OFA视觉推理系统效果展示:复杂场景下的图文关系判断案例

OFA视觉推理系统效果展示:复杂场景下的图文关系判断案例 1. 引言:当计算机学会"看图说话" 在数字内容爆炸式增长的今天,我们每天都会遇到大量图文信息。从社交媒体到电商平台,从新闻网站到在线教育,图片和…...

中文NLP预处理提效:BERT文本分割模型在语音转写下游任务中的应用

中文NLP预处理提效:BERT文本分割模型在语音转写下游任务中的应用 1. 项目背景与价值 在日常工作和学习中,我们经常会遇到这样的场景:会议录音转成文字后,变成了一大段没有分段的长文本,阅读起来非常吃力。或者在线课…...

模仿学习在AIAgent中为何92%落地失败?——7个被主流论文忽略的时序对齐陷阱,立即自查

第一章:模仿学习在AIAgent架构中的定位与本质困境 2026奇点智能技术大会(https://ml-summit.org) 模仿学习(Imitation Learning, IL)并非AIAgent的可选模块,而是其行为建模的底层锚点——当强化学习因稀疏奖励难以收敛、规划模型…...

总泵缸体加工(论文+DWG图纸+proe三维图+工艺卡片)

总泵缸体作为液压系统的核心部件,其加工质量直接影响整车制动性能与安全性。该零件需同时满足高强度、高密封性及复杂型面精度要求,加工过程中需兼顾材料特性与工艺可行性。从毛坯预处理到最终检验,每个环节均需严格遵循行业标准,…...

易语言彩信接口怎么调用?E语言Post实现多媒体数据批量下发

很多易语言开发者在对接富媒体下发能力时,常会遇到签名校验失败、多媒体编码异常、批量号码提交报错等问题。本文将完整拆解易语言彩信接口的调用逻辑,通过Post请求实现80KB以内图文音视频富媒体彩信的批量下发,给出可直接运行的源码与参数校…...

5分钟掌握B站视频智能转文字:从链接到可编辑文本的完整方案

5分钟掌握B站视频智能转文字:从链接到可编辑文本的完整方案 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 在当今信息爆炸的时代,Bil…...