当前位置: 首页 > article >正文

一文讲透 ReAct:推理与行动交替的智能体范式

一文讲透 ReAct:推理与行动交替的智能体范式一、引言钩子你有没有过这样的经历:问GPT-4「2024年欧洲杯冠军是谁?」,它只会抱歉地说「我的知识截止到2023年10月,无法提供实时信息」;你让它算「华为Mate60 Pro发布时间比iPhone15早多少天?」,它要么给出错误的日期,要么告诉你「我无法准确计算,请手动查询」。但你用带插件的ChatGPT或者AutoGPT的时候,它却能自动打开搜索工具查两个产品的发布时间,再调用日期计算器算出差值,准确给出结果。你有没有好奇过,这种「会自己思考、自己用工具」的能力,底层到底是什么逻辑?定义问题/阐述背景大语言模型(LLM)的爆发式发展让我们看到了通用人工智能的可能性,但它天生存在三个无法回避的短板:第一是幻觉问题,经常编造不存在的事实和数据;第二是知识 cutoff,训练数据截止之后的信息完全不知道;第三是无法与环境交互,不能调用工具、操作系统、感知现实世界。过去几年研究者们提出了很多方案来补这些短板:思维链(CoT)提升了模型的推理能力,但还是依赖内部知识,错了也没法修正;Toolformer让模型学会调用工具,但缺少显式的推理过程,很容易做出无效的工具调用。而2022年提出的ReAct(Reasoning + Action)范式,第一次把「推理思考」和「行动执行」两个能力有机结合起来,让LLM像人一样:先思考要做什么,再动手执行,拿到结果后再调整思考方向,循环往复直到完成任务。现在我们熟悉的ChatGPT插件、AutoGPT、Claude 3工具调用、多模态具身智能体,底层核心逻辑都是ReAct。可以说,ReAct是当前大模型从「生成式工具」走向「自主智能体」的核心范式,是所有想做AI Agent开发的开发者必须吃透的技术。亮明观点/文章目标读完这篇文章,你将:彻底搞懂ReAct的核心原理、组成结构、与其他范式的差异;从零动手实现一个支持搜索、计算、网页抓取的ReAct智能体,能独立解决需要多步骤工具调用的复杂问题;掌握ReAct的常见坑、优化方案、最佳实践,能把ReAct落地到自己的业务场景中;了解ReAct的行业发展趋势和未来演进方向。本文会从原理到实战,从入门到进阶,把ReAct的所有核心知识点讲透,哪怕你只有基础的Python能力和LLM常识,也能轻松跟上。二、基础知识/背景铺垫核心概念定义在正式讲解ReAct之前,我们先明确几个必须掌握的基础概念:大模型涌现能力:当LLM参数规模超过一定阈值(一般认为是10B以上),会突然拥有很多小模型没有的能力,比如复杂推理、工具调用、指令遵循,ReAct正是基于这些涌现能力才能实现。思维链(Chain of Thought, CoT):2020年提出的技术,通过在提示词中引导模型生成中间推理步骤,而不是直接输出答案,大幅提升了模型在数学题、逻辑题等复杂任务上的准确率。但CoT的所有推理都基于模型的内部知识,一旦知识错误或者缺失,推理结果就会出错。工具调用:让LLM按照固定格式输出要调用的工具名称和参数,由外部系统执行工具后把结果返回给LLM,从而突破LLM的能力边界。比如调用搜索工具获取实时信息,调用计算器解决数学问题,调用API操作业务系统。AI智能体(Agent):指能自主感知环境、做出决策、执行行动的智能系统,基于LLM的智能体一般包含四个核心模块:规划(思考)、记忆、行动、工具,ReAct就是当前最主流的智能体规划范式。相关范式对比为了更清晰地看到ReAct的优势,我们把它和其他主流的LLM范式做一个对比:范式核心逻辑优点缺点适用场景标准LLM生成直接根据输入和内部知识输出答案速度快、成本低幻觉率高、无实时知识、无法交互环境简单常识问答、创作类任务思维链(CoT)引导模型生成中间推理步骤,再输出答案复杂推理能力强、逻辑可解释仍依赖内部知识、无法修正错误推理数学题、逻辑推理题等知识覆盖内的复杂任务Toolformer微调模型学会在需要时调用固定工具工具调用自动化微调成本高、工具扩展难、无显式推理固定工具集的简单调用场景ReAct交替生成推理步骤和行动,根据观测修正推理幻觉率低、支持实时知识、可交互环境、逻辑可追溯多轮调用成本高、速度慢、依赖提示词设计多步骤复杂任务、需要外部工具/知识的任务、交互类任务ReAct核心实体关系ReAct系统的核心实体和交互关系可以用下面的ER图表示:驱动包含包含包含读写调用交互读取校验LLMREACT_CORETHOUGHT_MODULEACTION_MODULEOBSERVATION_MODULEMEMORYTOOL_SETENVIRONMENTSTOP_CONDITION从图中可以看到,ReAct的核心是由LLM驱动的循环结构:推理模块生成思考,决定要做什么行动;行动模块调用工具和环境交互;观测模块把工具返回的结果整理后送回给推理模块,开启下一轮循环,直到满足停止条件,输出最终结果。行业发展时间线ReAct的发展不是一蹴而就的,是过去几年LLM技术逐步演进的结果,我们整理了关键的时间节点:时间事件核心贡

相关文章:

一文讲透 ReAct:推理与行动交替的智能体范式

一文讲透 ReAct:推理与行动交替的智能体范式 一、引言 钩子 你有没有过这样的经历:问GPT-4「2024年欧洲杯冠军是谁?」,它只会抱歉地说「我的知识截止到2023年10月,无法提供实时信息」;你让它算「华为Mate60 Pro发布时间比iPhone15早多少天?」,它要么给出错误的日期,…...

ThunderAI:用大语言模型插件打造智能邮件工作流

1. 项目概述:当AI助手遇见邮件客户端 如果你和我一样,每天要在Thunderbird里处理几十甚至上百封邮件,那你肯定也经历过那种“邮件疲劳”——写回复时词穷、面对长篇大论需要快速提炼要点、或者想给邮件分个类却懒得手动打标签。传统的邮件客…...

OpenAI Cookbook中文版:AI应用开发实战指南与工程化实践

1. 项目概述:一份面向中文开发者的AI应用开发“菜谱”最近在GitHub上看到一个挺有意思的项目,叫yunwei37/openai-cookbook-zh-cn。简单来说,这就是OpenAI官方那个大名鼎鼎的openai-cookbook仓库的中文翻译版。但如果你觉得它仅仅是个翻译&…...

KMS_VL_ALL_AIO:基于微软官方协议的系统激活工具技术解析

KMS_VL_ALL_AIO:基于微软官方协议的系统激活工具技术解析 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO KMS_VL_ALL_AIO是一款基于微软KMS(密钥管理服务)协议…...

Visual Studio AI助手深度集成:提升.NET开发效率的实战指南

1. 项目概述:当AI助手住进你的IDE 如果你是一名.NET开发者,每天大部分时间都在Visual Studio里度过,那你一定经历过这样的时刻:盯着一段复杂的业务逻辑,思考如何重构;或者为一个方法编写单元测试&#xff…...

认知神经科学研究报告【20260045】

文章目录ForeSight 5.87.5 自动设计8位CPU架构MiniCPU-8 架构自动涌现 — 测试报告结果ForeSight 5.87.5 自动设计8位CPU架构 MiniCPU-8 架构自动涌现 — 测试报告 测试目标:验证系统能否从零开始,自主发现并实现一个能正确执行斐波那契数列计算的8位C…...

Python自动化构建个人抖音技能库:合规爬虫与内容管理实践

1. 项目概述:从零到一构建个人抖音自动化技能库 最近在折腾一个挺有意思的小项目,我给它起了个名字叫“my-copaw-skill”。这名字听着有点怪,其实“copaw”是我家猫的名字,整个项目说白了,就是把我日常刷抖音、研究抖音…...

基于MCP协议构建AI Agent链上数据查询与操作工具实践

1. 项目概述:一个连接加密世界与AI的“翻译官”如果你最近在捣鼓AI Agent,特别是想让它帮你分析链上数据、查询钱包余额,甚至执行一些基础的区块链操作,那你可能已经发现了一个痛点:让AI直接理解并操作区块链&#xff…...

灵魂面甲修改器 2026最新版42项功能

下载地址:https://pan.quark.cn/s/81c8f13901b3 毒盘 支持最新版本,风灵月影42项功能拉满,支持最新版本,Steam/EPIC/学习版全适配! 【5月9日的最新版本不会闪退!全网最新版本!】 ✅ 非软件丨无…...

Conforme配置管理范式:类型安全与约定优先的实践指南

1. 项目概述:Conforme,一个被低估的配置管理范式在软件开发和系统运维的日常里,我们总在和“配置”打交道。数据库连接字符串、API密钥、功能开关、环境变量……这些看似零散的信息,却像乐谱上的音符,共同决定了应用如…...

【AI原生版本控制终极指南】:2026奇点大会Git for AI官方认证实践白皮书首次解禁

更多请点击: https://intelliparadigm.com 第一章:AI原生版本控制:2026奇点智能技术大会Git for AI最佳实践 在2026奇点智能技术大会上,Git for AI正式成为AI工程化基础设施的核心组件。它不再仅追踪文本变更,而是原生…...

AI技能自进化系统:异步复盘与残差学习架构实践

1. 项目概述:一个让AI助手学会自我进化的“技能大脑”如果你也玩过各种AI助手,比如Claude、GPTs或者国内的一些大模型应用,你肯定遇到过这样的场景:你教了它一个处理Excel表格的“技能”,比如“把A列数据乘以1.1然后填…...

OpenMCP:一站式MCP开发调试套件,从调试到部署的完整解决方案

1. 项目概述:OpenMCP,一个为MCP开发者打造的“瑞士军刀”如果你正在或打算开发基于Model Context Protocol(MCP)的AI应用,那你一定遇到过这样的困境:好不容易写好了MCP Server,却不知道如何高效…...

告别YAML诅咒:用LLM自动生成可验证CD流水线(附奇点大会开源Schema v2.1)

更多请点击: https://intelliparadigm.com 第一章:AI原生持续交付:2026奇点智能技术大会部署流水线优化 在2026奇点智能技术大会上,AI原生持续交付(AI-Native CI/CD)成为核心实践范式——它不再将AI模型视…...

AI网关架构解析:统一管理多模型API,提升服务治理与性能

1. 项目概述:一个AI驱动的开源网关框架最近在开源社区里,我注意到一个名为hoazgazh/aigate的项目。这个名字乍一看有点神秘,但拆解一下,“aigate”直译就是“AI网关”。这立刻让我联想到当前技术领域的一个核心痛点:如…...

HCCS:整数优化的Transformer注意力Softmax替代方案

1. 整数优化的HCCS软最大替代方案概述在Transformer架构的多头注意力机制中,Softmax函数长期以来都是计算效率的瓶颈环节。传统Softmax需要进行指数运算和归一化操作,这在低精度整数推理场景下尤为昂贵。我们提出的HCCS(Head-Calibrated Clip…...

算法复杂度的实验估算与误差分布建模的技术7

引言算法复杂度分析的理论背景与实验估算的必要性误差来源的常见类型(测量误差、系统噪声、模型偏差等)实验方法在算法评估中的实际意义实验设计与数据采集实验环境配置(硬件、软件、数据集选择)关键性能指标定义(时间…...

终极Zotero插件管理指南:如何一键安装数百个学术研究工具

终极Zotero插件管理指南:如何一键安装数百个学术研究工具 【免费下载链接】zotero-addons Zotero Add-on Market | Zotero插件市场 | Browsing, installing, and reviewing plugins within Zotero 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-addons …...

Weaviate官方示例库全解析:从向量数据库入门到AI应用实战

1. 项目概述:一个向量数据库的“游乐场”如果你最近在折腾大语言模型应用,或者想给自己的数据加上一个智能的“记忆大脑”,那你大概率已经听说过向量数据库了。在众多选择中,Weaviate 以其开源、易用和强大的功能,成为…...

AI代理规则引擎:构建安全可控的智能体管控系统

1. 项目概述:当AI代理需要“交通规则”最近在折腾AI代理(Agent)的开发,发现一个挺有意思但又普遍头疼的问题:你给一个代理下达指令,比如“帮我分析一下这个季度的销售数据”,理论上它应该能调用…...

奶茶糖浆怎么选,才能让茶香更明显?

奶茶糖浆怎么选,才能让茶香更明显?很多奶茶店想让茶香更明显,第一反应是换更好的茶叶,或者把茶汤泡得更浓。这个方向没错,但很多人忽略了另一个关键:糖浆如果选错了,再好的茶香也会被压住。一杯…...

Python开发者必备:Awesome清单高效选型与实战指南

1. 项目概述:一份Python开发者的“藏宝图”如果你是一名Python开发者,无论是刚入门的新手,还是摸爬滚打多年的老手,我相信你都曾有过这样的时刻:面对一个具体的开发需求,比如想找一个好用的Web框架、一个高…...

星期天实训内容

文章目录 1、测试代码照片2、流水灯视频2.1 测试代码2.1 视频 3、独立按键视频(点亮4个灯)3.1 代码3.2 视频 4、独立按键视频(点亮8个灯)5、数码管显示“000000”或者“111111”6、数码管显示“123456”7、数码管显示“11.12.13”…...

kasetto:用SQL思维操作本地CSV/JSON文件的命令行利器

1. 项目概述:一个被低估的本地化数据管理利器如果你经常需要在本地处理一些结构化的数据,比如从网页上抓取的信息、日常记账的记录、项目进度的跟踪,或者只是想把一些零散的笔记整理成表格,你可能会面临一个选择:是用E…...

作业4:独立按键+数码管实操

文章目录 1.测试代码视频2.流水灯视频3.独立按键视频(点亮四个灯)4.独立按键视频(思考题点亮8个灯)5.数码管显示“111111”6.数码管显示“123456”7.数码管显示“11.12.13”8.数码管显示“HH8800.” 1.测试代码视频 测试2.流水灯视频 流水灯#include <reg51.h> // 包含…...

基于copaw-code构建代码语义搜索系统:从原理到实践

1. 项目概述与核心价值最近在折腾一个挺有意思的开源项目&#xff0c;叫QSEEKING/copaw-code。这名字乍一看有点摸不着头脑&#xff0c;但如果你对代码搜索、智能辅助编程或者大模型应用开发感兴趣&#xff0c;那这个仓库绝对值得你花时间研究。简单来说&#xff0c;它是一套围…...

Cursor AI编程规则深度解析:从项目规范到团队协同的实战指南

1. 项目概述&#xff1a;从“Cursor Rules”看现代开发者的效率革命如果你是一名开发者&#xff0c;最近可能频繁听到一个词&#xff1a;Cursor。它不仅仅是一个编辑器&#xff0c;更是一个集成了AI能力的开发环境&#xff0c;正在悄然改变我们写代码的方式。而今天要聊的这个项…...

Dify工作流设计实战:从模式解析到生产部署的Awesome资源指南

1. 项目概述&#xff1a;一个为Dify工作流而生的“Awesome”资源集合如果你正在使用Dify.AI来构建你的AI应用&#xff0c;并且已经深入到工作流这个强大但略显复杂的模块&#xff0c;那么你很可能和我一样&#xff0c;经历过一段“摸着石头过河”的时期。Dify的官方文档固然详尽…...

开发AI应用时如何借助Taotoken进行多模型选型与测试

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 开发AI应用时如何借助Taotoken进行多模型选型与测试 在开发一个具体的AI应用功能时&#xff0c;选择合适的模型是影响最终效果与成…...

Agent才不会“赢家通吃“,证据来了……

Claude Code已经赢成这样了&#xff0c; 顺带又做了CMA&#xff0c; 定义下一代企业级Agent infra。 Claude Code『同款』infra&#xff0c; 谁不想用。 谁又不想卖可复用的工具呢。 这样下去&#xff0c; 做Agent infra须有爆款Agent证明自己吗&#xff1f; 肯定很多人反对&am…...