当前位置：首页 > news >正文

【智能体Agent】ReAct智能体的实现思路和关键技术

news 2026/2/10 10:44:20

基于ReAct（Reasoning + Acting）框架的自主智能体

import re
from typing import List, Tuplefrom langchain_community.chat_message_histories.in_memory import ChatMessageHistory
from langchain_core.language_models.chat_models import BaseChatModel
from langchain.output_parsers import PydanticOutputParser, OutputFixingParser
from langchain.schema.output_parser import StrOutputParser
from langchain.tools.base import BaseTool
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import  render_text_description
from pydantic import ValidationError
from langchain_core.prompts import HumanMessagePromptTemplatefrom Agent.Action import Action
from Utils.CallbackHandlers import *class ReActAgent:"""AutoGPT：基于Langchain实现"""@staticmethoddef __format_thought_observation(thought: str, action: Action, observation: str) -> str:# 将全部JSON代码块替换为空ret = re.sub(r'```json(.*?)```', '', thought, flags=re.DOTALL)ret += "\n" + str(action) + "\n返回结果:\n" + observationreturn ret@staticmethoddef __extract_json_action(text: str) -> str | None:# 匹配最后出现的JSON代码块json_pattern = re.compile(r'```json(.*?)```', re.DOTALL)matches = json_pattern.findall(text)if matches:last_json_str = matches[-1]return last_json_strreturn Nonedef __init__(self,llm: BaseChatModel,tools: List[BaseTool],work_dir: str,main_prompt_file: str,max_thought_steps: Optional[int] = 10,):self.llm = llmself.tools = toolsself.work_dir = work_dirself.max_thought_steps = max_thought_steps# OutputFixingParser： 如果输出格式不正确，尝试修复self.output_parser = PydanticOutputParser(pydantic_object=Action)self.robust_parser = OutputFixingParser.from_llm(parser=self.output_parser,llm=llm)self.main_prompt_file = main_prompt_fileself.__init_prompt_templates()self.__init_chains()self.verbose_handler = ColoredPrintHandler(color=THOUGHT_COLOR)def __init_prompt_templates(self):with open(self.main_prompt_file, 'r', encoding='utf-8') as f:self.prompt = ChatPromptTemplate.from_messages([MessagesPlaceholder(variable_name="chat_history"),HumanMessagePromptTemplate.from_template(f.read()),]).partial(work_dir=self.work_dir,tools=render_text_description(self.tools),tool_names=','.join([tool.name for tool in self.tools]),format_instructions=self.output_parser.get_format_instructions(),)def __init_chains(self):# 主流程的chainself.main_chain = (self.prompt | self.llm | StrOutputParser())def __find_tool(self, tool_name: str) -> Optional[BaseTool]:for tool in self.tools:if tool.name == tool_name:return toolreturn Nonedef __step(self,task,short_term_memory,chat_history,verbose=False) -> Tuple[Action, str]:"""执行一步思考"""inputs = {"input": task,"agent_scratchpad": "\n".join(short_term_memory),"chat_history": chat_history.messages,}config = {"callbacks": [self.verbose_handler]if verbose else []}response = ""for s in self.main_chain.stream(inputs, config=config):response += s# 提取JSON代码块json_action = self.__extract_json_action(response)# 带容错的解析action = self.robust_parser.parse(json_action if json_action else response)return action, responsedef __exec_action(self, action: Action) -> str:# 查找工具tool = self.__find_tool(action.name)if tool is None:observation = (f"Error: 找不到工具或指令 '{action.name}'. "f"请从提供的工具/指令列表中选择，请确保按对顶格式输出。")else:try:# 执行工具observation = tool.run(action.args)except ValidationError as e:# 工具的入参异常observation = (f"Validation Error in args: {str(e)}, args: {action.args}")except Exception as e:# 工具执行异常observation = f"Error: {str(e)}, {type(e).__name__}, args: {action.args}"return observationdef run(self,task: str,chat_history: ChatMessageHistory,verbose=False) -> str:"""运行智能体:param task: 用户任务:param chat_history: 对话上下文（长时记忆）:param verbose: 是否显示详细信息"""# 初始化短时记忆: 记录推理过程short_term_memory = []# 思考步数thought_step_count = 0reply = ""# 开始逐步思考while thought_step_count < self.max_thought_steps:if verbose:self.verbose_handler.on_thought_start(thought_step_count)# 执行一步思考action, response = self.__step(task=task,short_term_memory=short_term_memory,chat_history=chat_history,verbose=verbose,)# 如果是结束指令，执行最后一步if action.name == "FINISH":reply = self.__exec_action(action)break# 执行动作observation = self.__exec_action(action)if verbose:self.verbose_handler.on_tool_end(observation)# 更新短时记忆short_term_memory.append(self.__format_thought_observation(response, action, observation))thought_step_count += 1if thought_step_count >= self.max_thought_steps:# 如果思考步数达到上限，返回错误信息reply = "抱歉，我没能完成您的任务。"# 更新长时记忆chat_history.add_user_message(task)chat_history.add_ai_message(reply)return reply

结合LangChain框架和工具调用能力来逐步解决用户任务。

以下是代码的逐模块解析：

1. 核心结构

class ReActAgent:"""AutoGPT：基于Langchain实现"""

核心类：实现了ReAct范式（推理+行动循环）的自主智能体
核心能力：
- 多步思考推理
- 工具调用
- 长短期记忆管理
- 异常处理与自我修正

2. 关键静态方法

@staticmethod
def __format_thought_observation(...):  # 格式化思考记录
@staticmethod
def __extract_json_action(...):         # 提取JSON动作

功能：
- __format_thought_observation：将思考过程、动作执行和观察结果格式化为可读文本，存入短期记忆
- __extract_json_action：用正则表达式提取模型输出中的最后一个JSON代码块（确保获取最新动作）

3. 初始化模块

def __init__(...):# 核心组件初始化self.llm = llm                    # 大语言模型self.tools = tools                # 可用工具列表self.work_dir = work_dir          # 工作目录self.max_thought_steps = ...      # 最大思考步数# 输出解析系统self.output_parser = PydanticOutputParser(pydantic_object=Action)self.robust_parser = OutputFixingParser.from_llm(...)# 提示工程self.__init_prompt_templates()self.__init_chains()

关键技术点：
- 双解析器机制：OutputFixingParser可在格式错误时自动修复输出
- Pydantic验证：确保动作符合预定义结构（Action模型）
- 工具描述渲染：render_text_description将工具转化为自然语言描述

4. 提示工程系统

def __init_prompt_templates(self):with open(self.main_prompt_file) as f:self.prompt = ChatPromptTemplate.from_messages(...).partial(tools=...,             # 工具描述tool_names=...,        # 工具名称列表format_instructions=..., # 格式说明)

核心要素：
- 动态加载提示模板文件
- 包含：
  - 聊天历史占位符
  - 工具使用说明
  - 输出格式要求
  - 工作目录上下文

5. 执行流程控制

def run(...):while thought_step_count < self.max_thought_steps:# 单步思考action, response = self.__step(...)if action.name == "FINISH":break# 执行动作observation = self.__exec_action(action)# 记忆更新short_term_memory.append(...)

ReAct循环：
1. Reasoning：生成思考与动作（__step）
2. Acting：执行工具调用（__exec_action）
3. Observing：记录执行结果
4. Loop：直到达到终止条件

6. 关键技术实现

6.1 单步推理 (`__step`)

def __step(...):inputs = {"input": task,"agent_scratchpad": "\n".join(short_term_memory),"chat_history": chat_history.messages,}# 流式处理LLM输出for s in self.main_chain.stream(inputs):response += s# 提取并解析动作json_action = self.__extract_json_action(response)action = self.robust_parser.parse(...)

输入组成：
- 任务目标
- 短期记忆（推理过程）
- 长期记忆（聊天历史）
流式处理：实时显示思考过程
错误恢复：自动修复格式错误的JSON输出

6.2 动作执行 (`__exec_action`)

def __exec_action(...):tool = self.__find_tool(action.name)try:observation = tool.run(action.args)except ValidationError:# 参数验证错误处理except Exception:# 通用错误处理

异常处理机制：
- 工具不存在
- 参数验证错误
- 运行时异常
观察反馈：将错误信息转化为自然语言，供后续推理使用

7. 记忆系统

# 短期记忆
short_term_memory = []  # 存储格式化的推理过程# 长期记忆
chat_history = ChatMessageHistory()  # 保存完整对话记录

记忆类型：
- 短期记忆：当前任务的推理过程（最多保留max_thought_steps步）
- 长期记忆：跨会话的完整对话历史

8. 关键设计亮点

自愈式输出解析：
- 通过OutputFixingParser实现格式错误自动修复
- 示例场景：当LLM返回非法JSON时，自动尝试修正

渐进式推理：

# 示例输出格式
Thought: 我需要先查找用户信息
Action: {"name": "user_search", "args": {"id": 123}}
Observation: 用户张三，年龄30岁

通过agent_scratchpad维护推理上下文

工具发现机制：
- 动态渲染工具描述到提示词
- 支持工具的热插拔
多级异常处理：
- 工具不存在
- 参数验证错误
- 执行时异常
- 最大步数限制

9. 使用示例

# 初始化组件
llm = ChatOpenAI()
tools = [SearchTool(), Calculator()]
agent = ReActAgent(llm, tools, work_dir="/data")# 执行任务
result = agent.run(task="计算马云当前年龄的平方根",chat_history=ChatMessageHistory(),verbose=True
)

典型执行流程：
1. 搜索"马云年龄" → 得到60岁
2. 调用计算器计算√60 → 约7.746
3. 返回最终结果

10. 可扩展性建议

增强记忆管理：
- 添加向量数据库长期记忆
- 实现记忆压缩/摘要
改进推理质量：
- 添加自我验证步骤
- 实现多路径推理
性能优化：
- 添加异步执行
- 实现工具并行调用

该实现展示了如何结合LangChain框架构建复杂的自主智能体系统，平衡了LLM的创造力和结构化工具调用的可靠性。

【智能体Agent】ReAct智能体的实现思路和关键技术

基于ReAct（Reasoning Acting）框架的自主智能体 import re from typing import List, Tuplefrom langchain_community.chat_message_histories.in_memory import ChatMessageHistory from langchain_core.language_models.chat_models import BaseChatM…...

编程日记 2025/3/6 6:14:44

Java进阶：Zookeeper相关笔记

概要总结： ●Zookeeper是一个开源的分布式协调服务，需要下载并部署在服务器上(使用cmd启动，windows与linux都可用)。 ●zookeeper一般用来实现诸如数据订阅/发布、负载均衡、命名服务、集群管理、分布式锁和分布式队列等功能。 ●有多台服…...

编程日记 2025/3/6 6:12:42

QT-绘画事件

实现颜色的随时调整，追加橡皮擦功能 widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QColor> #include <QPoint> #include <QVector> #include <QMouseEvent> #include <QPainter> #include <Q…...

编程日记 2025/3/6 6:11:41

鸿蒙NEXT开发-端云一体化开发

注意：博主有个鸿蒙专栏，里面从上到下有关于鸿蒙next的教学文档，大家感兴趣可以学习下如果大家觉得博主文章写的好的话，可以点下关注，博主会一直更新鸿蒙next相关知识目录端云一体化开发基本概念传统架构端云一…...

编程日记 2025/3/6 6:10:39

大模型——股票分析AI工具开发教程

大模型——股票分析AI工具开发教程在本教程中，我们将利用Google Gemini 2.0 Flash模型创建一个简单但有效的股票分析器。你是否曾被大量的股票市场数据所淹没？希望有一个私人助理来筛选噪音并为您提供清晰、可操作的见解？好吧，你可以自己构建一个，而且由于 Python 的强…...

编程日记 2025/3/6 6:09:38

nexus 实现https 私有镜像搭建

1、安装nexus 1.1 安装JDK17 rpm -ivh jdk-17.0.13_linux-x64_bin.rpm 1.2 下载安装包解压到指定目录 tar zxvf nexus-3.77.2-02-unix.tar.gz -C /usr/local 2、运行nexus 默认8081端口 cd /usr/local/nexus-3.77.2-02 && bin/nexus start 3、配置nexus私有docker 镜…...

编程日记 2025/3/6 6:08:37

颈椎X光数据集（cervical spine X-ray dataset）

颈椎X光数据集（cervical spine X-ray dataset） 一.颈椎X光（1248张原始图像，无处理，jpg格式） 二．颈椎X光（1000张原始图像，无处理，jpg格式） 此数据…...

编程日记 2025/3/6 6:05:34

(动态规划完全背包零钱兑换)leetcode 322

本题为完全背包与01背包的区别是物品可以任意取而01背包只能取一次这就导致了状态转移方程的不同 1.当放不下:的时候转移方程是一样的取0到i-1 物品，背包容量为j的最优值 else 2.放得下:就是取 0到i-1 物品,背包容量为j的最优值和 “0到i的[j-w[i]]v…...

编程日记 2025/3/6 6:03:30

【AI大模型】DeepSeek + Kimi 高效制作PPT实战详解

目录一、前言二、传统 PPT 制作问题 2.1 传统方式制作 PPT 2.2 AI 大模型辅助制作 PPT 2.3 适用场景对比分析 2.4 最佳实践与推荐三、DeepSeek Kimi 高效制作PPT操作实践 3.1 Kimi 简介 3.2 DeepSeek Kimi 制作PPT优势 3.2.1 DeepSeek 优势 3.2.2 Kimi 制作PPT优…...

编程日记 2025/3/6 6:02:29

Pytorch的一小步，昇腾芯片的一大步

Pytorch的一小步，昇腾芯片的一大步相信在AI圈的人多多少少都看到了最近的信息：PyTorch最新2.1版本宣布支持华为昇腾芯片！ 1、发生了什么事儿？ 在2023年10月4日PyTorch 2.1版本的发布博客上，PyTorch介绍的beta版本…...

编程日记 2025/3/6 6:01:28

rabbitmq-amqp事务消息+消费失败重试机制+prefetch限流

1. 安装和配置 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-amqp</artifactId> </dependency><dependency> <groupId>com.fasterxml.jackson.core</groupId> <arti…...

编程日记 2025/3/6 5:57:24

【HarmonyOS Next】自定义Tabs

背景项目中Tabs的使用可以说是特别的频繁，但是官方提供的Tabs使用起来，存在tab选项卡切换动画滞后的问题。原始动画无法满足产品的UI需求，因此，这篇文章将实现下面页面滑动，tab选项卡实时滑动的动画效果。实现逻…...

编程日记 2025/3/6 5:56:23

Sass 模块化革命：深入解析 @use 语法，打造高效 CSS 架构

文章目录前言use 用法1. 模块化与命名空间2. use 中 as 语法的使用3. as * 语法的使用4. 私有成员的访问5. use 中with默认值6. use 导入问题总结下一篇预告： 前言在上一篇中，我们深入探讨了 Sass 中 import 语法的局限性，正是因为这些问题…...

编程日记 2025/3/6 5:53:19

【渗透测试】反弹 Shell 技术详解（一）

反弹 Shell 技术详解一、前置知识反弹 shell（Reverse Shell）是一种技术，攻击者利用它可以在远程主机上获得一个交互式的命令行接口。通常情况下，反弹 shell 会将标准输入（stdin）、标准输出（…...

编程日记 2025/3/6 5:52:17

python：pymunk + pygame 模拟六边形中小球弹跳运动

向 chat.deepseek.com 提问：编写 python 程序，用 pymunk, 有一个正六边形，围绕中心点缓慢旋转，六边形内有一个小球，六边形的6条边作为墙壁，小球受重力和摩擦力、弹力影响，模拟小球弹跳运动&…...

编程日记 2025/3/6 5:49:14

Windows 图形显示驱动开发-WDDM 3.2-本机 GPU 围栏对象(二)

GPU 和 CPU 之间的同步 CPU 必须执行 MonitoredValue 的更新，并读取 CurrentValue，以确保不会丢失正在进行的信号中断通知。当向系统中添加新的 CPU 等待程序时，或者如果现有的 CPU 等待程序失效时，OS 必须修改受监视的值。OS …...

编程日记 2025/3/6 5:48:13

23种设计模式之《模板方法模式（Template Method）》在c#中的应用及理解

程序设计中的主要设计模式通常分为三大类，共23种： 1. 创建型模式（Creational Patterns） 单例模式（Singleton）：确保一个类只有一个实例，并提供全局访问点。工厂方法模式&#xff0…...

编程日记 2025/3/6 5:45:08

DEV-C++ 为什么不能调试？（正确解决方案）

为了备战pat考试，专门下载了DEV C，然后懵圈的发现，怎么无法调试(╯□）╯︵ ┻━┻ 然后整了半天，终于在网上找到相应的解决方案！！！-> Dev C 5.11 调试初始设置 <- 一共四步…...

编程日记 2025/3/6 5:44:07

【C++设计模式】第五篇：原型模式（Prototype）

注意：复现代码时，确保 VS2022 使用 C17/20 标准以支持现代特性。克隆对象的效率革命 1. 模式定义与用途核心思想原型模式：通过复制现有对象（原型）来创建新对象，而非通过new构造。关键用…...

编程日记 2025/3/6 5:42:05

深入 Vue.js 组件开发：从基础到实践

深入 Vue.js 组件开发：从基础到实践 Vue.js 作为一款卓越的前端框架，其组件化开发模式为构建高效、可维护的用户界面提供了强大支持。在这篇博客中，我们将深入探讨 Vue.js 组件开发的各个方面，从基础概念到高级技巧，助…...

编程日记 2025/3/6 5:41:03

Python｜GIF 解析与构建（5）：手搓截屏和帧率控制

目录 Python｜GIF 解析与构建（5）：手搓截屏和帧率控制一、引言二、技术实现：手搓截屏模块 2.1 核心原理 2.2 代码解析：ScreenshotData类 2.2.1 截图函数：capture_screen 三、技术实现&…...

编程新知 2025/11/14 3:06:30

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括：采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中，设置任务排序规则尤其重要，因为它让看板视觉上直观地体…...

编程新知 2026/1/23 12:42:28

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一）

CSI-2 协议详细解析 (一） 1. CSI-2层定义（CSI-2 Layer Definitions） 分层结构 ：CSI-2协议分为6层： 物理层（PHY Layer） ： 定义电气特性、时钟机制和传输介质（导线&#…...

编程新知 2026/1/23 12:18:20

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

编程新知 2025/9/23 20:06:08

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码，专为学校招生场景量身打造，功能实用且操作便捷。从技术架构来看，ThinkPHP提供稳定可靠的后台服务，FastAdmin加速开发流程，UniApp则保障小程序在多端有良好的兼…...

编程新知 2026/1/26 14:19:52

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

厌倦手动写WordPress文章？AI自动生成，效率提升10倍！ 支持多语言、自动配图、定时发布，让内容创作更轻松！ AI内容生成 → 不想每天写文章？AI一键生成高质量内容！多语言支持 → 跨境电商必备&am…...

编程新知 2026/1/30 17:24:20

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类：块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

编程新知 2025/11/11 6:28:42

ardupilot 开发环境eclipse 中import 缺少C++

目录文章目录目录摘要1.修复过程摘要本节主要解决ardupilot 开发环境eclipse 中import 缺少C++，无法导入ardupilot代码，会引起查看不方便的问题。如下图所示 1.修复过程 0.安装ubuntu 软件中自带的eclipse 1.打开eclipse—Help—install new software 2.在 Work with中…...

编程新知 2026/1/31 5:06:34