当前位置: 首页 > news >正文

让AI像人一样思考和使用工具,reAct机制详解

reAct机制详解

  • reAct是什么
  • reAct的关键要素
  • reAct的思维过程
  • reAct的代码实现
    • 查看效果
    • 引入依赖,定义模型
    • 定义相关工具
    • 集合工具创建代理
    • 启动测试
    • 完整代码
  • 思考

reAct是什么

reAct的核心思想是将**推理(Reasoning)和行动(Acting)**结合起来。具体来说,reAct 赋予了 AI agent 思维链Cot的思考能力和使用工具Action的能力。对于一个复杂问题agent首先利用其强大的推理能力对环境进行分析和理解,识别出需要解决的问题和可用的资源。然后,它根据推理结果制定行动计划,并选择合适的工具或方法来执行计划。最后达到像人一样分析和使用工具最后解决问题的效果。

reAct的关键要素

  • 强大的推理能力
  • 丰富的工具库
  • 灵活的行动策略
  • 持续的反馈机制

reAct的思维过程

举个例子比如问模型一个问题羊村旁边的地方是什么?它的面积加上它的面积是多少?,正常模型肯定回答不了,可是添加上reAct他就被赋予了思考和使用工具获取信息的能力,分析过程大概如下:

分析1:我需要先搜索羊村旁边的地方,然后获取该地方的面积,最后计算面积的总和,首先我得先知道羊村旁边是什么地方行动1:调用地点搜索工具分析2:获取到的地点是狼堡,我需要搜索狼堡的面积,然后计算面积的总和行动2:调用地点面积搜索工具分析3:获取到面积是500,我已经获取了狼堡的面积,现在需要计算面积的总和。行动3:调用数字相加计算工具(如果数字比较复杂可能需要专业的数学工具计算)分析4:计算出结果是1000行动4:进行最终答复:羊村旁边的地方是狼堡,狼堡的面积是500,加上它的面积是1000。

就这样模型通过reAct完成了一整个复杂问题的拆解和逐步解决。我们可以通过代码来实现并查看一整个过程

reAct的代码实现

我们用langChain搭配deepseek模型去实现reAct的一整个过程,我们先来看看最终结果。

查看效果

在这里插入图片描述
可以看到利用reAct机制LLM确实跟我们预想的一样完成了推理和使用工具。下面我们来看实现。

引入依赖,定义模型

注意key换成deepseek的key

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAImodel = ChatOpenAI(model='deepseek-chat', openai_api_key='xxx',openai_api_base='https://api.deepseek.com',max_tokens=4096
)

定义相关工具

# 定义数字计算工具
class SumNumber_tool(BaseTool):name = "数字相加计算工具"description = "当你被要求计算数字相加时,使用此工具"def _run(self, a, b):return a + b  # 直接返回两个数的和# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):name= "地点搜索工具"description = "当你需要搜索地点时,使用这个工具"def _run(self, query):return "狼堡"# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):name= "地点面积搜索工具"description = "当你需要搜索地点面积时,使用这个工具"def _run(self, query):return 500

集合工具创建代理

# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(llm=model,tools=tools,prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(memory_key='chat_history',return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)

启动测试

# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"}) 

完整代码

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI# 模型
model = ChatOpenAI(model='deepseek-chat', openai_api_key='xxx',openai_api_base='https://api.deepseek.com',max_tokens=4096
)# 定义数字计算工具
class SumNumber_tool(BaseTool):name = "数字相加计算工具"description = "当你被要求计算数字相加时,使用此工具"def _run(self, a, b):return a + b  # 直接返回两个数的和# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):name= "地点搜索工具"description = "当你需要搜索地点时,使用这个工具"def _run(self, query):return "狼堡"# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):name= "地点面积搜索工具"description = "当你需要搜索地点面积时,使用这个工具"def _run(self, query):return 500# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(llm=model,tools=tools,prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(memory_key='chat_history',return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"})

思考

reAct是AI agent很重要的一个概念,它赋予了agent能够逐步推理和执行任务的能力。通过将复杂的任务分解为一系列简单的步骤,并通过使用工具去解决问题,让agent能够更高效地解决问题,最终让agent像人一样能够处理复杂问题。

相关文章:

让AI像人一样思考和使用工具,reAct机制详解

reAct机制详解 reAct是什么reAct的关键要素reAct的思维过程reAct的代码实现查看效果引入依赖,定义模型定义相关工具集合工具创建代理启动测试完整代码 思考 reAct是什么 reAct的核心思想是将**推理(Reasoning)和行动(Acting&…...

Linux系列-常见的指令(二)

🌈个人主页: 羽晨同学 💫个人格言:“成为自己未来的主人~” mv 剪切文件,目录 重命名 比如说,我们在最开始创建一个新的文件hello.txt 然后我们将这个文件改一个名字,改成world.txt 所以,…...

Leecode刷题之路第17天之电话号码的字母组合

题目出处 17-电话号码的字母组合-题目出处 题目描述 个人解法 思路: todo 代码示例:(Java) todo复杂度分析 todo 官方解法 17-电话号码的字母组合-官方解法 方法1:回溯 思路: 代码示例:&a…...

2023牛客暑期多校训练营3(题解)

今天下午也是小小的做了一下,OI,也是感觉手感火热啊,之前无意间看到的那个哥德巴赫定理今天就用到了,我以为根本用不到的,当时也只是感兴趣看了一眼,还是比较激动啊 话不多说,直接开始看题 Wo…...

Magnum IO

NVIDIA Magnum IO 文章目录 前言加速数据中心 IO 性能,随时随地助力 AINVIDIA Magnum IO 优化堆栈1. 存储 IO2. 网络 IO3. 网内计算4. IO 管理跨数据中心应用加速 IO1. 数据分析Magnum IO 库和数据分析工具2. 高性能计算Magnum IO 库和 HPC 应用3. 深度学习Magnum IO 库和深度…...

Flink job的提交流程

在Flink中,作业(Job)的提交流程是一个复杂的过程,涉及多个组件和模块,包括作业的编译、优化、序列化、任务分发、任务调度、资源分配等。Flink通过分布式架构来管理作业的生命周期,确保作业在不同节点上以高…...

git操作pull的时候出现冲突怎么解决

问: PS C:\Users\fury_123\Desktop\consumptionforecast> git branch * dev main PS C:\Users\fury_123\Desktop\consumptionforecast> git add . PS C:\Users\fury_123\Desktop\consumptionforecast> git commit -m 修改部分样式 [dev 74693e0] 修改部分样…...

Sentinel 1.80(CVE-2021-44139)

Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性 Report a Sentinel Security Vulnerability …...

黑马程序员C++提高编程学习笔记

黑马程序员C提高编程 提高阶段主要针对泛型编程和STL技术 文章目录 黑马程序员C提高编程一、模板1.1 函数模板1.1.1 函数模板基础知识 案例一: 数组排序1.2.1 普通函数与函数模板1.2.2 函数模板的局限性 1.2 类模板1.2.1 类模板的基础知识1.2.2 类模板与函数模板1.…...

力扣第1题:两数之和(图解版)

Golang版本 func twoSum(nums []int, target int) []int {m : make(map[int]int)for i : range nums {if _, ok : m[target - nums[i]]; ok {return []int{i, m[target - nums[i]]}} m[nums[i]] i}return nil }...

aws(学习笔记第三课) AWS CloudFormation

aws(学习笔记第三课) 使用AWS CloudFormation 学习内容: AWS CloudFormation的模板解析使用AWS CloudFormation启动ec2 server 1. AWS CloudFormation 的模版解析 CloudFormation模板结构 CloudFormation是AWS的配置管理工具,属于Infrastructure as Co…...

浅学React和JSX

往期推荐 一文搞懂大数据流式计算引擎Flink【万字详解,史上最全】-CSDN博客 数仓架构:离线数仓、实时数仓Lambda和Kappa、湖仓一体数据湖-CSDN博客 一文入门大数据准流式计算引擎Spark【万字详解,全网最新】_大数据 spark-CSDN博客 浅谈维度建…...

React 为什么 “虚拟 DOM 顶部有很多 provider“?

1、介绍React中的Context Provider 在 React 中,虚拟 DOM(Virtual DOM)是 React 用来高效更新 UI 的核心机制,它通过对比前后两次虚拟 DOM 树,确定哪些部分需要更新,以减少直接操作真实 DOM 的开销。而 “…...

忘记了 MySQL 8.0 的 root 密码,应该怎么办?

如果你忘记了 MySQL 8.0 的 root 密码,可以通过以下步骤来重置密码。请注意,这些步骤需要你有对 MySQL 服务器的物理或命令行访问权限。 步骤 1: 停止 MySQL 服务 首先,你需要停止正在运行的 MySQL 服务。你可以使用以下命令来停止 MySQL 服…...

Promise.reject()

Promise.reject() 静态方法返回一个已拒绝(rejected)的 Promise 对象,拒绝原因为给定的参数。 语法 Promise.reject(reason)参数 reason 该 Promise 对象被拒绝的原因。 返回值 返回一个已拒绝(rejected)的 Promi…...

大数据-163 Apache Kylin 全量增量Cube的构建 手动触发合并 JDBC 操作 Scala

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…...

云手机与传统手机的区别是什么?

随着科技的快速进步,云手机逐渐成为手机市场的热门选择。与传统的智能手机相比,云手机具有许多独特的功能和优势,尤其在多账号管理和高效操作方面备受关注。那么,云手机究竟与普通手机有哪些区别呢? 1. 更灵活的操作与…...

微知-Bluefield DPU命名规则各字段作用?BF2 BF3全系列命名大全

文章目录 背景字段命名C是bmc的意思NOT的N是是否加密S表示不加密但是secureboot enable倒数第四个都是E倒数第五个是速率 V和H是200GM表示E serials,H表示P serials(区别参考兄弟篇:[more](https://blog.csdn.net/essencelite/article/detail…...

Ubuntu 上使用 Nginx 实现反向代理并启用 HTTPS(详细教程)

拒绝使用宝塔,虽然宝塔很好用方便,但是他非常占用资源,所以我正在尝试转换我使用服务器的方式,通过命令来才做这些,下面是我的详细步骤。 在这篇教程中,我们将详细介绍如何在 Ubuntu 系统上使用 Nginx 搭建…...

2. 继承Mono的单例模式基类

前提 继承MonoBehaviour的脚本不能new继承MonoBehaviour的脚本一定得依附在GameObject上 实现挂载式的单例模式基类 挂载式 继承Mono的单例模式基类 /// <summary> /// 挂载式 继承Mono的单例模式基类 /// </summary> /// <typeparam name"T">&…...

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件&#xff1a; 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

最新SpringBoot+SpringCloud+Nacos微服务框架分享

文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的&#xff0c;根据Excel列的需求预估的工时直接打骨折&#xff0c;不要问我为什么&#xff0c;主要…...

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类&#xff1a;块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接&#xff1a;3403. 从盒子中找出字典序最大的字符串 I 代码如下&#xff1a; class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

.Net Framework 4/C# 关键字(非常用,持续更新...)

一、is 关键字 is 关键字用于检查对象是否于给定类型兼容,如果兼容将返回 true,如果不兼容则返回 false,在进行类型转换前,可以先使用 is 关键字判断对象是否与指定类型兼容,如果兼容才进行转换,这样的转换是安全的。 例如有:首先创建一个字符串对象,然后将字符串对象隐…...

深度学习习题2

1.如果增加神经网络的宽度&#xff0c;精确度会增加到一个特定阈值后&#xff0c;便开始降低。造成这一现象的可能原因是什么&#xff1f; A、即使增加卷积核的数量&#xff0c;只有少部分的核会被用作预测 B、当卷积核数量增加时&#xff0c;神经网络的预测能力会降低 C、当卷…...

在QWebEngineView上实现鼠标、触摸等事件捕获的解决方案

这个问题我看其他博主也写了&#xff0c;要么要会员、要么写的乱七八糟。这里我整理一下&#xff0c;把问题说清楚并且给出代码&#xff0c;拿去用就行&#xff0c;照着葫芦画瓢。 问题 在继承QWebEngineView后&#xff0c;重写mousePressEvent或event函数无法捕获鼠标按下事…...

Java毕业设计:WML信息查询与后端信息发布系统开发

JAVAWML信息查询与后端信息发布系统实现 一、系统概述 本系统基于Java和WML(无线标记语言)技术开发&#xff0c;实现了移动设备上的信息查询与后端信息发布功能。系统采用B/S架构&#xff0c;服务器端使用Java Servlet处理请求&#xff0c;数据库采用MySQL存储信息&#xff0…...

BLEU评分:机器翻译质量评估的黄金标准

BLEU评分&#xff1a;机器翻译质量评估的黄金标准 1. 引言 在自然语言处理(NLP)领域&#xff0c;衡量一个机器翻译模型的性能至关重要。BLEU (Bilingual Evaluation Understudy) 作为一种自动化评估指标&#xff0c;自2002年由IBM的Kishore Papineni等人提出以来&#xff0c;…...

前端中slice和splic的区别

1. slice slice 用于从数组中提取一部分元素&#xff0c;返回一个新的数组。 特点&#xff1a; 不修改原数组&#xff1a;slice 不会改变原数组&#xff0c;而是返回一个新的数组。提取数组的部分&#xff1a;slice 会根据指定的开始索引和结束索引提取数组的一部分。不包含…...