当前位置: 首页 > article >正文

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


大模型是Agent的「大脑」—— 用生活案例讲透通用推理能力

以下用“人类大脑 VS 大模型”类比 + 生活场景拆解,帮你直观理解大模型的「大脑」作用


一、核心逻辑:大模型 = Agent的智慧中枢

就像人类用大脑分析问题、指挥手脚干活,大模型(如GPT-4)在Agent中扮演 决策指挥官 的角色[2][5]。

人类场景Agent内部运作
你说“肚子饿”→ 大脑分析附近餐厅、选性价比最高的用户输入需求 → 大模型拆解任务、调用工具(地图+支付接口)
朋友借钱→大脑判断关系、利息、还款能力处理用户请求 → 大模型检查财务数据、风控规则[1][5]

二、大模型如何提供推理能力?分三步说清

1. 任务拆解:像解开一团毛线

例子:用户说:“我想带爸妈去三亚旅行,他们腿脚不好,预算1万。”

  • 大模型行动
    1️⃣ 拆分核心需求 → 交通(少步行)、住宿(无障碍)、景点(轻松游) [1]。
    2️⃣ 调用工具 → 查航班/筛选酒店/规划路线(见图)[6]。
用户需求
大模型拆解任务
工具1:查直飞航班
工具2:查找无障碍酒店
工具3:规划轮椅友好景点
生成最终方案

▲ 任务拆解与工具协作流程(引用第2章框架)

2. 逻辑推理:像侦探破案

原理:大模型内部通过「思维链(CoT)」技术,像写草稿纸一样一步步推导[2]。

例子:预算超标时的推理过程

机票5000元 + 酒店400元/天×5天 = 7000元
问题:剩余3000元不够景点门票+餐饮
重组方案:改订红眼航班(省2000元)+ 减少一晚住宿(省400元)→ 总预算控制成功 [1][6]。

3. 多工具协作:像乐队指挥

关键能力:协调不同工具(订票系统、计算器、数据库)共同完成任务[5][6]。

案例对比

无大模型有大模型
工具各干各的:机票工具只能查票,酒店工具只会订房大模型协调工具:先算总预算,再订票+订房+查天气,保证方案整体可行 [5][6]

三、生动案例:旅行管家Agent的一天

用户需求:周末北京出发去杭州,想看西湖,预算2500元

大模型「大脑」工作全流程

1️⃣ 感知需求:提取关键词:时间(周末)、地点(杭州)、限制条件(预算2500)[2][5]。
2️⃣ 调用知识库:查找西湖附近酒店价格、高铁耗时、景点开放时间[5]。
3️⃣ 生成方案

  • 北京→杭州高铁(4小时,二等座单程400元)
  • 酒店:西湖边汉庭2晚(总价800元)
  • 景点:西湖游船(80元/人)+ 灵隐寺(45元/人)
    4️⃣ 逻辑验证:总费用计算(400×2 + 800 + 80×2 + 45×2 = 2450元),不超预算[6]。
    5️⃣ 执行订票:调用12306接口订票,发送确认短信到用户手机[5][6]。
用户语音输入
大模型解析
知识库:查景点/交通
工具1:算总预算
工具2:订票系统
生成可行方案
执行器下单

▲ 流程涉及第2章规划能力与第5章工具调用


四、为什么必须用大模型?

1. 传统程序 VS 大模型Agent

传统程序大模型Agent
只能处理固定规则(如“价格>1000就报警”)能理解模糊指令(如“选性价比高的酒店”)[2]
遇到未预设的情况直接报错(如台风停航)自动调整方案(改订高铁/改日期)[6]

2. 核心价值总结

  • 通用性:同一套模型处理旅游、办公、医疗等不同任务[2][5]。
  • 应变力:用户临时加需求(“顺便预约接机”)能即时响应[6]。
  • 像人一样思考:考虑间接因素(如“带老人出行”选直达车次)[1][6]。

核心章节引用说明

  • 大模型角色:《大模型应用开发:动手做AI Agent 》第1章1.3节描述大模型作为Agent大脑的核心作用[2]。
  • 任务拆解方法:《大模型应用开发:动手做AI Agent 》第2章2.2节(思维链、ReAct框架)[1][5]。
  • 工具协作逻辑:《大模型应用开发:动手做AI Agent 》第2章2.4节(调用工具扩展能力)[5][6]。
  • 案例实现技术:《大模型应用开发:动手做AI Agent 》第6章(ReAct框架实战)[6]。

技术延伸阅读:《大模型应用开发:动手做AI Agent 》第3~6章通过订票助手、自动PPT制作等7个案例,展示不同场景的大模型推理实战(参考目录)[3]。


目录:总目录
上篇文章:大模型应用开发第二讲:核心能力:自主性、适应性、推理能力
下篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)


相关文章:

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3) 资料取自《大模型应用开发:动手做AI Agent 》。 查看总目录:学习大纲 关于DeepSeek本地部署指南可以看下我之前写的…...

创建型模式之Abstract Factory(抽象工厂)

创建型模式之Abstract Factory(抽象工厂) 摘要: 本文介绍了抽象工厂模式(Abstract Factory),它是一种创建型设计模式,提供了一种创建一系列相关对象的接口而无需指定具体类。文章通过手机工厂示…...

GitLab 18.0 正式发布,15.0 将不再受技术支持,须升级【一】

GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...

【DeepSeek论文精读】12. DeepSeek-Prover-V2: 通过强化学习实现子目标分解的形式化数学推理

欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】10. DeepSeek-Coder-V2: 突破闭源模型在代码智能领域的障碍 【DeepSeek论文精读】12. De…...

字符串day7

344 反转字符串 字符串理论上也是一个数组&#xff0c;因此只需要用双指针即可 class Solution { public:void reverseString(vector<char>& s) {for(int i0,js.size()-1;i<j;i,j--){swap(s[i],s[j]);}} };541 反转字符串 自己实现一个反转从start到end的字符串…...

vue2中,codemirror编辑器的使用

交互说明 在编辑器中输入{时&#xff0c;会自动弹出选项弹窗&#xff0c;然后可以选值插入。 代码 父组件 <variable-editorv-model"content":variables"variables"placeholder"请输入模板内容..."blur"handleBlur" />data…...

FastAPI与MongoDB分片集群:异步数据路由与聚合优化

title: FastAPI与MongoDB分片集群:异步数据路由与聚合优化 date: 2025/05/26 16:04:31 updated: 2025/05/26 16:04:31 author: cmdragon excerpt: FastAPI与MongoDB分片集群集成实战探讨了分片集群的核心概念、Motor驱动配置技巧、分片数据路由策略、聚合管道高级应用、分片…...

Perl单元测试实战指南:从Test::Class入门到精通的完整方案

阅读原文 前言:为什么Perl开发者需要重视单元测试? "这段代码昨天还能运行,今天就出问题了!"——这可能是每位Perl开发者都经历过的噩梦。在没有充分测试覆盖的情况下,即使是微小的改动也可能导致系统崩溃。单元测试正是解决这一痛点的最佳实践,它能帮助我们在…...

强大的免费工具,集合了30+功能

今天给大家分享一款免费的绿色办公软件&#xff0c;它涵盖了自动任务、系统工具、文件工具、PDF 工具、OCR 图文识别、文字处理、电子表格这七个模块&#xff0c;多达 30 余项实用功能&#xff0c;堪称办公利器。 作者开发这款软件的初衷是为了解决日常办公中常见的痛点问题&am…...

从0开始学习R语言--Day11--主成分分析

主成分分析&#xff08;PCA&#xff09; PCA是一种降维技术&#xff0c;它把一堆相关的变量&#xff08;比如身高、体重、年龄&#xff09;转换成少数几个不相关的新变量&#xff08;叫“主成分”&#xff09;&#xff0c;这些新变量能最大程度保留原始数据的信息。 核心理念 …...

通用前端框架项目静态部署到Hugging Face Space的实践指南

背景介绍 在轻量级展示前端项目的场景中,Hugging Face Space 提供了一个便捷的静态托管平台。需求是将无后端服务的Vite的 Vue项目部署到Hugging Face Space 上。其实无论是基于Vite的Vue/React项目,还是使用Webpack构建的工程化方案,都可以通过两种方式将其部署到Space:自…...

AI辅助写作 从提笔难到高效创作的智能升级

你是否经历过面对空白文档头脑空白的绝望&#xff1f;是否为整理实验数据通宵达旦&#xff1f;在这个信息爆炸的时代&#xff0c;一种新型写作方式正悄悄改变知识工作者的创作模式—AI辅助写作。这种技术既不像科幻作品里的自动生成机器人&#xff0c;也非简单的文字模板&#…...

十一、Samba文件共享服务

目录 1、Samba介绍1.1、Samba概述1.2、Samba服务器的主要组成部分1.3、Samba的工作原理2、Samab服务器的安装与配置2.1、安装samba2.2、Samba主配置文件2.2.1、全局设置段[global]2.2.2、用户目录段[homes]2.2.3、配置文件检查工具3、示例3.1、需要用户验证的共享3.2、用户映射…...

医疗影像检测系统设计与实现

以下是一个基于YOLO系列模型的医疗影像检测系统实现及对比分析的详细技术文档。由于目前官方YOLOv11尚未发布,本文将基于YOLOv8架构设计改进型YOLOv11,并与YOLOv8、YOLOv5进行对比实验。全文包含完整代码实现及分析,字数超过6000字。 # 注意:本文代码需要Python 3.8+、PyT…...

11.13 LangGraph记忆机制解析:构建生产级AI Agent的关键技术

LangGraph 持久化与记忆:构建具备记忆能力的生产级 AI Agent 关键词:LangGraph 持久化, 多回合记忆, 单回合记忆, 检查点系统, 状态管理 1. 记忆机制的核心价值 在对话式 AI Agent 的开发中,记忆管理直接决定了用户体验的连贯性和智能性。LangGraph 通过 多回合记忆(Mult…...

C++23中std::span和std::basic_string_view可平凡复制提案解析

文章目录 一、引言二、相关概念解释2.1 平凡复制&#xff08;Trivially Copyable&#xff09;2.2 std::span2.3 std::basic_string_view 三、std::span和std::basic_string_view的应用场景3.1 std::span的应用场景3.2 std::basic_string_view的应用场景 四、P2251R1提案对std::…...

[yolov11改进系列]基于yolov11引入感受野注意力卷积RFAConv的python源码+训练源码

[RFAConv介绍] 1、RFAConv 在传统卷积操作中&#xff0c;每个感受野都使用相同的卷积核参数&#xff0c;无法区分不同位置的信息差异&#xff0c;这都限制了网络性能。此外&#xff0c;由于空间注意力以及现有空间注意力机制的局限性&#xff0c;虽然能够突出关键特征&#xf…...

Springboot引入Spring Cloud for AWS的配置中心(Parameter Store和Secrets)

问题 现在手上有一个老Spring2.5.15项目&#xff0c;需要使用AWS Parameter Store作为配置中心服务。 思路 引入这个Spring版本对应的Spring Cloud&#xff0c;然后再引入Spring Cloud AWS相关组件。然后&#xff0c;在AWS云上面准备好配置&#xff0c;然后&#xff0c;启动…...

打破云平台壁垒支持多层级JSON生成的MQTT网关技术解析

工业智能网关的上行通信以MQTT协议为核心&#xff0c;但在实际应用中&#xff0c;企业往往需要将数据同时或分场景接入多个公有云平台&#xff08;如华为云IoT、阿里云IoT、亚马逊AWS IoT&#xff09;&#xff0c;甚至私有化部署的第三方平台。为实现这一目标&#xff0c;网关需…...

Modbus通信中的延迟和时间间隔详解

在工业自动化领域,Modbus协议作为最广泛使用的通信协议之一,其通信时序和延迟控制直接影响到系统的稳定性和效率。本文将深入探讨Modbus通信中涉及的各种延迟和时间间隔,帮助开发者更好地理解和应用这些概念。 一、串口Modbus通信中的延迟问题 1.1 为什么需要延迟? 在基…...

maven 最短路径依赖优先

问题描述&#xff1a; 项目在升级大版本后出现了&#xff0c;两个不同模块所引用的同一个依赖包版本不同 module A 引用了 module B&#xff0c;module B 引用了 A_1.0.jar->B_1.0.jar->C_1.0.jar(C 为B 里面的包) 在执行 mvn dependency:tree 后发现&#xff1a; modul…...

SAAS架构设计2-流程图-用户与租户之间对应关系图

在SAAS&#xff08;Software as a Service&#xff0c;软件即服务&#xff09;结构中&#xff0c;用户与租户之间的关系可以通过一对一和多对多两种方式来定义。这两种关系模式各自有着不同的应用场景和特点。 用户和租户的关系&#xff08;一对一&#xff09; 一对一关系 在这…...

TypeScript入门到精通

学习ts之前&#xff0c;我们首先了解一下我们为什么要学ts,ts是什么&#xff1f;ts比js有不同呢&#xff1f; TypeScript 是 JavaScript 的一个超集&#xff0c;是由微软开发的自由和开源的编程语言&#xff0c;支持 ECMAScript 6 标准&#xff08;ES6 教程&#xff09;。在 Ja…...

三、Docker目录挂载、卷映射、网络

目录挂载 如果主机目录为空&#xff0c;则容器内也为空 -v表示目录挂载 冒号前面的是主机上的目录&#xff0c;冒号后面的是docker容器里面的地址 修改主机上的文件&#xff0c;发现docker容器里面的内容也随之改变。 同样修改docker容器里面的内容&#xff0c;主机上的文件…...

迪米特法则 (Law of Demeter, LoD)

定义&#xff1a;迪米特法则(Law of Demeter, LoD)&#xff1a;一个软件实体应当尽可能少地与其他实体发生相互作用。 迪米特法则&#xff08;Law of Demeter&#xff0c;LoD&#xff09;又叫作最少知识原则&#xff08;Least Knowledge Principle&#xff0c;LKP)&#xff0c;…...

【R语言编程绘图-函数篇】

基础函数绘制 R语言可通过curve()函数直接绘制数学函数图形&#xff0c;无需预先生成数据点。例如绘制正弦函数&#xff1a; curve(sin, from -pi, to pi, col "blue", lwd 2)自定义函数绘制 对于用户自定义函数&#xff0c;需先定义函数表达式&#xff1a; …...

训练自己的yolo模型,并部署到rk3588上

文章目录 1. 训练自己的模型2. pt转onnx3. onnx转rknn4. 后续…… 1. 训练自己的模型 如何训练自己的yolo模型&#xff0c;网络上已经有足够多的教程&#xff0c;这里只简单的描述一下。如果已经有了自己的.pt模型&#xff0c;那么可以直接跳转到第二节。 此处是以检测模型的…...

Leetcode 3556. Sum of Largest Prime Substrings

Leetcode 3556. Sum of Largest Prime Substrings 1. 解题思路2. 代码实现3. 算法优化 题目链接&#xff1a;3556. Sum of Largest Prime Substrings 1. 解题思路 这一题毕竟只是这一次双周赛的第一题&#xff0c;虽然标记为medium的题目&#xff0c;但是思路上还是非常简单…...

以少学习:通过无标签数据从大型语言模型进行知识蒸馏

Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data 发表&#xff1a;NNACL-Findings 2025 机构&#xff1a;密歇根州立大学 Abstract 在实际的自然语言处理&#xff08;NLP&#xff09;应用中&#xff0c;大型语言模型&#xff08…...

鸿蒙OSUniApp 实现带有滑动删除的列表#三方框架 #Uniapp

使用 UniApp 实现带有滑动删除的列表 在移动应用开发中&#xff0c;滑动删除&#xff08;Swipe to Delete&#xff09;是一种常见且实用的交互方式&#xff0c;广泛应用于消息、待办、收藏等列表场景。用户只需在列表项上左右滑动&#xff0c;即可快速删除或管理数据。随着 Ha…...