当前位置：首页 > article >正文

大模型应用开发第三讲：大模型是Agent的“大脑”，提供通用推理能力（如GPT-4、Claude 3）

article 2026/2/8 21:14:56

大模型应用开发第三讲：大模型是Agent的“大脑”，提供通用推理能力（如GPT-4、Claude 3）

资料取自《大模型应用开发：动手做AI Agent 》。
查看总目录：学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章：DeepSeek R1本地与线上满血版部署：超详细手把手指南

大模型是Agent的「大脑」—— 用生活案例讲透通用推理能力

以下用“人类大脑 VS 大模型”类比 + 生活场景拆解，帮你直观理解大模型的「大脑」作用

一、核心逻辑：大模型 = Agent的智慧中枢

就像人类用大脑分析问题、指挥手脚干活，大模型（如GPT-4）在Agent中扮演 决策指挥官 的角色[2][5]。

人类场景	Agent内部运作
你说“肚子饿”→ 大脑分析附近餐厅、选性价比最高的	用户输入需求 → 大模型拆解任务、调用工具（地图+支付接口）
朋友借钱→大脑判断关系、利息、还款能力	处理用户请求 → 大模型检查财务数据、风控规则[1][5]

二、大模型如何提供推理能力？分三步说清

1. 任务拆解：像解开一团毛线

例子：用户说：“我想带爸妈去三亚旅行，他们腿脚不好，预算1万。”

大模型行动：
1️⃣ 拆分核心需求 → 交通（少步行）、住宿（无障碍）、景点（轻松游） [1]。
2️⃣ 调用工具 → 查航班/筛选酒店/规划路线（见图）[6]。

▲ 任务拆解与工具协作流程（引用第2章框架）

2. 逻辑推理：像侦探破案

原理：大模型内部通过「思维链（CoT）」技术，像写草稿纸一样一步步推导[2]。

例子：预算超标时的推理过程

机票5000元 + 酒店400元/天×5天 = 7000元
→ 问题：剩余3000元不够景点门票+餐饮
→ 重组方案：改订红眼航班（省2000元）+ 减少一晚住宿（省400元）→ 总预算控制成功 [1][6]。

3. 多工具协作：像乐队指挥

关键能力：协调不同工具（订票系统、计算器、数据库）共同完成任务[5][6]。

案例对比：

无大模型	有大模型
工具各干各的：机票工具只能查票，酒店工具只会订房	大模型协调工具：先算总预算，再订票+订房+查天气，保证方案整体可行 [5][6]

三、生动案例：旅行管家Agent的一天

用户需求：周末北京出发去杭州，想看西湖，预算2500元

大模型「大脑」工作全流程

1️⃣ 感知需求：提取关键词：时间（周末）、地点（杭州）、限制条件（预算2500）[2][5]。
2️⃣ 调用知识库：查找西湖附近酒店价格、高铁耗时、景点开放时间[5]。
3️⃣ 生成方案：

北京→杭州高铁（4小时，二等座单程400元）
酒店：西湖边汉庭2晚（总价800元）
景点：西湖游船（80元/人）+ 灵隐寺（45元/人）
4️⃣ 逻辑验证：总费用计算（400×2 + 800 + 80×2 + 45×2 = 2450元），不超预算[6]。
5️⃣ 执行订票：调用12306接口订票，发送确认短信到用户手机[5][6]。

▲ 流程涉及第2章规划能力与第5章工具调用

四、为什么必须用大模型？

1. 传统程序 VS 大模型Agent

传统程序	大模型Agent
只能处理固定规则（如“价格>1000就报警”）	能理解模糊指令（如“选性价比高的酒店”）[2]
遇到未预设的情况直接报错（如台风停航）	自动调整方案（改订高铁/改日期）[6]

2. 核心价值总结

通用性：同一套模型处理旅游、办公、医疗等不同任务[2][5]。
应变力：用户临时加需求（“顺便预约接机”）能即时响应[6]。
像人一样思考：考虑间接因素（如“带老人出行”选直达车次）[1][6]。

核心章节引用说明

大模型角色：《大模型应用开发：动手做AI Agent 》第1章1.3节描述大模型作为Agent大脑的核心作用[2]。
任务拆解方法：《大模型应用开发：动手做AI Agent 》第2章2.2节（思维链、ReAct框架）[1][5]。
工具协作逻辑：《大模型应用开发：动手做AI Agent 》第2章2.4节（调用工具扩展能力）[5][6]。
案例实现技术：《大模型应用开发：动手做AI Agent 》第6章（ReAct框架实战）[6]。

技术延伸阅读：《大模型应用开发：动手做AI Agent 》第3~6章通过订票助手、自动PPT制作等7个案例，展示不同场景的大模型推理实战（参考目录）[3]。

目录：总目录
上篇文章：大模型应用开发第二讲：核心能力：自主性、适应性、推理能力
下篇文章：大模型应用开发第四讲：两大方向：增加上下文信息（知识） vs 提升行动力（微调或Agent技术）

大模型应用开发第三讲：大模型是Agent的“大脑”，提供通用推理能力（如GPT-4、Claude 3）

大模型应用开发第三讲：大模型是Agent的“大脑”，提供通用推理能力（如GPT-4、Claude 3） 资料取自《大模型应用开发：动手做AI Agent 》。查看总目录：学习大纲关于DeepSeek本地部署指南可以看下我之前写的…...

编程日记 2026/2/6 3:21:18

创建型模式之Abstract Factory（抽象工厂）

创建型模式之Abstract Factory（抽象工厂） 摘要： 本文介绍了抽象工厂模式（Abstract Factory），它是一种创建型设计模式，提供了一种创建一系列相关对象的接口而无需指定具体类。文章通过手机工厂示…...

编程日记 2026/2/2 14:32:38

GitLab 18.0 正式发布，15.0 将不再受技术支持，须升级【一】

GitLab 是一个全球知名的一体化 DevOps 平台，很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。学习极狐GitLab 的相关资料： 极狐GitLab 官网极狐…...

编程日记 2026/2/7 20:38:28

【DeepSeek论文精读】12. DeepSeek-Prover-V2: 通过强化学习实现子目标分解的形式化数学推理

欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html）原创作品【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】10. DeepSeek-Coder-V2: 突破闭源模型在代码智能领域的障碍【DeepSeek论文精读】12. De…...

编程日记 2026/1/30 2:21:21

字符串day7

344 反转字符串字符串理论上也是一个数组，因此只需要用双指针即可 class Solution { public:void reverseString(vector<char>& s) {for(int i0,js.size()-1;i<j;i,j--){swap(s[i],s[j]);}} };541 反转字符串自己实现一个反转从start到end的字符串…...

编程日记 2026/1/8 0:40:37

vue2中，codemirror编辑器的使用

交互说明在编辑器中输入{时，会自动弹出选项弹窗，然后可以选值插入。代码父组件 <variable-editorv-model"content":variables"variables"placeholder"请输入模板内容..."blur"handleBlur" />data…...

编程日记 2026/1/30 17:05:33

FastAPI与MongoDB分片集群：异步数据路由与聚合优化

title: FastAPI与MongoDB分片集群：异步数据路由与聚合优化 date: 2025/05/26 16:04:31 updated: 2025/05/26 16:04:31 author: cmdragon excerpt: FastAPI与MongoDB分片集群集成实战探讨了分片集群的核心概念、Motor驱动配置技巧、分片数据路由策略、聚合管道高级应用、分片…...

编程日记 2026/1/31 6:16:14

Perl单元测试实战指南：从Test::Class入门到精通的完整方案

阅读原文前言：为什么Perl开发者需要重视单元测试？ "这段代码昨天还能运行，今天就出问题了！"——这可能是每位Perl开发者都经历过的噩梦。在没有充分测试覆盖的情况下，即使是微小的改动也可能导致系统崩溃。单元测试正是解决这一痛点的最佳实践，它能帮助我们在…...

编程日记 2026/2/5 12:17:02

强大的免费工具，集合了30+功能

今天给大家分享一款免费的绿色办公软件，它涵盖了自动任务、系统工具、文件工具、PDF 工具、OCR 图文识别、文字处理、电子表格这七个模块，多达 30 余项实用功能，堪称办公利器。作者开发这款软件的初衷是为了解决日常办公中常见的痛点问题&am…...

编程日记 2026/2/6 3:34:04

从0开始学习R语言--Day11--主成分分析

主成分分析（PCA） PCA是一种降维技术，它把一堆相关的变量（比如身高、体重、年龄）转换成少数几个不相关的新变量（叫“主成分”），这些新变量能最大程度保留原始数据的信息。核心理念 …...

编程日记 2026/2/8 19:42:05

通用前端框架项目静态部署到Hugging Face Space的实践指南

背景介绍在轻量级展示前端项目的场景中，Hugging Face Space 提供了一个便捷的静态托管平台。需求是将无后端服务的Vite的 Vue项目部署到Hugging Face Space 上。其实无论是基于Vite的Vue/React项目，还是使用Webpack构建的工程化方案，都可以通过两种方式将其部署到Space：自…...

编程日记 2026/2/5 11:54:08

AI辅助写作从提笔难到高效创作的智能升级

你是否经历过面对空白文档头脑空白的绝望？是否为整理实验数据通宵达旦？在这个信息爆炸的时代，一种新型写作方式正悄悄改变知识工作者的创作模式—AI辅助写作。这种技术既不像科幻作品里的自动生成机器人，也非简单的文字模板&#…...

编程日记 2026/2/1 1:42:34

十一、Samba文件共享服务

目录 1、Samba介绍1.1、Samba概述1.2、Samba服务器的主要组成部分1.3、Samba的工作原理2、Samab服务器的安装与配置2.1、安装samba2.2、Samba主配置文件2.2.1、全局设置段[global]2.2.2、用户目录段[homes]2.2.3、配置文件检查工具3、示例3.1、需要用户验证的共享3.2、用户映射…...

编程日记 2026/2/6 4:06:54

医疗影像检测系统设计与实现

以下是一个基于YOLO系列模型的医疗影像检测系统实现及对比分析的详细技术文档。由于目前官方YOLOv11尚未发布，本文将基于YOLOv8架构设计改进型YOLOv11，并与YOLOv8、YOLOv5进行对比实验。全文包含完整代码实现及分析，字数超过6000字。 # 注意：本文代码需要Python 3.8+、PyT…...

编程日记 2026/1/11 8:55:23

11.13 LangGraph记忆机制解析：构建生产级AI Agent的关键技术

LangGraph 持久化与记忆：构建具备记忆能力的生产级 AI Agent 关键词：LangGraph 持久化, 多回合记忆, 单回合记忆, 检查点系统, 状态管理 1. 记忆机制的核心价值在对话式 AI Agent 的开发中，记忆管理直接决定了用户体验的连贯性和智能性。LangGraph 通过多回合记忆（Mult…...

编程日记 2026/1/9 7:57:12

C++23中std::span和std::basic_string_view可平凡复制提案解析

文章目录一、引言二、相关概念解释2.1 平凡复制（Trivially Copyable）2.2 std::span2.3 std::basic_string_view 三、std::span和std::basic_string_view的应用场景3.1 std::span的应用场景3.2 std::basic_string_view的应用场景四、P2251R1提案对std::…...

编程日记 2026/2/5 11:52:26

[yolov11改进系列]基于yolov11引入感受野注意力卷积RFAConv的python源码+训练源码

[RFAConv介绍] 1、RFAConv 在传统卷积操作中，每个感受野都使用相同的卷积核参数，无法区分不同位置的信息差异，这都限制了网络性能。此外，由于空间注意力以及现有空间注意力机制的局限性，虽然能够突出关键特征&#xf…...

编程日记 2026/2/2 9:56:47

Springboot引入Spring Cloud for AWS的配置中心（Parameter Store和Secrets）

问题现在手上有一个老Spring2.5.15项目，需要使用AWS Parameter Store作为配置中心服务。思路引入这个Spring版本对应的Spring Cloud，然后再引入Spring Cloud AWS相关组件。然后，在AWS云上面准备好配置，然后，启动…...

编程日记 2026/1/30 15:36:26

打破云平台壁垒支持多层级JSON生成的MQTT网关技术解析

工业智能网关的上行通信以MQTT协议为核心，但在实际应用中，企业往往需要将数据同时或分场景接入多个公有云平台（如华为云IoT、阿里云IoT、亚马逊AWS IoT），甚至私有化部署的第三方平台。为实现这一目标，网关需…...

编程日记 2026/2/7 9:04:28

Modbus通信中的延迟和时间间隔详解

在工业自动化领域，Modbus协议作为最广泛使用的通信协议之一，其通信时序和延迟控制直接影响到系统的稳定性和效率。本文将深入探讨Modbus通信中涉及的各种延迟和时间间隔，帮助开发者更好地理解和应用这些概念。一、串口Modbus通信中的延迟问题 1.1 为什么需要延迟？在基…...

编程日记 2025/7/17 12:26:48

maven 最短路径依赖优先

问题描述： 项目在升级大版本后出现了，两个不同模块所引用的同一个依赖包版本不同 module A 引用了 module B，module B 引用了 A_1.0.jar->B_1.0.jar->C_1.0.jar(C 为B 里面的包) 在执行 mvn dependency:tree 后发现： modul…...

编程日记 2025/11/18 0:51:41

SAAS架构设计2-流程图-用户与租户之间对应关系图

在SAAS（Software as a Service，软件即服务）结构中，用户与租户之间的关系可以通过一对一和多对多两种方式来定义。这两种关系模式各自有着不同的应用场景和特点。用户和租户的关系（一对一） 一对一关系在这…...

编程日记 2026/2/5 0:38:07

TypeScript入门到精通

学习ts之前，我们首先了解一下我们为什么要学ts,ts是什么？ts比js有不同呢？ TypeScript 是 JavaScript 的一个超集，是由微软开发的自由和开源的编程语言，支持 ECMAScript 6 标准（ES6 教程）。在 Ja…...

编程日记 2026/1/30 15:38:34

三、Docker目录挂载、卷映射、网络

目录挂载如果主机目录为空，则容器内也为空 -v表示目录挂载冒号前面的是主机上的目录，冒号后面的是docker容器里面的地址修改主机上的文件，发现docker容器里面的内容也随之改变。同样修改docker容器里面的内容，主机上的文件…...

编程日记 2026/1/31 7:33:38

迪米特法则 (Law of Demeter, LoD)

定义：迪米特法则(Law of Demeter, LoD)：一个软件实体应当尽可能少地与其他实体发生相互作用。迪米特法则（Law of Demeter，LoD）又叫作最少知识原则（Least Knowledge Principle，LKP)，…...

编程日记 2026/2/6 8:42:43

【R语言编程绘图-函数篇】

基础函数绘制 R语言可通过curve()函数直接绘制数学函数图形，无需预先生成数据点。例如绘制正弦函数： curve(sin, from -pi, to pi, col "blue", lwd 2)自定义函数绘制对于用户自定义函数，需先定义函数表达式： …...

编程日记 2026/2/8 9:23:38

训练自己的yolo模型，并部署到rk3588上

文章目录 1. 训练自己的模型2. pt转onnx3. onnx转rknn4. 后续…… 1. 训练自己的模型如何训练自己的yolo模型，网络上已经有足够多的教程，这里只简单的描述一下。如果已经有了自己的.pt模型，那么可以直接跳转到第二节。此处是以检测模型的…...

编程日记 2026/2/8 1:59:27

Leetcode 3556. Sum of Largest Prime Substrings

Leetcode 3556. Sum of Largest Prime Substrings 1. 解题思路2. 代码实现3. 算法优化题目链接：3556. Sum of Largest Prime Substrings 1. 解题思路这一题毕竟只是这一次双周赛的第一题，虽然标记为medium的题目，但是思路上还是非常简单…...

编程日记 2026/1/9 0:33:07

以少学习：通过无标签数据从大型语言模型进行知识蒸馏

Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data 发表：NNACL-Findings 2025 机构：密歇根州立大学 Abstract 在实际的自然语言处理（NLP）应用中，大型语言模型&#xff08…...

编程日记 2026/2/4 21:13:06

鸿蒙OSUniApp 实现带有滑动删除的列表#三方框架 #Uniapp

使用 UniApp 实现带有滑动删除的列表在移动应用开发中，滑动删除（Swipe to Delete）是一种常见且实用的交互方式，广泛应用于消息、待办、收藏等列表场景。用户只需在列表项上左右滑动，即可快速删除或管理数据。随着 Ha…...

编程日记 2025/12/19 5:40:19

大模型应用开发第三讲：大模型是Agent的“大脑”，提供通用推理能力（如GPT-4、Claude 3）

大模型是Agent的「大脑」—— 用生活案例讲透通用推理能力

一、核心逻辑：大模型 = Agent的智慧中枢

二、大模型如何提供推理能力？分三步说清

1. 任务拆解：像解开一团毛线

2. 逻辑推理：像侦探破案

3. 多工具协作：像乐队指挥

三、生动案例：旅行管家Agent的一天

用户需求：周末北京出发去杭州，想看西湖，预算2500元

大模型「大脑」工作全流程

四、为什么必须用大模型？

1. 传统程序 VS 大模型Agent

2. 核心价值总结

核心章节引用说明

相关文章：