大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)
大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)
资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲
关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南
大模型是Agent的「大脑」—— 用生活案例讲透通用推理能力
以下用“人类大脑 VS 大模型”类比 + 生活场景拆解,帮你直观理解大模型的「大脑」作用
一、核心逻辑:大模型 = Agent的智慧中枢
就像人类用大脑分析问题、指挥手脚干活,大模型(如GPT-4)在Agent中扮演 决策指挥官 的角色[2][5]。
人类场景 | Agent内部运作 |
---|---|
你说“肚子饿”→ 大脑分析附近餐厅、选性价比最高的 | 用户输入需求 → 大模型拆解任务、调用工具(地图+支付接口) |
朋友借钱→大脑判断关系、利息、还款能力 | 处理用户请求 → 大模型检查财务数据、风控规则[1][5] |
二、大模型如何提供推理能力?分三步说清
1. 任务拆解:像解开一团毛线
例子:用户说:“我想带爸妈去三亚旅行,他们腿脚不好,预算1万。”
- 大模型行动:
1️⃣ 拆分核心需求 → 交通(少步行)、住宿(无障碍)、景点(轻松游) [1]。
2️⃣ 调用工具 → 查航班/筛选酒店/规划路线(见图)[6]。
▲ 任务拆解与工具协作流程(引用第2章框架)
2. 逻辑推理:像侦探破案
原理:大模型内部通过「思维链(CoT)」技术,像写草稿纸一样一步步推导[2]。
例子:预算超标时的推理过程
机票5000元 + 酒店400元/天×5天 = 7000元
→ 问题:剩余3000元不够景点门票+餐饮
→ 重组方案:改订红眼航班(省2000元)+ 减少一晚住宿(省400元)→ 总预算控制成功 [1][6]。
3. 多工具协作:像乐队指挥
关键能力:协调不同工具(订票系统、计算器、数据库)共同完成任务[5][6]。
案例对比:
无大模型 | 有大模型 |
---|---|
工具各干各的:机票工具只能查票,酒店工具只会订房 | 大模型协调工具:先算总预算,再订票+订房+查天气,保证方案整体可行 [5][6] |
三、生动案例:旅行管家Agent的一天
用户需求:周末北京出发去杭州,想看西湖,预算2500元
大模型「大脑」工作全流程
1️⃣ 感知需求:提取关键词:时间(周末)、地点(杭州)、限制条件(预算2500)[2][5]。
2️⃣ 调用知识库:查找西湖附近酒店价格、高铁耗时、景点开放时间[5]。
3️⃣ 生成方案:
- 北京→杭州高铁(4小时,二等座单程400元)
- 酒店:西湖边汉庭2晚(总价800元)
- 景点:西湖游船(80元/人)+ 灵隐寺(45元/人)
4️⃣ 逻辑验证:总费用计算(400×2 + 800 + 80×2 + 45×2 = 2450元),不超预算[6]。
5️⃣ 执行订票:调用12306接口订票,发送确认短信到用户手机[5][6]。
▲ 流程涉及第2章规划能力与第5章工具调用
四、为什么必须用大模型?
1. 传统程序 VS 大模型Agent
传统程序 | 大模型Agent |
---|---|
只能处理固定规则(如“价格>1000就报警”) | 能理解模糊指令(如“选性价比高的酒店”)[2] |
遇到未预设的情况直接报错(如台风停航) | 自动调整方案(改订高铁/改日期)[6] |
2. 核心价值总结
- 通用性:同一套模型处理旅游、办公、医疗等不同任务[2][5]。
- 应变力:用户临时加需求(“顺便预约接机”)能即时响应[6]。
- 像人一样思考:考虑间接因素(如“带老人出行”选直达车次)[1][6]。
核心章节引用说明
- 大模型角色:《大模型应用开发:动手做AI Agent 》第1章1.3节描述大模型作为Agent大脑的核心作用[2]。
- 任务拆解方法:《大模型应用开发:动手做AI Agent 》第2章2.2节(思维链、ReAct框架)[1][5]。
- 工具协作逻辑:《大模型应用开发:动手做AI Agent 》第2章2.4节(调用工具扩展能力)[5][6]。
- 案例实现技术:《大模型应用开发:动手做AI Agent 》第6章(ReAct框架实战)[6]。
技术延伸阅读:《大模型应用开发:动手做AI Agent 》第3~6章通过订票助手、自动PPT制作等7个案例,展示不同场景的大模型推理实战(参考目录)[3]。
目录:总目录
上篇文章:大模型应用开发第二讲:核心能力:自主性、适应性、推理能力
下篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)
相关文章:
大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)
大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3) 资料取自《大模型应用开发:动手做AI Agent 》。 查看总目录:学习大纲 关于DeepSeek本地部署指南可以看下我之前写的…...

创建型模式之Abstract Factory(抽象工厂)
创建型模式之Abstract Factory(抽象工厂) 摘要: 本文介绍了抽象工厂模式(Abstract Factory),它是一种创建型设计模式,提供了一种创建一系列相关对象的接口而无需指定具体类。文章通过手机工厂示…...
GitLab 18.0 正式发布,15.0 将不再受技术支持,须升级【一】
GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...

【DeepSeek论文精读】12. DeepSeek-Prover-V2: 通过强化学习实现子目标分解的形式化数学推理
欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】10. DeepSeek-Coder-V2: 突破闭源模型在代码智能领域的障碍 【DeepSeek论文精读】12. De…...
字符串day7
344 反转字符串 字符串理论上也是一个数组,因此只需要用双指针即可 class Solution { public:void reverseString(vector<char>& s) {for(int i0,js.size()-1;i<j;i,j--){swap(s[i],s[j]);}} };541 反转字符串 自己实现一个反转从start到end的字符串…...

vue2中,codemirror编辑器的使用
交互说明 在编辑器中输入{时,会自动弹出选项弹窗,然后可以选值插入。 代码 父组件 <variable-editorv-model"content":variables"variables"placeholder"请输入模板内容..."blur"handleBlur" />data…...

FastAPI与MongoDB分片集群:异步数据路由与聚合优化
title: FastAPI与MongoDB分片集群:异步数据路由与聚合优化 date: 2025/05/26 16:04:31 updated: 2025/05/26 16:04:31 author: cmdragon excerpt: FastAPI与MongoDB分片集群集成实战探讨了分片集群的核心概念、Motor驱动配置技巧、分片数据路由策略、聚合管道高级应用、分片…...

Perl单元测试实战指南:从Test::Class入门到精通的完整方案
阅读原文 前言:为什么Perl开发者需要重视单元测试? "这段代码昨天还能运行,今天就出问题了!"——这可能是每位Perl开发者都经历过的噩梦。在没有充分测试覆盖的情况下,即使是微小的改动也可能导致系统崩溃。单元测试正是解决这一痛点的最佳实践,它能帮助我们在…...

强大的免费工具,集合了30+功能
今天给大家分享一款免费的绿色办公软件,它涵盖了自动任务、系统工具、文件工具、PDF 工具、OCR 图文识别、文字处理、电子表格这七个模块,多达 30 余项实用功能,堪称办公利器。 作者开发这款软件的初衷是为了解决日常办公中常见的痛点问题&am…...

从0开始学习R语言--Day11--主成分分析
主成分分析(PCA) PCA是一种降维技术,它把一堆相关的变量(比如身高、体重、年龄)转换成少数几个不相关的新变量(叫“主成分”),这些新变量能最大程度保留原始数据的信息。 核心理念 …...
通用前端框架项目静态部署到Hugging Face Space的实践指南
背景介绍 在轻量级展示前端项目的场景中,Hugging Face Space 提供了一个便捷的静态托管平台。需求是将无后端服务的Vite的 Vue项目部署到Hugging Face Space 上。其实无论是基于Vite的Vue/React项目,还是使用Webpack构建的工程化方案,都可以通过两种方式将其部署到Space:自…...

AI辅助写作 从提笔难到高效创作的智能升级
你是否经历过面对空白文档头脑空白的绝望?是否为整理实验数据通宵达旦?在这个信息爆炸的时代,一种新型写作方式正悄悄改变知识工作者的创作模式—AI辅助写作。这种技术既不像科幻作品里的自动生成机器人,也非简单的文字模板&#…...
十一、Samba文件共享服务
目录 1、Samba介绍1.1、Samba概述1.2、Samba服务器的主要组成部分1.3、Samba的工作原理2、Samab服务器的安装与配置2.1、安装samba2.2、Samba主配置文件2.2.1、全局设置段[global]2.2.2、用户目录段[homes]2.2.3、配置文件检查工具3、示例3.1、需要用户验证的共享3.2、用户映射…...
医疗影像检测系统设计与实现
以下是一个基于YOLO系列模型的医疗影像检测系统实现及对比分析的详细技术文档。由于目前官方YOLOv11尚未发布,本文将基于YOLOv8架构设计改进型YOLOv11,并与YOLOv8、YOLOv5进行对比实验。全文包含完整代码实现及分析,字数超过6000字。 # 注意:本文代码需要Python 3.8+、PyT…...
11.13 LangGraph记忆机制解析:构建生产级AI Agent的关键技术
LangGraph 持久化与记忆:构建具备记忆能力的生产级 AI Agent 关键词:LangGraph 持久化, 多回合记忆, 单回合记忆, 检查点系统, 状态管理 1. 记忆机制的核心价值 在对话式 AI Agent 的开发中,记忆管理直接决定了用户体验的连贯性和智能性。LangGraph 通过 多回合记忆(Mult…...

C++23中std::span和std::basic_string_view可平凡复制提案解析
文章目录 一、引言二、相关概念解释2.1 平凡复制(Trivially Copyable)2.2 std::span2.3 std::basic_string_view 三、std::span和std::basic_string_view的应用场景3.1 std::span的应用场景3.2 std::basic_string_view的应用场景 四、P2251R1提案对std::…...

[yolov11改进系列]基于yolov11引入感受野注意力卷积RFAConv的python源码+训练源码
[RFAConv介绍] 1、RFAConv 在传统卷积操作中,每个感受野都使用相同的卷积核参数,无法区分不同位置的信息差异,这都限制了网络性能。此外,由于空间注意力以及现有空间注意力机制的局限性,虽然能够突出关键特征…...

Springboot引入Spring Cloud for AWS的配置中心(Parameter Store和Secrets)
问题 现在手上有一个老Spring2.5.15项目,需要使用AWS Parameter Store作为配置中心服务。 思路 引入这个Spring版本对应的Spring Cloud,然后再引入Spring Cloud AWS相关组件。然后,在AWS云上面准备好配置,然后,启动…...

打破云平台壁垒支持多层级JSON生成的MQTT网关技术解析
工业智能网关的上行通信以MQTT协议为核心,但在实际应用中,企业往往需要将数据同时或分场景接入多个公有云平台(如华为云IoT、阿里云IoT、亚马逊AWS IoT),甚至私有化部署的第三方平台。为实现这一目标,网关需…...
Modbus通信中的延迟和时间间隔详解
在工业自动化领域,Modbus协议作为最广泛使用的通信协议之一,其通信时序和延迟控制直接影响到系统的稳定性和效率。本文将深入探讨Modbus通信中涉及的各种延迟和时间间隔,帮助开发者更好地理解和应用这些概念。 一、串口Modbus通信中的延迟问题 1.1 为什么需要延迟? 在基…...
maven 最短路径依赖优先
问题描述: 项目在升级大版本后出现了,两个不同模块所引用的同一个依赖包版本不同 module A 引用了 module B,module B 引用了 A_1.0.jar->B_1.0.jar->C_1.0.jar(C 为B 里面的包) 在执行 mvn dependency:tree 后发现: modul…...

SAAS架构设计2-流程图-用户与租户之间对应关系图
在SAAS(Software as a Service,软件即服务)结构中,用户与租户之间的关系可以通过一对一和多对多两种方式来定义。这两种关系模式各自有着不同的应用场景和特点。 用户和租户的关系(一对一) 一对一关系 在这…...

TypeScript入门到精通
学习ts之前,我们首先了解一下我们为什么要学ts,ts是什么?ts比js有不同呢? TypeScript 是 JavaScript 的一个超集,是由微软开发的自由和开源的编程语言,支持 ECMAScript 6 标准(ES6 教程)。在 Ja…...

三、Docker目录挂载、卷映射、网络
目录挂载 如果主机目录为空,则容器内也为空 -v表示目录挂载 冒号前面的是主机上的目录,冒号后面的是docker容器里面的地址 修改主机上的文件,发现docker容器里面的内容也随之改变。 同样修改docker容器里面的内容,主机上的文件…...

迪米特法则 (Law of Demeter, LoD)
定义:迪米特法则(Law of Demeter, LoD):一个软件实体应当尽可能少地与其他实体发生相互作用。 迪米特法则(Law of Demeter,LoD)又叫作最少知识原则(Least Knowledge Principle,LKP),…...

【R语言编程绘图-函数篇】
基础函数绘制 R语言可通过curve()函数直接绘制数学函数图形,无需预先生成数据点。例如绘制正弦函数: curve(sin, from -pi, to pi, col "blue", lwd 2)自定义函数绘制 对于用户自定义函数,需先定义函数表达式: …...

训练自己的yolo模型,并部署到rk3588上
文章目录 1. 训练自己的模型2. pt转onnx3. onnx转rknn4. 后续…… 1. 训练自己的模型 如何训练自己的yolo模型,网络上已经有足够多的教程,这里只简单的描述一下。如果已经有了自己的.pt模型,那么可以直接跳转到第二节。 此处是以检测模型的…...
Leetcode 3556. Sum of Largest Prime Substrings
Leetcode 3556. Sum of Largest Prime Substrings 1. 解题思路2. 代码实现3. 算法优化 题目链接:3556. Sum of Largest Prime Substrings 1. 解题思路 这一题毕竟只是这一次双周赛的第一题,虽然标记为medium的题目,但是思路上还是非常简单…...

以少学习:通过无标签数据从大型语言模型进行知识蒸馏
Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data 发表:NNACL-Findings 2025 机构:密歇根州立大学 Abstract 在实际的自然语言处理(NLP)应用中,大型语言模型(…...
鸿蒙OSUniApp 实现带有滑动删除的列表#三方框架 #Uniapp
使用 UniApp 实现带有滑动删除的列表 在移动应用开发中,滑动删除(Swipe to Delete)是一种常见且实用的交互方式,广泛应用于消息、待办、收藏等列表场景。用户只需在列表项上左右滑动,即可快速删除或管理数据。随着 Ha…...