当前位置: 首页 > article >正文

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


Agent成熟度模型详解:从「智能客服」到「科幻管家」

手机进化史类比AI Agent发展路径,结合书中技术框架梳理阶段特征


一、成熟度分级表(先看全局)

级别名称能力类比典型特征案例参考
L1基础对话模型功能机(只能打电话)单轮问答,无上下文记忆早期客服机器人
L2ChatGPT级(初级Agent)智能手机(装App扩展能力)简单规划+调用单个工具GPT-4联网版
L3专业领域Agent智能手表(健康监测)多步骤决策+领域工具链协作医疗诊断Agent
L4自主Agent科幻管家(贾维斯)跨系统协作+动态学习+自我优化电影《钢铁侠》AI

二、逐级拆解(含技术原理与案例)

▶ L2级:会查资料的「实习生」

核心特征

  • 有限规划:拆解简单任务(如“查天气→推荐穿搭”)[2][5]
  • 单一工具:每次调用1个接口(如地图API)[5]
  • 线性执行:出错需人工修正(订单失败就卡住)[6]

生活案例:旅行清单助手

用户说:“下周末去杭州要带什么?”
1️⃣ 查杭州天气(调用天气API → 显示有雨)[5]
2️⃣ 生成清单:雨伞、薄外套 → 结束任务[6]

用户提问
调用天气API
是否下雨?
建议带伞
建议防晒用品

▲ 线性决策流程(第5章Function Calling示例)


▶ L3级:行业专家级的「部门主管」

技术突破

  • 多级规划:任务树分解(如看病→挂号→检查→开药)[1][6]
  • 工具链协作:连续调用多个系统(医保计算+药房库存查询)[6]
  • 异常处理:预算超支自动切换方案(如改用平价替代药)[6]

医疗Agent实战流程
1️⃣ 患者输入症状 → 拆解为[挂号科室→检查项目→取药] [1]
2️⃣ 调用医院HIS系统查号源 → 推荐最近三甲医院 [5][6]
3️⃣ 检查报告解读 → 自动对比历史病例库 [5]
4️⃣ 开药时检测医保余额 → 不足时触发短信提醒 [6]

症状描述
分解就诊步骤
工具1:挂号系统
工具2:检查项库
工具3:医保计算器
生成就诊方案
患者确认?
执行预约
重新规划

▲ 多工具协作流程(第6章ReAct框架)


▶ L4级:全能型的「CEO助理」

质变特征(相比L3):

  • 动态学习:从用户反馈优化策略(如记住用户常选航空公司)[4]
  • 跨系统协同:同时调度物流+支付+供应链系统 [6]
  • 自主纠错:航班取消时自动改签+重订酒店+通知客户 [4][6]

案例:情人节鲜花危机救援
1️⃣ 感知异常:物流系统报警 → 50%库存损毁[6]
2️⃣ 动态规划
▸ 查找备用供应商(调用3个鲜花平台API)
▸ 比价后锁定本地批发市场现货 [6]
3️⃣ 多线程执行
▸ 向批发商付款 → 调用企业支付接口
▸ 同步更新客户订单 → 发送延迟补偿券 [6]
4️⃣ 经验沉淀:将本次方案存入危机应对知识库 [2][4]

库存告警
自主启动应急预案
并行调用工具
供应商检索API
比价算法
物流调度系统
成本<预算?
全自动采购
发起人工审批

▲ L4自主决策流程(第6章Plan-and-Execute案例)


三、关键技术支撑(书中核心章节索引)

L2→L3跃迁关键

  • 任务分解技术:思维链(Chain of Thought) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 工具调度能力:外部规划器(PDDL语言转换) → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 验证反馈机制:ReAct框架的思考-行动循环 → 《大模型应用开发:动手做AI Agent 》第6章[6]

L3→L4跃迁关键

  • 长期记忆系统:向量数据库存储历史经验 → 《大模型应用开发:动手做AI Agent 》第2章2.3节[5]
  • 动态学习架构: Reflexion框架的自我反思 → 《大模型应用开发:动手做AI Agent 》第2章2.2节[1]
  • 多Agent协同: 边缘计算节点分工协作 → 《大模型应用开发:动手做AI Agent 》附录A[4]

四、未来展望:L5级「数字生命」会远吗?

书中线索(《大模型应用开发:动手做AI Agent 》附录A方向):

  • 具身智能: Agent控制实体机器人维修设备 [4]
  • 人机共生: AI实时学习用户习惯 → 下班前自动调节家中空调[4]
  • 社会协作: 物流Agent与交通Agent协商最优配送路线 [4]

科幻照进现实的时间表

2024-01-01 2025-01-01 2026-01-01 2027-01-01 2028-01-01 2029-01-01 2030-01-01 L3医疗Agent L4供应链Agent L5具身Agent 城市级Agent网络 当前阶段 未来5年 Agent进化路线预测

关键引用

  • 多模态Agent方向 → 《大模型应用开发:动手做AI Agent 》附录A.3节[4]
  • 边缘系统部署技术 → 《大模型应用开发:动手做AI Agent 》附录A.2节[4]
  • 自主进化架构 → 《大模型应用开发:动手做AI Agent 》第6章ReAct扩展案例[6]

目录:总目录
上篇文章:大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)
下篇文章:大模型应用开发第六讲:目标:从被动响应到主动决策与执行


相关文章:

大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)

大模型应用开发第五讲&#xff1a;成熟度模型&#xff1a;从ChatGPT&#xff08;L2&#xff09;到未来自主Agent&#xff08;L4&#xff09; 资料取自《大模型应用开发&#xff1a;动手做AI Agent 》。 查看总目录&#xff1a;学习大纲 关于DeepSeek本地部署指南可以看下我之…...

特别篇-产品经理(三)

一、市场与竞品分析—竞品分析 1. 课后总结 案例框架&#xff1a;通过"小新吃蛋糕"案例展示行业分析方法&#xff0c;包含四个关键步骤&#xff1a; 明确目标行业调研确定竞品分析竞争策略输出结论 1&#xff09;行业背景分析方法 PEST分析法&#xff1a;从四个…...

IP地址扫描 网络状态监测 企业网络管理 免安装,企业级 IP 监控防未授权接入

各位网络小卫士们&#xff01;今天咱来聊聊一款超厉害的局域网IP地址扫描工具——IPScaner V1.22。这玩意儿就像网络世界的大侦探&#xff0c;能快速识别网络里设备的状态和资源分布。下面咱就好好唠唠它的那些事儿。 软件获取夸克网盘下载 先说说它的核心功能。第一个是IP…...

【unity游戏开发——编辑器扩展】AssetDatabase公共类在编辑器环境中管理和操作项目中的资源

注意&#xff1a;考虑到编辑器扩展的内容比较多&#xff0c;我将编辑器扩展的内容分开&#xff0c;并全部整合放在【unity游戏开发——编辑器扩展】专栏里&#xff0c;感兴趣的小伙伴可以前往逐一查看学习。 文章目录 前言一、AssetDatabase常用API1、创建资源1.1 API1.2 示例 …...

BLE协议全景图:从0开始理解低功耗蓝牙

BLE(Bluetooth Low Energy)作为一种针对低功耗场景优化的通信协议,已经广泛应用于智能穿戴、工业追踪、智能家居、医疗设备等领域。 本文是《BLE 协议实战详解》系列的第一篇,将从 BLE 的发展历史、协议栈结构、核心机制和应用领域出发,为后续工程实战打下全面认知基础。 …...

【机器学习基础】机器学习入门核心算法:GBDT(Gradient Boosting Decision Tree)

机器学习入门核心算法&#xff1a;GBDT&#xff08;Gradient Boosting Decision Tree&#xff09; 1. 算法逻辑2. 算法原理与数学推导2.1 目标函数2.2 负梯度计算2.3 决策树拟合2.4 叶子权重计算2.5 模型更新 3. 模型评估评估指标防止过拟合 4. 应用案例4.1 金融风控4.2 推荐系…...

基于开源AI大模型AI智能名片S2B2C商城小程序源码的销售环节数字化实现路径研究

摘要&#xff1a;在数字化浪潮下&#xff0c;企业销售环节的转型升级已成为提升竞争力的核心命题。本文基于清华大学全球产业研究院《中国企业数字化转型研究报告&#xff08;2020&#xff09;》提出的“提升销售率与利润率、打通客户数据、强化营销协同、构建全景用户画像、助…...

Spring Cache核心原理与快速入门指南

文章目录 前言一、Spring Cache核心原理1.1 架构设计思想1.2 运行时执行流程1.3 核心组件协作1.4 关键机制详解1.5 扩展点设计1.6 与Spring事务的协同 二、快速入门实战三、局限性3.1 多级缓存一致性缺陷3.2 分布式锁能力缺失3.3 事务集成陷阱 总结 前言 在当今高并发、低延迟…...

Redisson学习专栏(四):实战应用(分布式会话管理,延迟队列)

文章目录 前言一、为什么需要分布式会话管理&#xff1f;1.1 使用 Redisson 实现 Session 共享 二、订单超时未支付&#xff1f;用延迟队列精准处理2.1 RDelayedQueue 核心机制2.2 订单超时处理实战 总结 前言 在现代分布式系统中&#xff0c;会话管理和延迟任务处理是两个核心…...

java程序从服务器端到Lambda函数的迁移与优化

source&#xff1a;https://www.jfokus.se/jfokus24-preso/From-Serverful-to-Serverless-Java.pdf 从传统的服务器端Java应用&#xff0c;到如今的无服务器架构。这不仅仅是技术名词的改变&#xff0c;更是开发模式和运维理念的一次深刻变革。先快速回顾一下我们熟悉的“服务…...

使用yocto搭建qemuarm64环境

环境 yocto下载 # 源码下载 git clone git://git.yoctoproject.org/poky git reset --hard b223b6d533a6d617134c1c5bec8ed31657dd1268 构建 # 编译镜像 export MACHINE"qemuarm64" . oe-init-build-env bitbake core-image-full-cmdline 运行 # 跑虚拟机 export …...

Vue 3前沿生态整合:WebAssembly与TypeScript深度实践

一、Vue 3 WebAssembly&#xff1a;突破性能天花板 01、WebAssembly&#xff1a;浏览器中的原生性能 WebAssembly&#xff08;Wasm&#xff09;是一种可在现代浏览器中运行的二进制指令格式&#xff0c;其性能接近原生代码。结合Vue 3的响应式架构&#xff0c;我们可以在前端…...

Linux系统下安装配置 Nginx

Windows Nginx https://nginx.org/en/download.htmlLinux Nginx https://nginx.org/download/nginx-1.24.0.tar.gz解压 tar -zxvf tar -zxvf nginx-1.18.0.tar.gz #解压安装依赖&#xff08;如未安装&#xff09; yum groupinstall "Development Tools" -y yum…...

Kotlin 中集合遍历有哪几种方式?

1 for-in 循环&#xff08;最常用&#xff09; val list listOf("A", "B", "C") for (item in list) {print("$item ") }// A B C 2 forEach 高阶函数 val list listOf("A", "B", "C") list.forEac…...

图像卷积OpenCV C/C++ 核心操作

图像卷积&#xff1a;OpenCV C 核心操作 图像卷积是图像处理和计算机视觉领域最基本且最重要的操作之一。它通过一个称为卷积核&#xff08;或滤波器&#xff09;的小矩阵&#xff0c;在输入图像上滑动&#xff0c;并对核覆盖的图像区域执行元素对应相乘后求和的运算&#xff…...

LiveGBS作为下级平台GB28181国标级联2016|2022对接海康大华宇视华为政务公安内网等GB28181国标平台查看级联状态及会话

LiveGBS作为下级平台GB28181国标级联2016|2022对接海康大华宇视华为政务公安内网等GB28181国标平台查看级联状态及会话 1、GB/T28181级联概述2、搭建GB28181国标流媒体平台3、获取上级平台接入信息3.1、向下级提供信息3.2、上级国标平台添加下级域3.3、接入LiveGBS示例 4、配置…...

leetcode17.电话号码的字母组合:字符串映射与回溯的巧妙联动

一、题目深度解析与字符映射逻辑 题目描述 给定一个仅包含数字 2-9 的字符串 digits&#xff0c;返回所有它能表示的字母组合。数字与字母的映射关系如下&#xff08;与电话按键相同&#xff09;&#xff1a; 2: "abc", 3: "def", 4: "ghi", …...

Gartner《2025 年软件工程规划指南》报告学习心得

一、引言 软件工程领域正面临着前所未有的变革与挑战。随着生成式人工智能(GenAI)等新兴技术的涌现、市场环境的剧烈动荡以及企业对软件工程效能的更高追求,软件工程师们必须不断适应和拥抱变化,以提升自身竞争力并推动业务发展。Gartner 公司发布的《2025 年软件工程规划…...

数据库 | 使用timescaledb和大模型进行数据分析

时序数据库&#xff1a;timescaledb 大模型&#xff1a;通义千问2.5 对话开始前提示词&#xff1a; 我正在做数据分析&#xff0c;以下是已知信息: 数据库:timescaledb&#xff0c;表名&#xff1a;dm_tag_value&#xff0c;tag_name列是位号名&#xff0c;app_time列是时间,…...

快速阅读源码

Doxygen 轻松生成包含类图、调用关系图的 HTML 和 PDF 文档, Graphviz 可以用来生成类图、调用图 sudo apt-get install doxygen graphviz brew install doxygen graphviz#HTML 文档&#xff1a; open docs/html/index.html一、Doxyfile配置: Doxyfile 文件 doxygen Doxyfile P…...

linux创建虚拟网卡和配置多ip

1.展示当前网卡信息列表&#xff1a; linux上&#xff1a; ip a ifconfigwindows上&#xff1a; ipconfig 2.创建虚拟网卡对&#xff1a; sudo ip link add name veth0 type veth peer name veth1 在 ip link add 命令中&#xff0c;type 参数可以指定多种虚拟网络设备类型&…...

Java Class类文件结构

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/literature?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;…...

AI问答-Vue3+TS:reactive创建一个响应式数组,用一个新的数组对象来替换它,同时保持响应性

在 Vue 3 中&#xff0c;当你使用 reactive 创建一个响应式数组后&#xff0c;如果你想用一个新的数组对象来替换它&#xff0c;同时保持响应性&#xff0c;有几种方法可以实现 方法一&#xff1a;直接替换整个数组&#xff08;推荐&#xff09; import { reactive } from vu…...

quasar electron mode如何打包无边框桌面应用程序

预览 开源项目Tokei Kun 一款简洁的周年纪念app&#xff0c;现已发布APK&#xff08;安卓&#xff09;和 EXE&#xff08;Windows&#xff09; 项目仓库地址&#xff1a;Github Repo 应用下载链接&#xff1a;Github Releases Preparation for Electron quasar dev -m elect…...

【HW系列】—Windows日志与Linux日志分析

文章目录 一、Windows日志1. Windows事件日志2. 核心日志类型3. 事件日志分析实战详细分析步骤 二、Linux日志1. 常见日志文件2. 关键日志解析3. 登录爆破检测方法日志分析核心要点 一、Windows日志 1. Windows事件日志 介绍&#xff1a;记录系统、应用程序及安全事件&#x…...

VIN码识别解析接口如何用C#进行调用?

一、什么是VIN码识别解析接口&#xff1f; VIN码不仅是车辆的“身份证”&#xff0c;更是连接制造、销售、维修、保险、金融等多个环节的数字纽带。而VIN码查询API&#xff0c;正是打通这一链条的关键工具。 无论是汽车电商平台、二手车商、维修厂&#xff0c;还是保险公司、金…...

动态规划之网格图模型(一)

文章目录 动态规划之网格图模型&#xff08;一&#xff09;LeetCode 64. 最小路径和思路Golang 代码 LeetCode 62. 不同路径思路Golang 代码 LeetCode 63. 不同路径 II思路Golang 代码 LeetCode 120. 三角形最小路径和思路Golang 代码 LeetCode 3393. 统计异或值为给定值的路径…...

PCB设计实践(三十)地平面完整性

在高速数字电路和混合信号系统设计中&#xff0c;地平面完整性是决定PCB性能的核心要素之一。本文将从电磁场理论、信号完整性、电源分配系统等多个维度深入剖析地平面设计的关键要点&#xff0c;并提出系统性解决方案。 一、地平面完整性的电磁理论基础 电流回流路径分析 在PC…...

x86_64-apple-ios-simulator 错误

Could not find module ImagePicker for target x86_64-apple-ios-simulator; found: arm64, arm64-apple-ios-simulator 解决方案一 添加 arm64。 搜索 Excluded Architectures &#xff0c;添加arm64 解决方案二 在Podfild中&#xff0c;添加佐料。在文件的最下方添加如…...

使用ray扩展python应用之流式处理应用

流式处理就是数据一来&#xff0c;咱们就得赶紧处理&#xff0c;不能攒批再算。这里的实时不是指瞬间完成&#xff0c;而是要在数据产生的那一刻&#xff0c;或者非常接近那个时间点&#xff0c;就做出响应。这种处理方式&#xff0c;我们称之为流式处理。 流式处理的应用场景…...