当前位置: 首页 > article >正文

大模型的探索与实践-课程笔记(四):Agent与Multi-Agent

Take-away MessagesAgent智能体让大模型能够调用工具规划、记忆、行动Manus / OpenManus在本地部署OpenManusMulti-Agent任务分解、任务联动Coze利用Coze构建智能体1.1 从大模型LLM到智能体Agent1. 概念演进为什么需要 AgentPrompt 角色扮演的局限传统的 Prompt如“你现在是唐代诗人李白...”只能改变模型的输出风格和分布但它没有行动能力。纯 LLM 无法帮你“定闹钟”、“自动扫码签到”。Agent 的本质Agent 是拓宽了大模型边界的系统。它以大模型为“大脑”赋予其自主调用工具的能力使其能够与外部环境交互从而完成复杂的现实任务。如果只用prompt有哪些任务无法完成AI 无法直接帮你设定闹铃AI 无法直接帮你课堂签到如何让AI更加自主的完成任务 -- agent2. Agent 与传统 Workflow 的区别Workflow工作流流程是定死的例如必然先查文献 → 再写摘要 → 再写正文缺乏灵活性。Agent智能体流程是动态且自主的。大模型先给出总规划在执行第一步后如果发现结果不好或方向不对大脑会自主修正下一步的计划无需人类干预。1.2 Agent 的三大核心能力一个合格的 Agent 必须具备以下三大支柱能力缺一不可1.2.1 能力一规划Planning / 感知与决策感知多模态能力要求 Agent 既能看懂文本也能处理图像、语音甚至能统一理解不同软件工具的“工作语言”。将多种模态“翻译成同一语言”映射到同一空间将多种模态“拼接在一起”决策任务拆解AI根据既定模糊目标自主拆解出子任务判断执行顺序并应对潜在变量。大模型能够将模糊的目标转化为可落地的结构化方案。举例“制定北京三日游计划” ——查交通 → 查酒店 → 排景点 → 算预算1.2.2 能力二行动Action调用工具Agent 可以调用 API 或运行程序。如调用 Python 环境执行代码Cursor/Trae 的底层逻辑或调用网络搜索接口。大模型直接输出程序代码有问题用大模型调用python大模型可能不知道最新的论文用大模型调用arxiv的API多步任务与思维链CoT, Chain of Thought处理复杂任务时Agent 需要拆解步骤。Zero-shot CoT只需在提示词加入“Lets think step by step”。Few-shot CoT在给模型的样例中不仅给答案还写出详细的中间推导过程。问题目前学界正在反思大模型生成的 CoT 究竟是它“真的在思考”还是它只是在生成“看起来像在思考”的文本1.2.3 能力三记忆Memory解决早期大模型“聊几句就忘了自己是谁”的健忘症。为什么AI突然“忘了”自己是谁 ——大模型对长文本任务表现往往不够好忘记自己的身份信息忘记以往的对话信息对于多轮对话来说不明确依赖对话历史的单纯的交互难以保持角色设定的一致性以及对于上下文的理解短期记忆对话历史压缩将System Prompt系统预设如“你是福尔摩斯”Chat History历史对话打包送给模型。由于目前长文本技术的发展大模型可轻松处理 200k tokens短期记忆问题已基本解决。工程实现中引入了对话记忆机制。我们可以选择将对话历史直接插入提示词中但随着对话的积累如何写入、管理记忆、构造提示词又引发了新的疑问。长期记忆Memory Bank / RAG面对超长的交互如阅读成千上万行代码单纯增加上下文窗口不够用。需要使用专门的机制将历史对话总结成事件和用户画像存入外部数据库需要时通过 RAG检索增强生成提取相关记忆。2.1 多智能体Multi-Agent的设计哲学1. 什么是多智能体Multiagent通过赋予单个agent专门的职责设定构建agents之间的通信 从而提供任务分解和专业化分而治之降低单个任务的复杂性提供鲁棒性与容错性例如代码审查模拟复杂系统模拟真实世界的社会、经济或组织动态2. 为什么需要多智能体单一模型的局限不够专精如果一个事物想越“通用”它在垂直领域往往表现就越差什么都懂一点 什么都不精通。分而治之Multi-Agent 类似于 Agent 领域的CoT。通过赋予不同 Agent专门的职责设定让它们分别做自己最擅长的事然后相互通信从而降低单个复杂任务的错误率。对抗与协作机制例如写代码任务不要让一个模型直接输出。可以设计两个 Agent一个Programmer程序员负责写代码一个Inspector审查员负责找 Bug 并出教程两者自动循环纠错直到输出完美结果。动手来制作属于自己的agent吧2.2 Coze (扣子) 进阶开发Coze是字节跳动推出的一站式 AI 应用开发平台支持无代码 / 低代码方式通过拖拽模块、集成插件与知识库等功能快速构建 AI 智能体或应 用并可发布至多平台或集成到业务系统大幅降低 AI 开发门槛。本节课手把手拆解了在 Coze 创建高质量 Agent 的底层参数调优与避坑逻辑1. Prompt 的结构化与优化自动优化功能不要自己干想先写出简单需求如写一首周杰伦曲风的歌直接点击左上角“自动优化提示词”Coze 会自动帮你扩写成标准的【角色设定】【技能列表】【限制条件】的结构化 Prompt。2. 模型选择与参数精调选择合适的模型尤其注意是否需要视觉能力设置上下文轮数与最大回复长度Top P多样性控制数值越大模型生成的词汇越多样、越有创意数值越小模型会截断低概率词汇生成越死板但精确。写诗、写歌、做游戏调大到0.9左右偏创意写严肃论文、搜资料调小到0.3~0.4偏精确。重复句惩罚Repetition Penalty原理大模型尤其带深度思考的模型极易陷入“车轱辘话”死循环。实操建议务必添加适量惩罚值如 0.01~0.02迫使模型输出新信息。上下文轮数Context Turns文字游戏类 Agent 必须调高否则聊到后面模型会忘记开头的人设和规则。3. MCP 插件使用不要贪多给大模型挂载的工具不是越多越好 插件过多会导致大模型不知道该掉用哪一个最终报错或装死。检查 API依耐性很多第三方插件事实上需要你在参数里填入自己的Base URL或API Key如果不填调用必定失败体现为模型拒绝输出结果或报超时错。2.3 Workflow工作流的搭建与逻辑1. 什么是工作流将多个大模型、插件通过可视化连线输入 → 输出组合在一起。2. Agent 与 Workflow 的核心区别Agent告诉它有哪些“技能插件/模型”它自己动脑子决定先用哪个、后用哪个。Workflow把流程定死了必须按你连的线一步步走。何时用工作流对于流程极度固定、步骤明确的任务如长文分段写作、固定格式打分用 Workflow 更稳定可避免 Agent 的“想太多”导致的幻觉。注意Workflow 必须“发布”后才能在智能体中稳定供其自主调用。2.4 底层架构对比在处理复杂任务时三种架构的能力对比架构模式运行机制核心能力特征优缺点对比Single LLM (单大模型)原生对话靠 Prompt 引导任务无外部工具无分工最弱。无法融合不同专精的模型如用模型A写词、模型B编代码。Workflow (工作流)节点被连线“定死”按顺序强行执行No Planning (无规划能力)优流程绝对可控无视模型脾气。缺一旦中间一个节点挂了后续全部完蛋不能跳步。Multi-Agent (多智能体)多个专精 Agent 相互配合共同完成任务Has Planning (有自主规划能力)优灵活性极高。遇到某个 Agent 报错卡死它能自主跳步/绕路找别的办法完成任务。缺不太听话有时不按预期路线走。延伸前沿概念世界模型World Model与 Sora世界模型World Model的定义判断一个 AI 是否具有世界模型核心在于它是否感知并掌握了人类世界的物理规律Physics。大模型的痛点传统的文本大模型不知道“苹果松手会掉在地上”它只是概率预测。Sora 的突破在视频生成中展现了极强的空间能力、时间连续性和物理规律流体碰撞、遮挡关系。它不仅是在画图而是在大脑中“建构了一个符合物理常识的三维世界”。核心 AI 工具本节课重点展示并解析了多个应用级与底层 AI 工具/模型汇总如下工具/模型名称类别核心功能与特色应用领域Manus商业级 Agent现象级多功能聚合智能体。能根据模糊指令自主拆解任务、调研资料、编写代码并生成最终产物如开题报告、小游戏、PPT。注意目前国内IP受限且价格昂贵。全自动任务闭环日常办公、简单游戏开发、资料汇总等自动化处理。OpenManus开源 Agent 框架Manus 的开源简易复现版。支持本地部署可接入第三方大模型 API如 DeepSeek来实现类似 Manus 的自主任务规划与执行。本地化 Agent 开发与部署适合开发者自定义、低成本体验 Agent 能力。CLIP多模态模型方案OpenAI 提出的对比学习模型。将“图片”和“描述图片的文字”映射到同一个“概念空间”翻译成同一语言实现跨模态理解。感知与识别为 Agent 提供基础的图文匹配与多模态感知能力。Flamingo多模态模型方案DeepMind 提出的模型。在冻结的语言模型中插入交叉注意力层将多种模态“拼接”在一起实现强大的少数样本学习和视觉理解。视觉理解赋予大模型Agent大脑“看”的能力。ArXiv API学术工具接口学术预印本平台 ArXiv 提供的接口。Agent 可通过调用该 API直接获取最新的未排版学术论文如 LaTeX 源码解析准确率远高于直接读取 PDF。学术检索与工具调用Agent 获取最新科研前沿数据的核心抓手。工具/项目名称工具类别核心功能与特色在本课/应用领域的场景Coze (扣子)智能体开发平台字节跳动推出的一站式低代码 AI 开发平台。支持插件调用MCP、工作流编排和多平台一键发布。搭建专属 Agent如带人设的单人剧本杀、测试问卷、自动做歌/写文案机器人。Suno / Suno AIAI 音乐生成强大的音乐生成模型所作歌曲具极高“流行度”和“抓耳感”。可通过 API 接入 Coze 成为插件。音乐创作根据大模型写出的偏好、歌词全自动谱曲并演唱。SoraAI 视频生成大模型具备惊人的“世界模型”能力能理解物体在三维空间的关系与物理碰撞规律生成电影级运镜视频。视频自动化生成输入 Prompt 生成高逼真度物理规律和人物互动的短片。AI Town / 生成式智能体多智能体模拟环境斯坦福/港大等研究的项目。在一个电子小镇中投放几百个拥有独立性格、记忆的 Agent让其自主社交、生活。社会学/经济学模拟无需真人实验通过 Multi-Agent 模拟人类社群行为。Claude大语言模型被老师特别提及在纯文本/非图形界面的 Prompt 编写和深度逻辑表现上体验甚至优于 GPT。强逻辑文本处理与代码辅助。

相关文章:

大模型的探索与实践-课程笔记(四):Agent与Multi-Agent

Take-away MessagesAgent智能体 让大模型能够调用工具 规划、记忆、行动 Manus / OpenManus 在本地部署OpenManusMulti-Agent 任务分解、任务联动 Coze 利用Coze构建智能体1.1 从大模型(LLM)到智能体(Agent)1. 概念演进&#xff1…...

【马斯克系 | AI版图】xAI合并SpaceX之后,紧接着是Cursor——1.25万亿美元之后,马斯克还在买什么

一、合并全景:1.25万亿美元背后的估值逻辑 从180亿到2500亿:18个月估值十倍跃迁 2024年5月,xAI的B轮融资在行业内引发过一轮讨论。 彼时距离这家公司成立才14个月,旗下核心产品Grok-1刚刚开源3140亿参数模型,市场评…...

机械识图:基本视图

在机械图样的表示法中,可分为基本表示法和特殊表示法。 基本表示法:图样画法是以真实投影为基础的画法,但画出的图形又不完全是机件(工程形体)的真实投影。 特殊表示法:图样画法是采用特殊的规定画法来表示…...

实测PCIE 3.0 x8带宽逼近极限?手把手调试AXI Bridge实现6.6GB/s传输与4GB/s落盘

PCIe 3.0 x8极限带宽实战:AXI Bridge调优实现6.6GB/s传输与4GB/s落盘 当数据洪流遇上硬件瓶颈,每一位追求极致性能的工程师都面临着同样的挑战:如何在有限带宽下榨干每一滴传输潜力。本文将带你深入PCIe 3.0 x8的带宽优化前线,从硬…...

MyBatis-Plus 3.5升级后,分页插件PaginationInterceptor报错?手把手教你换成PaginationInnerInterceptor

MyBatis-Plus 3.5升级后分页插件报错全解析:从问题定位到完美修复 最近在升级MyBatis-Plus到3.5版本后,不少开发者发现原本运行良好的分页功能突然报错,控制台抛出各种异常信息。这实际上是MyBatis-Plus团队对分页机制进行了重构导致的兼容性…...

告别系统休眠困扰:MouseJiggler鼠标模拟工具的完整使用指南

告别系统休眠困扰:MouseJiggler鼠标模拟工具的完整使用指南 【免费下载链接】mousejiggler Mouse Jiggler is a very simple piece of software whose sole function is to "fake" mouse input to Windows, and jiggle the mouse pointer back and forth.…...

2026年Context Engineering完全指南:上下文即代码

"Prompt Engineering 已死,Context Engineering 万岁。"这句在 AI 工程圈流传的话,道出了一个真相:决定 LLM 输出质量的,不是几句巧妙的措辞,而是你如何系统性地管理模型的上下文窗口。本文从理论到工程实践…...

Tools for Humanity 宣布与布鲁诺·马尔斯巡演合作遭否认,Concert Kit 将改在杰瑞德·莱托乐队巡演推出

眼球扫描初创公司宣布合作巡演却遭否认,Concert Kit改在杰瑞德莱托乐队巡演推出山姆阿尔特曼创立的眼球扫描初创公司 Tools for Humanity 上周宣布,一款名为 Concert Kit 的新产品将首先在布鲁诺马尔斯最新录音室专辑《The Romantic》的世界巡演中推出&a…...

Kubernetes 集群服务发现机制详解

Kubernetes 集群服务发现机制详解 在现代云原生架构中,服务发现是微服务通信的核心环节。Kubernetes 作为容器编排的事实标准,提供了高效且灵活的服务发现机制,帮助开发者在动态环境中实现服务间的稳定通信。本文将深入解析 Kubernetes 的服…...

从手机拍照到NeRF建模:相机标定参数(内参/外参)到底在忙活啥?

从手机拍照到NeRF建模:相机标定参数(内参/外参)到底在忙活啥? 当你用手机拍下一张照片时,是否注意到画面边缘的直线有时会弯曲?或者在使用AR应用时,虚拟物体为何能稳稳"坐"在桌面上&a…...

番茄小说离线阅读神器:fanqienovel-downloader让你的数字图书馆永不消失

番茄小说离线阅读神器:fanqienovel-downloader让你的数字图书馆永不消失 【免费下载链接】fanqienovel-downloader 下载番茄小说 项目地址: https://gitcode.com/gh_mirrors/fa/fanqienovel-downloader 你是否曾经遇到过这样的情况?深夜追更的小说…...

清华PPT模板终极指南:3分钟打造专业学术汇报演示

清华PPT模板终极指南:3分钟打造专业学术汇报演示 【免费下载链接】THU-PPT-Theme 清华主题PPT模板 项目地址: https://gitcode.com/gh_mirrors/th/THU-PPT-Theme 还在为学术汇报的PPT设计而烦恼吗?THU-PPT-Theme项目为你提供了一套完整的清华大学…...

如何快速上手开源游戏资源编辑器:Harepacker-resurrected完整实战指南

如何快速上手开源游戏资源编辑器:Harepacker-resurrected完整实战指南 【免费下载链接】Harepacker-resurrected All in one .wz file/map editor for MapleStory game files 项目地址: https://gitcode.com/gh_mirrors/ha/Harepacker-resurrected Harepacke…...

终极指南:如何将闲置电视盒子改造为高性能Armbian服务器

终极指南:如何将闲置电视盒子改造为高性能Armbian服务器 【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, s905w, s905, s905l, rk3588…...

5分钟快速上手:Unlock-Music浏览器音乐解密终极指南

5分钟快速上手:Unlock-Music浏览器音乐解密终极指南 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: https:/…...

除了HTB,还有哪些适合新手的网络安全靶场?VulnHub、TryHackMe、PentesterLab横向对比

网络安全新手靶场全指南:从VulnHub到TryHackMe的深度横评 当我在2019年第一次接触网络安全实战训练时,面对琳琅满目的在线靶场平台完全不知所措。作为过来人,我深刻理解新手在选择第一个训练平台时的困惑——HackTheBox(HTB&#…...

Koodo Reader:如何用AI智能助手打造你的终极数字阅读体验

Koodo Reader:如何用AI智能助手打造你的终极数字阅读体验 【免费下载链接】koodo-reader A modern ebook manager and reader with sync and backup capacities for Windows, macOS, Linux, Android, iOS and Web 项目地址: https://gitcode.com/GitHub_Trending/…...

如何通过PDown百度网盘高速下载器免费突破限速:终极指南

如何通过PDown百度网盘高速下载器免费突破限速:终极指南 【免费下载链接】pdown 百度网盘下载器,2020百度网盘高速下载 项目地址: https://gitcode.com/gh_mirrors/pd/pdown PDown是一款完全免费的百度网盘高速下载工具,无需登录账号即…...

【电赛核心代码开源】GPS+IMU 航点导航,小车为什么越跑越偏?一文讲透差速运动学与状态机

前言: 在室外寻迹、物流搬运等电赛题目中,经常要求小车按顺序依次到达几个指定的 GPS 坐标点(路书)。 很多同学把 GPS 解算了,JY901S 的航向角(Yaw)也读出来了,目标方位角也算对了。…...

DL/T 645 协议实战解析:从帧结构到数据采集

1. DL/T 645协议基础入门 第一次接触DL/T 645协议时,我也被那些专业术语搞得一头雾水。但实际用起来才发现,这个协议就像电力行业的"普通话",专门用来让智能电表和采集设备顺畅交流。简单来说,它就是一套规定了电表怎么…...

从农田到屏幕:手把手教你用Python和SNAP批量处理哨兵2号影像,估算作物叶面积指数

从农田到屏幕:手把手教你用Python和SNAP批量处理哨兵2号影像,估算作物叶面积指数 当清晨的阳光洒在万亩麦田上,每一片叶子都在进行着光合作用的精密计算。对于现代农业科技从业者而言,这片绿色海洋中隐藏的数据密码——叶面积指数…...

农业边缘计算新范式(Docker 27原生支持ARM64+实时数据流容器化大揭秘)

第一章:农业边缘计算新范式与Docker 27演进全景农业智能化正从中心云向田间地头迁移,边缘计算不再仅是“补充”,而是成为精准灌溉、病虫害实时识别、农机协同调度的核心基础设施。在低带宽、高时延、设备异构的农田环境中,轻量、可…...

5步终极指南:用FanControl打造静音高效的电脑散热系统

5步终极指南:用FanControl打造静音高效的电脑散热系统 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa…...

Aurora数据引擎:自动驾驶ML工作流加速架构解析

1. 自动驾驶机器学习工作流加速引擎:Aurora数据引擎架构解析在自动驾驶技术研发领域,机器学习模型的迭代效率直接决定了技术突破的速度。作为行业领先的自动驾驶公司,Aurora创新性地构建了名为"数据引擎"的ML编排层,将模…...

LitCAD免费CAD软件终极指南:如何用开源工具完成专业绘图设计

LitCAD免费CAD软件终极指南:如何用开源工具完成专业绘图设计 【免费下载链接】LitCAD A very simple CAD developed by C#. 项目地址: https://gitcode.com/gh_mirrors/li/LitCAD 您是否在寻找一款完全免费、功能强大且易于上手的CAD设计软件?Lit…...

抖音无水印下载工具:从零开始构建个人视频资源库

抖音无水印下载工具:从零开始构建个人视频资源库 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

事件相机数据处理避坑指南:dv-processing库中EventStore切片与合并的5个高效技巧

事件相机数据处理避坑指南:dv-processing库中EventStore切片与合并的5个高效技巧 在高速视觉领域,事件相机以其微秒级时间分辨率和动态范围优势,正在重塑机器视觉的边界。而当我们真正开始处理这些海量事件流数据时,dv.EventStore…...

读者 30+ 问合集:从“多 Agent 调度不准“到 AI 团队协作避坑指南

上篇文章评论区积攒了几十个问题,挑了最高频的几类,一篇讲完。从概念混淆、环境配置、到多角色协作、国内模型接入,系统梳理。 一、最容易混的三个概念(搞清楚这个,80% 的问题就消解了) 很多朋友把下面三件…...

如何快速搭建Python管理后台:SQLAdmin终极解决方案

如何快速搭建Python管理后台:SQLAdmin终极解决方案 【免费下载链接】sqladmin SQLAlchemy Admin for FastAPI and Starlette 项目地址: https://gitcode.com/gh_mirrors/sq/sqladmin 你是否曾为FastAPI或Starlette项目的数据管理界面而烦恼?每次都…...

DeepPCB:1500对高质量PCB缺陷检测数据集快速入门指南

DeepPCB:1500对高质量PCB缺陷检测数据集快速入门指南 【免费下载链接】DeepPCB A PCB defect dataset. 项目地址: https://gitcode.com/gh_mirrors/de/DeepPCB 还在为找不到高质量的PCB缺陷检测数据集而烦恼吗?DeepPCB为您提供了一个工业级的深度…...