当前位置: 首页 > article >正文

从零到手搓一个Agent:AI Agents新手入门精通

这一天你的女朋友问你假设我们有女朋友宝宝什么是Agent啊Agent和LLM有什么区别呀最近大家都在说的Agent究竟是什么包括很多文章都在写的Agent还有之前谷歌发布的Agents白皮书究竟是什么对我们有什么帮助对我们有什么影响呢现在编者专门做了一个系列从最简单的讲起解开这个迷雾这个系列的教程会帮助你了解基本概念并且能够手搓一系列的agent那么chatgpt是Agent还是LLM有了LLM为什么还需要Agent呢这次我们就把概念弄清楚以及有什么用讲清楚一、LLMs的局限与Agents的诞生结合ChatGPT举例你或许已经体验过 ChatGPT 的强大对话能力它能流畅地与你聊天、回答问题甚至帮你写诗、写代码。这背后正是 LLMs大型语言模型在发挥作用。LLMs 就像一个超级博览群书的“大脑”它掌握了海量的文本知识可以根据你的提问生成相应的文本回复那么为什么说 LLMs 仍然存在局限性呢 让我们以 ChatGPT 为例来看1. 知识的滞后性举例 你问 ChatGPT “今天的天气怎么样” 或者 “最新的股票价格是多少”它很可能无法给出准确的回答。因为它所拥有的知识来源于训练时的数据无法实时获取最新的信息。它可能告诉你的是前几天的天气或者很久之前的股票行情。解释 LLMs 的知识就像一本厚厚的“旧书”书里记载着很多知识但无法知道书出版之后发生的新鲜事。2. 无法与外界交互举例 你让 ChatGPT “帮我预订一张明天的机票”它会很热情地告诉你预订机票需要哪些步骤却无法实际帮你预订。你让它 “帮我发送一封邮件给同事”它也只能为你写好邮件内容而不能帮你发送出去。解释 LLMs 只能进行文本理解和生成它就像一个“只会说”的人但没有“手脚”去执行实际操作。3. 缺乏自主行动能力举例 你问 ChatGPT “如何制定一个完美的旅行计划”它会给出你很多建议例如选择目的地、预订酒店、规划行程等等。但是它不会主动帮你把这些都安排好。它只是在回答你的问题而不是主动帮你解决问题。解释 LLMs 只能被动地接收指令然后给出回答无法根据目标自主规划行动。就像一个“听话的助手”但是没有自己的想法和主动性。二、为了突破这些限制Agents智能体应运而生。Agents 的核心思想给 LLMs 配备“手脚”和“大脑”我们可以将 Agents 想象成一个升级版的 ChatGPT它不仅具备强大的语言理解和生成能力还拥有了“手脚”工具 Agents 可以利用各种工具例如搜索引擎、数据库查询工具、邮件发送工具与外界互动获取信息、执行操作。就像给 LLMs 配备了可以操作各种工具的 “手脚”。“大脑”编排层 Agents 具备推理和规划能力可以根据目标自主规划行动并合理地调用各种工具。就像给 LLMs 配备了一个可以自主思考和决策的“大脑”。Agents 与 LLMs 的区别特性LLMs (例如 ChatGPT)Agents (智能体)核心能力语言理解和生成语言理解、推理规划、工具使用、自主行动知识来源训练数据训练数据 实时信息 外部知识库与外界交互无法直接交互可以通过工具与外界交互行动能力无法执行实际操作可以根据目标自主执行操作解决问题方式被动回答问题主动分析问题、规划行动、解决问题例如ChatGPT 可以回答你的问题但无法帮你订机票或查询天气Agent 可以帮你预订机票、查询天气、发送邮件并根据你的需求主动规划行程简而言之LLMs 就像一个知识渊博的“问答机器人”你问什么它答什么。Agents 就像一个“智能助手”它不仅能回答你的问题还能主动帮你完成任务。通过这样的解释希望能够帮助读者更好地理解 LLMs 的局限性以及 Agents 的优势和价值。Agents 的出现标志着人工智能正朝着更智能、更强大的方向发展。知识的局限性 LLMs的知识来源于训练数据无法获取实时的外部信息这使得它在处理需要最新资讯的任务时显得力不从心。行动的局限性 LLMs只能进行文本生成和理解无法与外部环境交互更无法执行实际操作例如查询数据库或发送邮件。为了克服这些局限谷歌的研究人员在《New whitepaper Agents》中详细阐述了“Agent”的概念。他们将LLMs与工具和编排层相结合赋予了LLMs自主行动的能力使其能够像一个真正的“智能体”一样工作。三、Agents的核心组件智能体的“三大支柱”一个完整的Agent通常由三个核心组件构成它们相互协作共同支撑起Agent的智能行为1、 模型 (Model): Agent 的“大脑”角色 负责理解用户输入、进行推理和规划并选择合适的工具执行任务。类型 ReAct、Chain-of-Thought、Tree-of-Thought等模型提供了不同的推理框架帮助Agent进行多轮交互和决策。重要性 模型是Agent的核心其推理能力直接决定了Agent的行动效率和准确性。2、 工具 (Tools): Agent 与外界交互的“桥梁”角色允许Agent访问外部数据和服务执行各种任务。类型 可以是各种API例如数据库查询、搜索引擎、代码执行器、邮件发送器等。重要性工具极大地扩展了Agent的能力使其能够处理更复杂的任务。3、编排层 (Orchestration Layer): Agent 的“指挥中心”角色 负责管理Agent的内部状态协调模型和工具的使用并根据目标指导Agent的行动。类型 可以使用各种推理框架如ReAct和Chain-of-Thought等协助Agent进行规划和决策。重要性 编排层是Agent的“指挥中心”确保各个组件协同工作最终实现预定目标。四、Agents的运作机制从输入到输出Agent 的运作流程可以概括为以下几个步骤接收输入 接收用户的指令或问题。理解输入 模型理解用户的意图并提取关键信息。推理规划 模型根据用户输入和当前状态进行推理和规划确定下一步行动。选择工具 模型根据目标选择合适的工具。执行行动 Agent使用工具执行行动例如查询数据库、发送邮件等。获取结果 Agent获取工具执行的结果。输出结果 Agent将结果输出给用户或进行下一步行动。相较于传统的LLMsAgents 具备以下显著优势知识扩展 通过工具Agent可以访问实时信息和外部知识库突破了训练数据的限制提供更准确和可靠的信息。自主行动 Agent 可以根据目标自主决策和行动无需人工干预大大提高了效率和灵活性。多轮交互 Agent 可以管理对话历史和上下文进行多轮交互提供更自然和流畅的用户体验。可扩展性 Agent 可以通过添加新的工具和模型不断扩展其功能和应用范围。五、Agents的应用从智能客服到虚拟助手Agents 的应用场景非常广泛以下仅列举部分智能客服 自动回答用户问题、处理订单、解决客户问题。个性化推荐 根据用户兴趣和行为推荐商品、内容、服务等。虚拟助手 帮助用户管理日程、预订行程、发送邮件等。代码生成 根据用户需求自动生成代码。智能创作 创作诗歌、小说、剧本等。知识图谱构建 从文本中提取知识构建知识图谱。Agents的开发工具从LangChain到Vertex AI为了方便开发者构建 AgentsGoogle 提供了多种工具和平台LangChain 一个开源库方便开发者将LLMs与工具和编排层结合构建功能强大的Agents。LangGraph 一个开源库帮助开发者构建和可视化 Agents提供图形化界面方便设计和测试。Vertex AI 一个云平台提供各种AI工具和服务如Vertex Agent Builder、Vertex Extensions、Vertex Function Calling等帮助开发者快速构建和部署 Agents。Agents 的未来充满无限可能技术发展将推动 Agents 走向更智能化和强大更先进的模型 更强大的语言模型将带来更复杂的推理和规划能力。更丰富的工具 更多种类的工具将为 Agent 提供更丰富的交互方式例如自然语言处理、图像识别、语音识别和机器人控制等。更智能的编排层 更智能的编排层将更好地协调模型和工具提高 Agent 的效率和灵活性。Agent Chaining 更多专业化的 Agents 将协同工作解决更复杂的问题。多模态交互 Agent 将能够处理多种模态数据如文本、图像和语音带来更丰富的用户体验。人机协作 Agent 将与人类更紧密地合作共同完成更复杂的任务。六、结语AgentAI的未来Agents 代表着生成式AI模型的进阶形态它们拥有自主行动能力能够利用工具与外界交互并根据目标进行决策具有更广泛的应用范围和更强大的能力。随着技术的不断发展Agents 将会改变我们的生活和工作方式并推动人工智能进入新的发展阶段。未来Agent 将成为人工智能发展的重要方向为我们带来更智能、更便捷的未来。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容

相关文章:

从零到手搓一个Agent:AI Agents新手入门精通

这一天,你的女朋友问你(假设我们有女朋友),宝宝,什么是Agent啊,Agent和LLM有什么区别呀,最近大家都在说的Agent究竟是什么,包括很多文章都在写的Agent,还有之前谷歌发布的…...

第2章 点亮你的LED 2.1 2.2 2.3

本章的标题是点亮LED,虽然任务很简单,但是需要了解的单片机基础知识却很多,特别是对于初学者,刚开始要在头脑中建立一个单片机的概念,然后通过点亮一个LED小灯来增加初学者对单片机的兴趣和自信。2.1单片机的内部资源在…...

设备安装工程:工业与建筑系统高效运行的关键环节

一、什么是设备安装工程?设备安装工程是工业建设和建筑机电工程中的重要组成部分,主要指将各类机械设备、电气设备、生产设备以及自动化系统按照设计要求进行运输、定位、安装、调试并投入运行的全过程。设备安装不仅影响设备的运行效率,还直…...

别再写“负责xx开发”了,用数字让HR在6秒内看到你的“战力”

前言:你的简历,HR真的会看吗? 先来看一组残酷的数据:HR平均阅读一份简历的时间只有5.8秒,83%的淘汰发生在前10秒之内。这意味着什么?意味着你熬夜三天写出来的两页纸,在HR眼中只是一次“扫一眼”…...

在深圳宝安实验室做落球冲击试验

一、测试介绍 落球冲击测试是将规定质量的球从不同高度落下,或在规定高度下将不同质量的球落下,以测定胶接试样在承受落球冲击击下产生裂痕所需的能量的试验。仪器采用标准试验钢球,钢球电磁吸挂、自动释放,可有效地避免了人为因…...

微信公众号文章保存工具-支持图文

介绍: 这是本人因一时所需即兴写的小软件。功能很简单,根据WX公众号文章链接可以把文章的文字、图片下载到本地,可以保存为HTML网页格式、DOC文档格式,方便归档保存。 现在提供给朋友们使用,有这方面需要的朋友可以下…...

5分钟完成 RS6013A 上位机连接与第一个示例程序(含截图)

在雷达技术教学与科研中,FMCW(调频连续波)雷达因其结构简单、测距精度高、无距离盲区等优点,已成为毫米波雷达应用的主流方案。然而,许多初学者在面对雷达硬件时,往往被复杂的寄存器配置、数据协议和信号处…...

跨平台符号表生成规则详解:Windows/Linux/macOS/OHOS

本文详细介绍 C/C 项目在各平台的符号表生成策略,包括 MSVC PDB 生成、GCC/Clang DWARF 生成、以及 strip 操作的原子性保证。一、各平台符号格式对比平台编译器符号格式文件位置备注WindowsMSVCPDB (Program Database)与 DLL 分离无需 stripLinuxGCC/ClangDWARF嵌入…...

品牌关键词优化:如何用5步提升你的内容搜索排名?

随着生成式AI的兴起,GEO(生成式引擎优化)已成为企业提升品牌曝光和流量获取的重要手段。为了帮助大家更好地选择适合自己的GEO服务提供商,我们对市面上主流的GEO产品进行了深度测评。以下是本次参与测评的产品名单:沐廉…...

Matlab几何特征地图法实现智能车二维路径规划

Matlab几何特征地图法 单个机器人(智能车) 二维路径规划 静态环境全局路径规划 避障 有局部避障和路径冲突解决策略源程序仿真带注释 附操作视频在智能车的二维路径规划领域,尤其是在静态环境下的全局路径规划,Matlab 的几何特征地…...

JavaScript重定义this指向(apply、call、bind)

一、apply() 在JavaScript中,apply()是函数的原型方法(Function.prototype.apply),用于调用一个函数,并显式指定该函数内部的this值,同时以数组(或类数组对象)的形式传入参数。基本语…...

智慧教育+虚拟仿真:解锁煤矿专业实训新范式

煤炭作为我国主体能源,行业安全生产与智能化转型对高素质技术技能人才提出迫切需求,职业院校煤矿专业迎来发展新机遇的同时,也面临着实训教学与行业需求精准对接的挑战。煤矿安全意识警示教育与防治实训室的建设,正是以新一代信息…...

06|AI 参与开发的安全底线:别把密钥和隐私喂进去

本篇目标:这是“卷 0”的最后一篇。在正式开始写代码前,我们必须立下“生死状”。遵守这些规则,能让你免于牢狱之灾或破产风险。一、血淋淋的教训 在你觉得“我只是个小透明,黑客不会搞我”之前,先看两个真实案例&…...

网络安全学习路线:2026年最新技术趋势与系统化成长路径

【值得收藏】网络安全学习路线:2026年最新技术趋势与系统化成长路径 这篇文章为网络安全学习者提供了一条系统化的六阶段学习路径,从基础准备到专业深耕。文章介绍了三大发展方向、2026年新趋势与热点,并提供科学学习方法和职业发展建议。强…...

书单号视频搬运软件推荐8款(2026实测版)

书单号视频搬运软件推荐(2026实测版) 做书单号搬运/二剪,核心要抓去重过原创、批量效率、配音字幕三点,以下按“新手易上手→专业高效率→专用工具”分级推荐,附适用场景与关键技巧。 一、新手首选(手机端&…...

企业培训ROI怎么算?这套可直接套用的量化表,让效果看得见

做企业培训的人,几乎都遇过这样的灵魂拷问:“花了十几万做培训,到底给公司带来了什么?”“课上大家听得很认真,怎么业绩没见涨?”“明年培训预算要砍30%,你拿什么证明这笔钱花得值?”…...

库克推最便宜MacBook,为啥还是会被骂?

这些年,苹果的产品可以说是价格越来越高,面对着高价的诟病,苹果终于下定决心推出廉价产品,这就是最新款的MacBook,然而就是这一款平价产品却反而遭到了消费者的诟病,这到底是怎么回事?一、库克推…...

洛谷 P1455 搭配购买

题目描述明天就是母亲节了,电脑组的小朋友们在忙碌的课业之余挖空心思想着该送什么礼物来表达自己的心意呢?听说在某个网站上有卖云朵的,小朋友们决定一同前往去看看这种神奇的商品,这个店里有 n 朵云,云朵已经被老板编…...

2026 年上海本地靠谱财税公司榜单,服务口碑双在线

2026年,上海本地财税公司逐渐增多,服务质量和口碑备受关注。本文将盘点几家凭借专业服务和良好信誉脱颖而出的财税公司。这些公司在财税筹划、账务处理等领域表现突出,客户普遍评价其响应速度快、服务透明,成为企业发展的得力助手…...

新建虚拟机

新建虚拟机1、2、3、4、5、6、7、8、改虚拟机配置9、10、11、12、改为自己的光驱确定即可,然后开启虚拟机14、15、16、安装位置,已选择自动分区,点击“完成”即可17、软件选择,选“GNOME”桌面,点击“完成”18、命名完…...

苹果新款笔记本电脑发布:性能升级与市场定位调整

新款 MacBook 处理器升级亮点多 新款 MacBook Pro 搭载的 M5 Pro 和 M5 Max 处理器备受瞩目,不仅让苹果最快的笔记本电脑处理器速度显著提升,其内部还进行了重大改进。这两款处理器的升级,无疑为 MacBook Pro 带来了更强大的性能表现&#xf…...

基于 NXP iMX8MP ARM平台安装测试 Openclaw

By Toradex秦海 1). 简介 Openclaw AI agent 开源项目最新非常火热,目前主流是基于 Mac 或者 X68 PC 进行安装部署,本文就尝试基于 NXP iMX8MP ARM 平台通过 Docker 环境进行部署测试。另外,通过 Docker 部署的好处除了可复用性&#xff0c…...

安心部署 OpenClaw,数美科技智能体安全防护方案来了!

近期,开源AI智能体OpenClaw爆火,在GitHub上短短几周便成为有史以来最受欢迎的开源项目,引领AI正式迈入“Agent时代”。这股狂潮在中国市场引发了前所未有的部署热,不仅腾讯云、百度等大厂纷纷下场提供部署服务,各地方政…...

MFC CDialog触摸屏长按不响应右键消息解决方案

方案1 重写虚函数GetGestureStatus,返回0即可。方案2 响应WM_TABLET_QUERYSYSTEMGESTURESTATUS消息,返回0即可。方案3 用vs2010之前的版本编译,vs2010开始默认CWnd类出于性能原因返回TABLET_DISABLE_PRESSANDHOLD。注意:如果子窗口…...

在 Linux 上通过命令行上架 iOS APP,Fastlane + AppUploader(开心上架)

很多团队的 CI 或发布环境运行在 Linux 服务器上,例如 GitLab Runner、Jenkins 或自建构建节点。当应用已经生成 .ipa 文件之后,接下来就是是否可以在 Linux 上直接把 IPA 上传到 App Store? 答案是可以的,关键在于把流程分开&…...

【转行必看】程序员从零转行大模型全攻略:从入门到职业落地无坑指南

人工智能浪潮下,大模型技术的爆发彻底重塑了科技行业的人才需求版图。以GPT、BERT、LLaMA为代表的主流大模型,不仅在自然语言处理、计算机视觉等核心领域实现颠覆性突破,更催生出一大批高薪岗位。 对普通程序员而言,转行大模型绝…...

搅拌功率计算避坑指南:挡板设置对永田公式影响的7个关键点

搅拌功率计算避坑指南:挡板设置对永田公式影响的7个关键点 在搅拌工艺的研发与优化中,功率计算是绕不开的核心环节。许多工程师都熟悉永田进治公式,它结构清晰,是估算搅拌功率的经典起点。然而,公式本身只是一个数学模…...

ChatGPT Prompt Engineering实战:开发者代码运行环境全解析

背景痛点:你的代码究竟在哪儿跑? 最近在折腾ChatGPT的Prompt Engineering,我发现很多开发者朋友,包括我自己一开始,都踩过一个坑:搞不清Prompt处理代码到底在哪里执行。 这听起来像是个低级问题&#xff…...

C++三种参数传递方式:从交换函数看值、指针与引用的区别

本篇文章将通过一个简单的交换函数示例&#xff0c;详细介绍C中的三种参数传递方式&#xff1a;值传递、指针传递和引用传递。我们会分析每种方式的特点以及它们在函数调用中对实参的影响。代码预览#include <iostream> using namespace std;// 1. 值传递 void Swap01(in…...

NX二次开发C#-----NXopen测量两个面的投影距离

该代码实现了一个计算两个面之间投影距离的方法。通过创建工作部件中的测量距离构建器&#xff0c;设置投影方向为指定向量&#xff0c;并指定两个测量面对象。使用最小投影距离算法创建测量对象&#xff0c;最终返回两个面之间的投影距离值。计算完成后销毁测量构建器以释放资…...