当前位置：首页 > article >正文

Agent和LLM的区别详解

article 2026/4/6 16:22:54

Agent智能代理也叫智能体是一种能够感知环境、制定决策且自主执行行动的智能系统。核心逻辑在于让LLM根据动态变化的环境信息选择执行具体的行动并反过来影响环境多轮迭代重复执行上述步骤直到完成目标。即感知规划行动Agent工作原理输入用户向Agent提出问题或任务需求。任务拆解Agent根据LLM将复杂任务拆解成多个可执行的小任务。工具调用根据任务需要Agent可以使用外部工具比如搜索引擎、计算器、API等。执行与反馈完成任务后Agent会将结果反馈给用户。Agent构建三种方式代码开发门槛较高需要掌握编程语言如Python、大模型API调用、提示工程、部署运维等。低码/无码平台推荐新手通过可视化界面配置逻辑、连接插件、设置对话流程典型平台如扣子Coze、Dify、百度千帆等。”一句话生成Agent“现在某些AI平台支持自然语言描述直接生成Agent如Kimi的ok computer蚂蚁的灵光豆包的应用生成等。便捷但可控性弱简单智能体搭建流程创建智能体Bot设定角色与人设System Prompt模型选择、配置知识库上传相关文档、启用插件如搜索、计数器等等测试与调试对话发布与分享Agent框架Agent框架代表着人工智能系统设计模式的重大转变。与静态、预定义工作流程的传统AI应用程序不同Agent框架引入了动态自适应系统该系统具备自主感知、推理和行动的能力。这些框架可以把复杂任务拆解成多个小子任务交给专门的Agent协作完成。借助大型语言模型LLMAgent框架能够管理工作流程、做出决策还能无缝集成各种工具从头开始构建Agent绝非易事。LangGraph、CrewAI和OpenAI Swarm等框架大大简化了这个过程让开发者把精力集中在应用程序逻辑上而不用在状态管理、编排和工具集成这些方面重复造轮子核心优势在于定义Agent和工具的简便方式降低开发门槛编排机制高效能合理安排任务执行顺序状态管理可靠确保系统运行状态稳定准确附加工具流行的Agent框架和库各有优势LangchainLangGraph是LangChain团队开发的一个库CrewAI微软语义内核Microsoft Semantic Kernel微软AutoGenMicrosoft AutoGenSmolagentsAutoGPTAgnoPhidata框架与架构对于框架Framework是整个或部分系统的可重用设计表现为一组抽象构件及构件实例间交互的方法另一种认为框架是可被应用开发者定制的应用骨架、模板。。简单来说就是半成品软件就是一组组件供你使用完成你自己的系统框架要解决最重要的问题就是技术整合。像Java中常用框架SpringMVC、Spring、Mybatis、RabbitMQ、Redis、SpringBoot、、SpringMVC、Spring、Mybatis即SSM架构web开发常用三层架构分别对应界面层、业务逻辑层、数据访问层、、Django、React、、等也是常用框架、、架构Architecture又叫软件架构是一系列相关的抽象模式用于指导大型软件系统各个方面的设计。如微服务架构、领域驱动设计DDD、六边形架构、、架构是战略决策框架是实现工具LLM大语言模型LLMLarge Language Model也称大型语言模型是一种人工智能模型旨在理解和生成人类语言。通常大语言模型LLM指包含数百亿或更多参数的语言模型这些模型在大量的文本数据上进行训练如国外有GPT-3、GPT-4、PaLM、、国内有ChatGLM、文心一言、通义千问、讯飞星火等。。这个阶段计算机“大脑”变得非常巨大拥有数十亿甚至千亿的参数。像GPT-3拥有1750亿参数PaLM拥有5400亿参数。。大型语言模型与小型语言模型如BERT的3.3亿参数和GPT-2的15亿参数使用相似的架构和预训练任务但展现出截然不同的能力尤其在解决复杂任务时表现出惊人的潜力这被称为“涌现能力”。。LLM已经在许多领域产生了深远的影响。在自然语言处理领域它可以帮助计算机更好地理解和生成文本包括写文章、回答问题、翻译语言。在信息检索领域它可以改进搜索引擎让我们更轻松地找到所需的信息。在计算机视觉领域研究人员还在努力让计算机理解图像和文字以改善多媒体交互LLM的出现让人们重新思考了通用人工智能AGI的可能性。。AGI是一种像人类一样思考和学习和执行多种任务的人工智能系统。。目前大多数人工智能系统是针对特定任务或领域进行优化的例如语音识别、图像识别、自然语言处理、推荐系统等但他们缺乏通用性和灵活性不能适应各种不同的任务和环境。AGI的目标是创建一个全面智能的系统可以解决广泛的问题并进行多种任务。这种系统能在不同环境中适应和学习且可以从不同的来源中获取信息像人类一样推理和决策。。大模型的能力涌现能力区分大语言模型LLM与以前的预训练语言模型PLM最显著的特征之一是他们的涌现能力。上下文学习上下文学习能力是由GPT-3首次引入的。这种能力允许语言模型在提供自然语言指令或多个任务示例的情况下通过理解上下文并生成相应输出的方式来执行任务而无需额外的训练或参数更新。。指令遵循通过使用自然语言描述的多任务数据进行微调LLM能在同样使用指令形式化描述未见过的任务上表现良好。即LLM能够根据任务指令执行任务而无需事先见过具体示例展现了其强大的泛化能力。。逐步推理小语言模型通常难以解决涉及多个推理步骤的复杂任务像数学问题。LLM可以通过采用“思维链”推理策略可以利用包含中间推理步骤的提示机制来解决这些任务从而得到最终答案。大模型的特点LLM具有多种显著特点这些特点使它们在自然语言处理和其他领域中引起了广泛的兴趣和研究。以下是LLM的一些主要特点巨大的规模LLM通常具有巨大的参数规模可以达到数十亿甚至数千亿个参数。这使得它们能够捕捉更多的语言知识和复杂的语法结构。预训练和微调LLM采用了预训练和微调的学习方法。它们首先在大规模文本数据上进行预训练无标签数据学会了通用的语言表示和知识然后通过微调有标签数据适应特定任务从而在各种NLP任务中表现出色。上下文感知LLM在处理文本时具有强大的上下文感知能力能力理解和生成依赖于前文的文本内容。这使得它们在对话、文章生成和情境理解方面表现出色。多语言支持LLM可以用于多种语言不仅限于英语。它们的多语言能力使得跨文化和跨语言的应用变得更加容易。多模态支持一些LLM已经扩展到支持多模态数据包括文本、图像和语音。这意味着它们可以理解和生成不同媒体类型的内容实现更多样化的应用。涌现能力LLM表现出令人惊讶的涌现能力即在大规模模型中出现但在小型模型中不明显的性能提升。这使得它们能够处理更复杂的任务和问题。多领域应用LLM已经被广泛应用于文本生成、自动翻译、信息检索、摘要生成、聊天机器人、虚拟助手等多个领域对人们的日常生活和工作产生了深远的影响。伦理和风险问题尽管LLM具有出色的能力但它们也引发了伦理和风险问题包括生成有害内容、隐私问题、认知偏差等。因此研究和应用LLM需要谨慎。常见的大模型闭源LLMGPT系列OpenAI公司提出的GPTGenerative Pre-Training模型是典型的生成式预训练语言模型之一。GPT模型的基本原则是通过语言建模将世界知识压缩到仅解码器的Transformer模型中这样它就可以恢复或记忆世界知识的语言并充当通用任务求解器。ChatGPT与GPT4先后出世Claude系列由OpenAI离职人员创建公司所开发PaLM系统由Google开发。文心一言基于百度文心大模型的知识增强语言大模型星火大模型讯飞星火认知大模型由科大讯飞发布开源LLMLLaMA系列模型由Meta开源的一组基础语言模型GLM系列由清华大学和智谱AI等合作研发有ChatGLM通义千问Qwen由阿里巴巴基于“通义”大模型研发Baichuan系列由白川智能开发当模型看到 “下雨天要带伞” 和 “下雨没带伞会淋湿” 这两句话它会通过统计分析发现 “下雨” 和 “带伞” 之间存在强关联从而理解雨天与伞具使用的逻辑关系。比当前文是 “今天天气很好我们决定去”模型需要生成下一个词。这时模型重点关注 “天气很好” 和 “去”从而联想到 “公园”” 爬山 ” 等合适的词语。所以模型本身并不真正 “理解” 文字含义它只是通过数学计算将人类语言转化为可处理的数字信号再根据这些信号预测下一个可能出现的词语。多个大模型关键指标维度参数量Number of Parameters大模型本质是模仿人类的神经元结构大模型的参数越多模型就越聪明能记住更多东西、理解更多更复杂的语言。。参数决定了AI如何理解和生成信息但并不是参数越多越好同时也需要更庞大的算力资源。。如果参数特别大但是训练数据或计算资源不足超大参数模型可能“过拟合”过度学习导致模型泛化能力下降。。算力Computing Power算力通常是说的计算能力指计算机系统在单位时间内处理数据或执行计算任务的能力向量Model Vectors大模型中向量是将语言符号词语、句子转化成数字数组的工具我们称之为“词向量”或“句向量”。同一类的向量关系就比较接近通过这种方式模型能用数学方法计算词语之间的相似度。实际的向量转化涉及非常复杂函数向量经过处理会生成下一个词的预测向量。。切片Slicing切片分批处理注意力机制Attention Mechanism注重上下文让对话和文章更自然流畅。。训练集Training Data微调Fine-tuning预训练模型基础上使用特定任务或领域的小规模数据对模型的部分或全部参数进行优化提示工程Prompt EngineeringToken大模型中将文本分割处理的最小独立单元可以是单词、子词、字符或标点符号尽管大型语言模型的调用相对简单但要创建完整的应用程序仍然需要大量的定制开发工作包括API集成、互动逻辑、数据存储等等。旨在帮助开发者们快速构建基于大型语言模型的端到端应用程序或工作流程。其中一个备受关注的项目就是LangChain框架。LangChain 框架是一个开源工具充分利用了大型语言模型的强大能力以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口从而简化应用程序的开发流程。具体来说LangChain 框架可以实现数据感知和环境互动也就是说它能够让语言模型与其他数据来源连接并且允许语言模型与其所处的环境进行互动。Langchain 核心组件LangChain 作为一个大语言模型开发框架可以将 LLM 模型对话模型、embedding模型等、向量数据库、交互层 Prompt、外部知识、外部代理工具整合到一起进而可以自由构建 LLM 应用。 LangChain 主要由以下 6 个核心模块组成:模型输入/输出Model I/O与语言模型交互的接口。数据连接Data connection与特定应用程序的数据进行交互的接口。链Chains将组件组合实现端到端应用。记忆Memory用于链的多次运行之间持久化应用程序状态。代理Agents扩展模型的推理能力用于复杂的应用的调用序列。回调Callbacks扩展模型的推理能力用于复杂的应用的调用序列。关于Agent与LLM的关系AI AgentLLM大模型Planning规划Memory记忆Tools工具如果LLM是大脑那Agent就是利用大脑和四肢结合任务规划和工具调用帮助用户完成复杂或重复性工作。。大模型LLM自然语言处理如聊天机器人、自动写作、机器翻译等。内容生成生成文章、诗歌、故事等创意内容。问答系统回答用户提出的问题提供信息查询服务。智能体Agent自动化系统如智能家居控制系统、自动驾驶汽车等。游戏AI在游戏中扮演角色与玩家互动。客户服务如智能客服系统不仅可以回答问题还可以协助解决实际问题。工业自动化如工厂中的机器人手臂执行复杂的制造任务。大模型LLM文本交互主要通过文本输入输出与用户或其他系统进行交互。智能体Agent多样化交互可以通过文本、语音、视觉等多种方式与环境或用户进行交互大模型LLM静态更新通常在发布后不会频繁更新除非有新的大规模数据或模型结构改进。智能体Agent动态适应可以在运行过程中不断学习和适应新环境特别是在实时反馈和强化学习场景中。AI AgentAI Agent是一种能够感知环境、做出决策并执行动作的智能实体。它通常具有自主性能够在没有人类干预的情况下独立运作。AI Agent的核心功能包括感知、决策和执行它通过这些功能在复杂的环境中自主完成任务。在初始化给定Agent不同的工具和能力后Agent会根据现存的能力和工具去解决复杂的任务将其拆解为各个简单任务去解决。AI WorkflowAI WorkflowAI工作流是一种预定义的、线性的任务执行流程。它通常由一系列步骤组成每个步骤都有明确的输入和输出。AI Workflow的设计目的是为了自动化和优化特定的业务流程确保任务按照预定的顺序和规则执行。

Agent和LLM的区别详解

相关文章：

Agent和LLM的区别详解

Gemma-3-12B-IT WebUI性能实测：不同问题类型的响应时间对比

SenseVoice-small轻量优势：模型加载时间＜2秒，首字响应＜800ms

猫抓浏览器扩展：从零开始的网页资源嗅探完全指南

解锁高效操作：5款菜单栏管理工具的深度评测与场景适配指南

山外有山，心内有归途：一个技术人的哲思

开源工具猫抓：破解资源嗅探难题的全面指南

DeepLabV3语义分割环境配置、DeepLabV3语义分割模型代跑训练、DeepLabV3语义分割模型改进创新DeepLabV3语义分割环境配置：Windows、Ubuntu、Centos、

番茄小说下载器：全能解析引擎驱动的一站式数字阅读解决方案

httpspider全局抓包,直接抓取下载模拟器手机平板电视中的数据(视频音乐直播

避开地图偏移的坑：GCJ02/WGS84/BD09坐标系转换原理与最佳实践

ZoteroDuplicatesMerger：文献库智能去重解决方案的技术深度解析

随笔 3（Linux）

从理论到实践：剖析快速排序比较次数的优化边界

Unity游戏实时翻译插件XUnity.AutoTranslator的完整技术解析与实战指南

快速原型：用快马一键生成虚拟机监控程序功能诊断脚本

claude加持快马平台：三步生成你的第一个博客网站原型

哈希表开放定址法增删改查简单实现

PointPillars：面向自动驾驶的高效3D点云目标检测技术实现

如何用百元电视盒子打造你的第一台Linux服务器？这个开源项目让你轻松上手！

SEO接单平台怎么选

Helloagents-13travel agent学习笔记

告别窗口切换烦恼：PinWin带来的工作效率变革

proteus新手福音：用快马平台轻松生成第一个电路仿真项目

主动配电网短期负荷预测与网络重构优化分析：基于IEEE33节点的实证研究

从手机双摄到自动驾驶：对极几何与基础矩阵在现实场景中的三种典型应用分析

迅为RK3588S开发板Android13系统外设功能全解析

Agent RAG 底层核心难点

ComfyUI 自动化生产 3D资产工作流笔记

AI辅助开发：让快马AI设计智能引擎，深度解决synaptics.exe映像损坏