当前位置：首页 > article >正文

Agents统一综述：Harness、记忆、Skills和协议

article 2026/4/13 22:32:30

可靠的Agent能力不仅来自模型内部参数权重更来自将认知负担外部化到结构化基础设施中。近期上交大、中山大学、卡梅隆等发表长文对 LLMAgents中的外部化记忆、Skills、协议与Harness工程进行了统一综述借用认知工具Cognitive Artifacts理论Agent基础设施的重要性不仅在于添加辅助组件而在于将难以解决的认知负担转化为模型能更可靠处理的形式。图1外部化作为LLM Agent设计的组织原则人类认知外部化的弧线从思维→语言→文字→印刷→计算LLM Agent对应的外部化弧线从权重Weights通过三个外部化维度——记忆Memory外部化状态、技能Skills外部化专业知识、协议Protocols外部化交互——最终到达Harness harness系统。2. 从权重到上下文再到Harness能力的三次迁移展示了从2022到2026年研究重心如何从Weights预训练、Scaling Law转向ContextRAG、长上下文再到HarnessMCP工具生态、安全、多Agent协作。图2社区主题在三个能力层次上的演变2.1 权重时代Weights内在知识的局限早期的现代LLM部署几乎完全依赖模型参数。预训练将统计规律、世界知识和推理习惯压缩进权重中。Scaling Law揭示了参数规模与性能的可预测关系。局限知识更新困难需要重新训练、难以审计知识分散在数十亿参数中、缺乏个性化一套权重服务百万用户却无法区分。2.2 上下文时代Context提示工程的崛起能力开始从模型内部向输入设计转移。少样本示例、思维链Chain-of-Thought、RAG检索增强生成等技术证明不必修改权重仅通过精心设计的上下文就能显著改变模型行为。关键转变将困难的回忆问题模型必须从参数中恢复知识转化为简单的识别问题模型只需使用已提供的上下文。2.3 Harness时代基础设施即能力随着上下文窗口饱和和提示模板变得笨重工程注意力转向模型应在什么样的环境中运行。图3Harnessed LLM Agent的外部化架构Harness层包括持久记忆存储、工具注册表、协议定义、沙箱、子Agent编排、评估器等。可靠性越来越多地通过改变环境而非提示模型来解决。3. 外部化状态记忆系统Memory记忆外部化解决的是Agent的时间连续性负担。原生LLM是无状态生成器每次调用都是全新的上下文连续性必须在提示中重建。图4作为外部化状态的记忆展示了从原始上下文到记忆内容的转换以及四种记忆系统架构单体上下文、检索存储、分层编排提取-巩固-遗忘-冷热交换和自适应记忆系统动态模块、基于反馈的策略优化。架构演进单体上下文所有历史保留在提示中简单但容量受限上下文检索存储近端状态在上下文长期轨迹外部存储RAG模式分层记忆与编排引入显式的提取、巩固和遗忘操作如MemGPT、Memory OS自适应记忆系统模块和检索策略能根据经验响应如MemEvolve、MemRL认知工具视角记忆系统将无界回忆转化为有界、精选的检索改变了模型在每个决策点面临的任务结构。4. 外部化专业知识技能系统Skills技能外部化解决的是程序性负担。模型可能知道如何完成任务但可靠执行需要重复构建工作流、默认值和约束这导致方差遗漏步骤、不稳定的工具使用、不一致的终止条件。4.1 技能的三个组件操作程序Operational Procedure任务骨架步骤分解、阶段、依赖、停止条件决策启发Decision Heuristics分支点的实用经验法则先尝试什么、何时退出规范约束Normative Constraints可接受性的边界测试要求、范围限制、访问控制4.2 从执行原语到能力包技能系统经历了三个阶段阶段1原子执行原语如Toolformer——稳定调用单个工具阶段2大规模原语选择如Gorilla、ToolLLM——在大量工具中检索选择阶段3技能作为打包的专业知识——将任务类别的操作方法打包为可重用单元图5作为外部化专业知识的技能展示了技能的完整生命周期从获取专家编写、从情景记忆蒸馏、环境探索发现、现有单元组合到技能工件操作程序、决策启发、规范约束再到激活流水线注册表发现、渐进式披露、组合最后在运行时执行。关键机制渐进式披露不一次性加载完整技能文档而是分层暴露名称→摘要→完整指南执行绑定技能必须通过协议接口绑定到可执行动作工具、API、文件、子Agent组合性技能可参与更高阶协调串行、并行、条件路由、递归调用5. 外部化交互协议系统Protocols协议外部化解决的是协调负担。裸模型可能推断出应该调用工具或委派子Agent但没有显式契约时它必须即兴创作消息格式、参数结构、生命周期语义和恢复行为。5.1 协议的内容维度协议将以下四个维度外部化调用语法Invocation Grammar参数名称、类型、顺序、返回结构schema化生命周期语义Lifecycle Semantics多步交互的协调规则状态机、事件流权限与信任边界授权规则、数据流向、审计要求发现元数据Discovery Metadata能力注册表、能力卡片、schema端点图6作为外部化交互的协议上图从孤立模型调用→API硬编码→标准化协议→Agent Web的演进。下图Harness通过三个功能界面实现外部化交互管理Interact与外部API/工具交互、Perceive感知环境/上下文/记忆/反馈、Collaborate与其他LLM/Agent/人类协作。5.2 协议家族综述6. 统一外部化Harness工程Harness是承载三个外部化维度记忆、技能、协议的工程层提供编排逻辑、约束、可观测性和反馈循环使外部化认知在实践中可靠运行。6.1 什么是HarnessHarness不是模型之外的第四个外部化维度而是运行时环境——模型在其内部运行通过它感知、决策和行动。图3Harnessed LLM Agent的外部化架构Harness位于中心三个外部化维度围绕它运行记忆工作上下文、语义知识、情景经验、个性化记忆、技能操作程序、决策启发、规范约束、协议Agent-用户、Agent-Agent、Agent-工具。操作元素沙箱、可观测性、压缩、评估、审批循环、子Agent编排调节Harness核心与外部化模块的交互。6.2 Harness设计的六个分析维度图7作为认知环境的Harness基础模型Agent核心位于中心六个Harness维度形成协调环记忆状态持久化、技能可重用例程、协议确定性接口、权限沙箱、文件隔离、控制递归边界、成本上限、可观测性结构化日志、执行轨迹。6.3 Harness作为认知环境从分布式认知理论看Harness不仅仅是软件基础设施而是塑造Agent有效认知的环境。它决定了什么进入感知领域、什么跨会话保留、哪些操作可调用、哪些行动需要审批、哪些中间状态可修订。Harness将无界任务转化为结构化环境通过外部化记忆、形式化程序、引入显式控制点和约束执行重新分配认知工作负载。7. 交叉分析模块间耦合三个外部化模块在Harness内并非孤立而是形成六条关键交互流图8记忆、技能、协议之间的耦合学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Agents统一综述：Harness、记忆、Skills和协议

相关文章：

Agents统一综述：Harness、记忆、Skills和协议

应届生别装熟练！诚实反而更容易过

字节怎么就成了AI界黄埔军校？

如何理解Transformer模块：从Layer Normalization到Feed Forward网络的完整指南

1414 - 期末考试成绩排名系统设计与实现

从理论到实践：无人驾驶轨迹跟踪算法（Stanley、LQR、MPC）的Carsim/Simulink仿真对比与工程实现

IoT-Technical-Guide：物联网平台API限流与防护策略终极指南

终极Carnac源码解析：WPF MVVM模式在键盘监控工具中的完美实践

手把手教你：在MounRiver Studio里为WCH RISC-V芯片切换GCC12工具链（附内存占用对比）

STM32CubeMX实战|FATFS文件系统在嵌入式存储中的高效应用

【智算中心+数据中心+机房+算力】1300余份AIDC智算中心+IDC数据中心+机房建设+算力方案报告合集

LFLiveKit网络优化秘籍：弱网丢帧与动态码率切换的终极解决方案

Flutter-WebRTC：跨平台实时音视频通信的终极指南

如何将Style Dictionary与React无缝集成：打造现代化前端样式管理系统

vis核心架构解析：现代C语言实现的轻量级编辑器设计终极指南

macos简单配置openclaw幕

如何定制ayu主题UI：分隔符、滚动条和原生标题栏配置全指南

Ubuntu服务器部署千问3.5-2B：生产环境最佳实践

别再瞎调参了！用Python复现ZDT/DTLZ测试函数，帮你科学评估多目标优化算法

终极指南：async-labs/saas代码架构解析与MobX状态管理最佳实践

CloudBeaver 云数据库管理器：10个理由让你从传统工具迁移到云端

终极指南：如何快速上手AnimateAnyone - 3种角色动画制作方法

Apache Lucene-Solr终极指南：为什么它是企业级搜索的首选解决方案

AIAgent多租户隔离失效事件复盘（某金融客户千万级SLA违约始末）：资源编排、上下文污染、元数据泄漏三重防御体系

终极指南：如何利用Flurl构建高效.NET HTTP请求与URL管理

别再死记硬背命令了！用PHPStudy本地复现BUUCTF的ACTF2020 Exec命令注入漏洞

《君正T31》9. 应用程序解读

Transformers Trainer实战：从BERT微调到自定义训练流程的5个关键技巧

若依系统集成雪花算法：实现分布式ID自动生成的最佳实践

数据结构(三) 带头双向循环链表 (附完整代码实现)