当前位置：首页 > article >正文

Agent记忆架构从入门到精通：10种方案全解析，收藏这篇就够了！

article 2026/4/6 23:03:49

继续看Agent记忆进展看10种Agent记忆方案对比总结可以借此机会看看这些记忆系统在设计的时候都有哪些组件有哪些优化策略以及有哪些经验。【我们已经陆陆续续讲了多个了也有一些综述但拉到一个框架上做抽象的回顾其实也蛮有必要】说实话Memory怎么构成还是要看Agent怎么用单独的扯出来评估其实还是没什么太大的用处的得看agent怎么用也取决于整个系统设计以及使用的llm有多聪明。但是呢做论文得控制变量分析各个模块和策略拉到一个平面上去比才能写出论文。当然其实还有很多比如memu、evermemOS等等特别多的都很同质化有的越搞越复杂但搞得跟langchain一样会最终变成代码shit mountain并不总是好事儿。一种感觉就是记忆单独做系统其实不是太成立它还是要跟着具体业务问题走的比如这些很多都是最后拓展成为rag【很多都是】、deepresearch、deepsearch、agent平台这种去做其实在某种程度上已经做了某种偏离。不过最下限的对于了解有哪些策略实现机理倒是可以的有意义的。一、10种Agent记忆方案概览记忆本质就是对朴素上下文的一个精细化雕琢增强继续看Agent记忆这块的内容拉到一个框架下做对比将现有10种代表性LLM智能体记忆方法A-MEM、MemoryBank、MemGPT、Mem0/0ᵍ、MemoChat、Zep、MemTree、MemoryOS、MemOS一起做个对比。先给个地址1、A-MEMhttps://arxiv.org/abs/2502.12110https://github.com/WujiangXu/AgenticMemory主要思路是通过动态索引和链接来创建相互关联的知识网络。当添加新记忆时会生成包含多个结构化属性包括上下文描述、关键词和标签的综合笔记。2、MemoryBankhttps://arxiv.org/abs/2305.10250https://github.com/zhongwanjun/MemoryBank-SiliconFriend主要思路是融入了受艾宾浩斯遗忘曲线理论启发的记忆更新机制该机制允许人工智能根据时间流逝和记忆的相对重要性来遗忘或强化记忆。3、MemGPThttps://arxiv.org/abs/2310.08560https://github.com/letta-ai/letta主要特点是来源于传统操作系统中的分层存储系统扩展大型语言模型有限上下文窗口内的上下文并利用中断机制来管理其与用户之间的控制流。4-5、Mem0 / Mem0https://arxiv.org/abs/2504.19413https://github.com/mem0ai/mem0主要特点是个性化通过动态地从正在进行的对话中提取、整合和检索信息。6、MemoChathttps://arxiv.org/abs/2308.08239https://github.com/LuJunru/MemoChat主要特点是通过迭代的“记忆-检索-回复”循环来优化长程开放域对话让大模型利用结构化备忘录来记忆和检索过去的对话从而在参与未来的对话时提高一致性。7、Zep (Graphiti)https://arxiv.org/abs/2501.13956https://github.com/getzep/graphiti特色是做时间感知能力的知识图谱引擎动态地综合非结构化对话数据和结构化业务数据同时保持历史关系引入图谱做也就是graphrag的变体。8、MemTreehttps://arxiv.org/abs/2410.14052没有官方实现主要差异性是利用动态树状记忆表示来优化信息组织、检索和整合以层级方式组织记忆每个节点封装了聚合的文本内容、相应的语义嵌入以及跨越树深度的不同抽象层级通过计算和比较新旧信息的语义嵌入来动态调整这种记忆。9、MemoryOShttps://arxiv.org/abs/2506.06326https://github.com/BAI-LAB/MemoryOS上升到操作系统层特点是分层存储架构由四个关键模块组成记忆存储、更新、检索和生成包含三个层级的存储单元短期记忆、中期记忆和长期个人记忆关键操作包括存储单元之间的动态更新短期到中期的更新遵循基于对话链的先进先出原则而中期到长期的更新则采用分段页面组织策略。10、MemOShttps://arxiv.org/abs/2507.03724https://github.com/MemTensor/MemOS这个很抽象将记忆视为可管理系统资源的记忆操作系统搞了一整套的复杂的抽象组件【看的有点麻】然后这些其实可以细分拆解为信息提取、记忆管理、记忆存储、信息检索四大核心组件做不同方法的系统化抽象和差异对比先看个大的点二、10种Agent记忆方案对比总结对应的工作在《Memory in the LLM Era: Modular Architectures and Strategies in a Unified Framework》https://arxiv.org/pdf/2604.01707可以看6个核心点对应的评测框架在https://github.com/Yanchen398/Memory-in-the-LLM-Era。首先是一个典型的Agent记忆系统的构成1、信息提取Information Extraction策略从交互消息中筛选、提取用于更新记忆的有效信息过滤冗余细节核心有3种实现方式直接归档这是最朴素方式统仅对原始消息和时间戳进行归档不进行任何处理如MemoryBank、MemGPT摘要式提取利用大模型从一个或多个对话轮次中生成简洁的信息摘要。记忆方法如A-MEM和Mem0提取关键词和上下文标签或提示大模型生成原始文本的抽象摘要这个其实很多都是prompt提示的机制图式提取这里的逻辑是通过LLM提取细粒度的实体和关系形成用于知识图谱构建的主语–谓语–宾语三元组结合时间元数据构建知识图保留结构化关联如Mem0ᵍ、Zep】这个也是靠prompt做2、记忆管理Memory Management策略可以对现有的记忆系统做个各个维度的比对如下五大操作可以做个列举其一关联相关经验在具有语义相似度、时间接近性或上下文相关性的记忆条目之间建立显式连接通过图中的结构边或离散记录间的关联链接实现如A-MEM和 MemoryOS等记忆方法利用基于语义相似度或连续性的关联链接Zep和 Mem0 专注于连接单个回合或实体结点。其二整合碎片化记忆逻辑是对分散的记忆进行抽象/摘要减少冗余MemoryBank将重复的日常记录聚合为事件摘要并随着经验积累不断优化全局用户画像MemoChat将相关对话按共享主题分组并生成主题级别的摘要其三跨记忆层级转换目的是将短期记忆迁移为长期记忆如MemoryOS的FIFO短期→中期热度评分中期→长期、Zep的语义社区形成。具体的MemoryOS实现两阶段迁移策略短期记忆首先按照先进先出FIFO策略迁移到中期存储随后中期记忆通过基于热度的得分被提升至长期存储该得分综合考虑访问频率和最近性。其四更新现有记忆主要分3种范式根据预定义规则对现有记忆进行更新MemoryBank采用艾宾浩斯遗忘曲线理论来随时间调整记忆强度。在MemoryOS 中新记忆根据语义和关键词相似性被整合到现有结构中、LLM驱动通过提示大型语言模型来总结、合并或解决条目之间的冲突。例如MemTree通过语言模型执行专门的聚合操作来更新其记忆其中提示内容和子节点数量引导语言模型在将新内容写回父结点前适当压缩并泛化信息以及智能体驱动智能体自主决定应用何种操作如修改、合并、修剪如MemGPT的自主工具调用。其五过滤无效信息实现上移除/降权过时/冗余记忆分基于使用的策略MemoryOS的访问频率时间衰减依赖于访问频率和时间衰减。创建时间久远且很少被检索的记忆会优先被过滤基于内容的策略Mem0的语义相似度去重通过分析语义相似度并利用大模型检测和过滤重复或过时的知识但这种粒度并不好控制。3、记忆存储Memory Storage策略基于的存储取决于组织方式和表示方式怎么存存谁是关键。分开看对于组织方式而言也是有不同的形式扁平式存储单一存储池如FIFO队列堆栈stack先进先出也可以是JSON文件如MemoryBank、分层存储多粒度/多用途存储池如MemoryOS的短期/中期/长期三层用于及时对话的短期记忆、用于主题摘要的中期记忆以及用于用户偏好的长期记忆对于表示方式而言包括向量存储文本编码为高维嵌入基于相似度检索如FAISS/Qdrant绝大多数方法采用、图存储树/知识图/时间图保留结构关系。这个图存储的可以展开看如MemTree将记忆组织成层次化树形结构其中每个结点封装了聚合的文本内容沿着树的深度提供不同层次的抽象Zep采用分层的时序知识图谱同时通过将原始消息表示为结点、提取主语–谓语–宾语三元组并将实体聚类为社区来组织记忆。4、信息检索Information Retrieval阶段检索方面也是4种范式。其一词汇检索这是常见的检索就是RAG包括基于token/术语重叠如BM25、杰卡德相似度适合精确实体/短语匹配其二向量检索基于连续向量空间的语义相似度余弦相似度ANN算法解决词汇失配问题最主流其三结构检索主要思路是利用记忆实体之间的显式关系连接通常在基于图形或层次化存储上操作通过图遍历、邻域扩展或多跳推理来检索相互关联的信息簇而非简单的查询到条目匹配。其本质都是基于图/分层存储的显式关系通过图遍历/多跳推理检索关联信息如Mem0ᵍ的子图构建、Zep的BFS遍历Mem0从通过相似度搜索识别出的结点出发探索其关系以构建一个全面的子图从而捕捉相关且多方面的信息。类似地Zep采用基于广度优先搜索的图遍历算法通过识别额外的结点和边来增强初始搜索结果其四LLM辅助检索这个主要针对模糊的场景具体的将LLM作为推理组件重构模糊查询、识别关键实体引导精准检索如MemoChat。5、看评估测试基准基准侧也可关注两个代表性的也是打榜主要阵地一个是LOCOMO基于人类间的长程对话含10个对话、平均198.6个问题、27.2个会话、588.2个对话轮次评估单跳/多跳检索、时间推理、开放域知识四大能力一个是LONGMEMEVAL基于用户-AI的长程交互含500个问题、平均50.2个会话、11.5万个token评估信息提取、多会话推理、知识更新、时间推理四大核心记忆能力6、看关键结论有了统一的对比框架和对比基准就可以看一些对比结论可以看看几个经验结论首先基于树状/分层的存储结构记忆方式占优。MemTree、MemOS树状、MemoryOS分层表现最优树结构在上层保留概念摘要、叶子节点保留细粒度细节分层存储实现信息的高效流动和转换因此这也是一个经验教训分层组织在捕捉信息之间的结构关系方面更为有效这可以通过采用基于树的索引或设计多级存储来实现。其次信息完整性至关重要。这也是教训信息完整性是记忆机制的基础保留原始消息的方法优于仅提取图三元组的方法如Mem0优于Mem0ᵍ结构化提取易导致语义丢失【这个是很自然的】。接着记忆关联能力是多跳推理的核心缺乏显式/隐式关联操作的方法MemoryBank、MemGPT在多会话/多跳任务中表现极差Mem0通过相似记忆同步更新实现了隐式关联性能显著提升【索引带来的增益】最后时间推理强依赖LLM推理能力模型从7B→72B时时间推理任务性能翻倍如MemoryOS、MemoChat现有方法缺乏专门的时间信息处理组件【所以时空的处理是关键的】此外在token消耗上也存在一些趋势其一通过对比每次对话的平均token消耗Y轴与总体F1得分X轴之间的关系可以看到通常情况下更高的性能与更高的token消耗相关MemTree 和 MemOS 实现了高准确率但它们带来了显著的 token 开销。其二信息处理的粒度对token成本有显著影响这一粒度取决于信息是从单个对话回合中提取还是从多个回合中集体提取。例如MemoryOS将对话划分为片段以进行中期存储而MemoryBank则以每日粒度将历史消息汇总成摘要但因为大模型本身能力就不错所以这种粒度上的粗化并不一定导致性能下降甚至可能提升性能。其三索引机制还需要关注扩展性这个尤其是在频繁更新的场景。对于MemTree随着对话历史的累积树的深度增加导致每轮处理的成本上升因为每次自顶向下插入新的对话结点都需要更新路径上的所有结点。类似地Zep 的图复杂度随对话轮次的增加而增长导致去重和一致性维护的成本不断上升。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Agent记忆架构从入门到精通：10种方案全解析，收藏这篇就够了！

相关文章：

Agent记忆架构从入门到精通：10种方案全解析，收藏这篇就够了！

RL训练像点外卖？ProRL底层逻辑拆解（非常详细），从入门到精通看这篇！

Harness工程可视化入门基础教程（非常详细），拿捏Vibe Coding看这篇就够了！

告别网络依赖：下载、切片、集成，三步构建你的专属高德离线地图库

专业级反爬突破：实战解析开源Wenshu_Spider技术架构与完整解决方案

League Akari：基于LCU API的模块化游戏自动化框架深度解析

彻底解决AMD显卡风扇控制失效：FanControl ADLXWrapper初始化失败的终极修复指南

H-ui.Admin：轻量级后台开发的效率革命方案

嵌入式实时系统AnOs的分时分区架构解析

深度学习模型压缩：从理论到实践

AI辅助开发新思路：让快马AI智能生成可配置的403 forbidden全局处理组件

团队协作文件总乱？试试用Nas-Cab+Cpolar搭建私有共享网盘，5分钟搞定远程文件同步

电力系统短路故障分析与电压暂降特征研究：三相不对称短路及其MATLAB仿真分析

2025最权威的六大AI学术网站推荐榜单

2026届毕业生推荐的六大降重复率平台实测分析

2026最权威的十大AI辅助写作助手解析与推荐

基于Maxwell的6极36槽水冷分布式绕组永磁同步电机（24.5kw, 额定转速9000rp...

2026年Python生态：AI代理和数据工具，到底解决了什么，没解决什么？

PADS Layout 设计规则优化：从安全间距到布线效率的实战指南

【LeetCode刷题日记】142.环形链表Ⅱ

JSON 格式：执行式AI数据交互核心语法

从测试到ISP调试：一名Camera Tuning工程师的四年转型与面试通关实录

AI安全高阶：生成式AI的安全风险与防御体系

Kafka性能测试实战：从脚本使用到参数调优全解析

告别HASH_MOD报错：手把手教你为Sharding-JDBC 5.5.0编写自定义分表算法（附完整代码）

从插件到工作流：在Coze平台实战快商通AI语音防伪接口（避坑指南+节点连接技巧）

保姆级教程：彻底解决Win11 CH340串口‘无法访问’问题（附2011版驱动下载与防捆绑指南）

终极游戏模组管理器：XXMI启动器让模组管理变得前所未有的简单

基于Multisim的FM接收机中频点优化与正交鉴频器性能验证

SPSS老版本用户必看：如何用R3.2.5实现高级统计分析（附完整语法示例）