当前位置: 首页 > article >正文

Agent记忆架构从入门到精通:10种方案全解析,收藏这篇就够了!

继续看Agent记忆进展看10种Agent记忆方案对比总结可以借此机会看看这些记忆系统在设计的时候都有哪些组件有哪些优化策略以及有哪些经验。【我们已经陆陆续续讲了多个了也有一些综述但拉到一个框架上做抽象的回顾其实也蛮有必要】说实话Memory怎么构成还是要看Agent怎么用单独的扯出来评估其实还是没什么太大的用处的得看agent怎么用也取决于整个系统设计以及使用的llm有多聪明。但是呢做论文得控制变量分析各个模块和策略拉到一个平面上去比才能写出论文。当然其实还有很多比如memu、evermemOS等等特别多的都很同质化有的越搞越复杂但搞得跟langchain一样会最终变成代码shit mountain并不总是好事儿。一种感觉就是记忆单独做系统其实不是太成立它还是要跟着具体业务问题走的比如这些 很多都是最后拓展成为rag【很多都是】、deepresearch、deepsearch、agent平台这种去做其实在某种程度上已经做了某种偏离。不过最下限的对于了解有哪些策略实现机理倒是可以的有意义的。一、10种Agent记忆方案概览记忆本质就是对朴素上下文的一个精细化雕琢增强继续看Agent记忆这块的内容拉到一个框架下做对比将现有10种代表性LLM智能体记忆方法A-MEM、MemoryBank、MemGPT、Mem0/0ᵍ、MemoChat、Zep、MemTree、MemoryOS、MemOS一起做个对比。先给个地址1、A-MEMhttps://arxiv.org/abs/2502.12110https://github.com/WujiangXu/AgenticMemory主要思路是通过动态索引和链接来创建相互关联的知识网络。当添加新记忆时会生成包含多个结构化属性包括上下文描述、关键词和标签的综合笔记。2、MemoryBankhttps://arxiv.org/abs/2305.10250https://github.com/zhongwanjun/MemoryBank-SiliconFriend主要思路是融入了受艾宾浩斯遗忘曲线理论启发的记忆更新机制该机制允许人工智能根据时间流逝和记忆的相对重要性来遗忘或强化记忆。3、MemGPThttps://arxiv.org/abs/2310.08560https://github.com/letta-ai/letta主要特点是来源于传统操作系统中的分层存储系统扩展大型语言模型有限上下文窗口内的上下文并利用中断机制来管理其与用户之间的控制流。4-5、Mem0 / Mem0https://arxiv.org/abs/2504.19413https://github.com/mem0ai/mem0主要特点是个性化通过动态地从正在进行的对话中提取、整合和检索信息。6、MemoChathttps://arxiv.org/abs/2308.08239https://github.com/LuJunru/MemoChat主要特点是通过迭代的“记忆-检索-回复”循环来优化长程开放域对话让大模型利用结构化备忘录来记忆和检索过去的对话从而在参与未来的对话时提高一致性。7、Zep (Graphiti)https://arxiv.org/abs/2501.13956https://github.com/getzep/graphiti特色是做时间感知能力的知识图谱引擎动态地综合非结构化对话数据和结构化业务数据同时保持历史关系引入图谱做也就是graphrag的变体。8、MemTreehttps://arxiv.org/abs/2410.14052没有官方实现主要差异性是利用动态树状记忆表示来优化信息组织、检索和整合以层级方式组织记忆每个节点封装了聚合的文本内容、相应的语义嵌入以及跨越树深度的不同抽象层级通过计算和比较新旧信息的语义嵌入来动态调整这种记忆。9、MemoryOShttps://arxiv.org/abs/2506.06326https://github.com/BAI-LAB/MemoryOS上升到操作系统层特点是分层存储架构由四个关键模块组成记忆存储、更新、检索和生成包含三个层级的存储单元短期记忆、中期记忆和长期个人记忆关键操作包括存储单元之间的动态更新短期到中期的更新遵循基于对话链的先进先出原则而中期到长期的更新则采用分段页面组织策略。10、MemOShttps://arxiv.org/abs/2507.03724https://github.com/MemTensor/MemOS这个很抽象将记忆视为可管理系统资源的记忆操作系统搞了一整套的复杂的抽象组件【看的有点麻】然后这些其实可以细分拆解为信息提取、记忆管理、记忆存储、信息检索四大核心组件做不同方法的系统化抽象和差异对比先看个大的点二、10种Agent记忆方案对比总结对应的工作在《Memory in the LLM Era: Modular Architectures and Strategies in a Unified Framework》https://arxiv.org/pdf/2604.01707可以看6个核心点对应的评测框架在https://github.com/Yanchen398/Memory-in-the-LLM-Era。首先是一个典型的Agent记忆系统的构成1、信息提取Information Extraction策略从交互消息中筛选、提取用于更新记忆的有效信息过滤冗余细节核心有3种实现方式直接归档这是最朴素方式统仅对原始消息和时间戳进行归档不进行任何处理如MemoryBank、MemGPT摘要式提取利用大模型从一个或多个对话轮次中生成简洁的信息摘要。记忆方法如A-MEM和Mem0提取关键词和上下文标签或提示大模型生成原始文本的抽象摘要这个其实很多都是prompt提示的机制图式提取这里的逻辑是通过LLM提取细粒度的实体和关系形成用于知识图谱构建的主语–谓语–宾语三元组结合时间元数据构建知识图保留结构化关联如Mem0ᵍ、Zep】这个也是靠prompt做2、记忆管理Memory Management策略可以对现有的记忆系统做个各个维度的比对如下五大操作可以做个列举其一关联相关经验在具有语义相似度、时间接近性或上下文相关性的记忆条目之间建立显式连接通过图中的结构边或离散记录间的关联链接实现如A-MEM和 MemoryOS等记忆方法利用基于语义相似度或连续性的关联链接Zep和 Mem0 专注于连接单个回合或实体结点。其二整合碎片化记忆逻辑是对分散的记忆进行抽象/摘要减少冗余MemoryBank将重复的日常记录聚合为事件摘要并随着经验积累不断优化全局用户画像MemoChat将相关对话按共享主题分组并生成主题级别的摘要其三跨记忆层级转换目的是将短期记忆迁移为长期记忆如MemoryOS的FIFO短期→中期热度评分中期→长期、Zep的语义社区形成。具体的MemoryOS实现两阶段迁移策略短期记忆首先按照先进先出FIFO策略迁移到中期存储随后中期记忆通过基于热度的得分被提升至长期存储该得分综合考虑访问频率和最近性。其四更新现有记忆主要分3种范式根据预定义规则对现有记忆进行更新MemoryBank采用艾宾浩斯遗忘曲线理论来随时间调整记忆强度。在MemoryOS 中新记忆根据语义和关键词相似性被整合到现有结构中、LLM驱动通过提示大型语言模型来总结、合并或解决条目之间的冲突。例如MemTree通过语言模型执行专门的聚合操作来更新其记忆其中提示内容和子节点数量引导语言模型在将新内容写回父结点前适当压缩并泛化信息以及智能体驱动智能体自主决定应用何种操作如修改、合并、修剪如MemGPT的自主工具调用。其五过滤无效信息实现上移除/降权过时/冗余记忆分基于使用的策略MemoryOS的访问频率时间衰减依赖于访问频率和时间衰减。创建时间久远且很少被检索的记忆会优先被过滤基于内容的策略Mem0的语义相似度去重通过分析语义相似度并利用大模型检测和过滤重复或过时的知识但这种粒度并不好控制。3、 记忆存储Memory Storage策略基于的存储取决于组织方式和表示方式怎么存存谁是关键。分开看对于组织方式而言也是有不同的形式扁平式存储单一存储池如FIFO队列堆栈stack先进先出也可以是JSON文件如MemoryBank、分层存储多粒度/多用途存储池如MemoryOS的短期/中期/长期三层用于及时对话的短期记忆、用于主题摘要的中期记忆以及用于用户偏好的长期记忆对于表示方式而言包括向量存储文本编码为高维嵌入基于相似度检索如FAISS/Qdrant绝大多数方法采用、图存储树/知识图/时间图保留结构关系。这个图存储的可以展开看如MemTree将记忆组织成层次化树形结构其中每个结点封装了聚合的文本内容沿着树的深度提供不同层次的抽象Zep采用分层的时序知识图谱同时通过将原始消息表示为结点、提取主语–谓语–宾语三元组并将实体聚类为社区来组织记忆。4、信息检索Information Retrieval阶段检索方面也是4种范式。其一词汇检索这是常见的检索就是RAG包括基于token/术语重叠如BM25、杰卡德相似度适合精确实体/短语匹配其二向量检索基于连续向量空间的语义相似度余弦相似度ANN算法解决词汇失配问题最主流其三结构检索主要思路是利用记忆实体之间的显式关系连接通常在基于图形或层次化存储上操作通过图遍历、邻域扩展或多跳推理来检索相互关联的信息簇而非简单的查询到条目匹配。其本质都是基于图/分层存储的显式关系通过图遍历/多跳推理检索关联信息如Mem0ᵍ的子图构建、Zep的BFS遍历Mem0从通过相似度搜索识别出的结点出发探索其关系以构建一个全面的子图从而捕捉相关且多方面的信息。类似地Zep采用基于广度优先搜索的图遍历算法通过识别额外的结点和边来增强初始搜索结果其四LLM辅助检索这个主要针对模糊的场景具体的将LLM作为推理组件重构模糊查询、识别关键实体引导精准检索如MemoChat。5、看评估测试基准基准侧也可关注两个代表性的也是打榜主要阵地一个是LOCOMO基于人类间的长程对话含10个对话、平均198.6个问题、27.2个会话、588.2个对话轮次评估单跳/多跳检索、时间推理、开放域知识四大能力一个是LONGMEMEVAL基于用户-AI的长程交互含500个问题、平均50.2个会话、11.5万个token评估信息提取、多会话推理、知识更新、时间推理四大核心记忆能力6、看关键结论有了统一的对比框架和对比基准就可以看一些对比结论可以看看几个经验结论首先基于树状/分层的存储结构记忆方式占优。MemTree、MemOS树状、MemoryOS分层表现最优树结构在上层保留概念摘要、叶子节点保留细粒度细节分层存储实现信息的高效流动和转换因此这也是一个经验教训分层组织在捕捉信息之间的结构关系方面更为有效这可以通过采用基于树的索引或设计多级存储来实现。其次信息完整性至关重要。这也是教训信息完整性是记忆机制的基础保留原始消息的方法优于仅提取图三元组的方法如Mem0优于Mem0ᵍ结构化提取易导致语义丢失【这个是很自然的】。接着记忆关联能力是多跳推理的核心缺乏显式/隐式关联操作的方法MemoryBank、MemGPT在多会话/多跳任务中表现极差Mem0通过相似记忆同步更新实现了隐式关联性能显著提升【索引带来的增益】最后时间推理强依赖LLM推理能力模型从7B→72B时时间推理任务性能翻倍如MemoryOS、MemoChat现有方法缺乏专门的时间信息处理组件【所以时空的处理是关键的】此外在token消耗上也存在一些趋势其一通过对比每次对话的平均token消耗Y轴与总体F1得分X轴之间的关系可以看到通常情况下更高的性能与更高的token消耗相关MemTree 和 MemOS 实现了高准确率但它们带来了显著的 token 开销。其二信息处理的粒度对token成本有显著影响这一粒度取决于信息是从单个对话回合中提取还是从多个回合中集体提取。例如MemoryOS将对话划分为片段以进行中期存储而MemoryBank则以每日粒度将历史消息汇总成摘要但因为大模型本身能力就不错所以这种粒度上的粗化并不一定导致性能下降甚至可能提升性能。其三索引机制还需要关注扩展性这个尤其是在频繁更新的场景。对于MemTree随着对话历史的累积树的深度增加导致每轮处理的成本上升因为每次自顶向下插入新的对话结点都需要更新路径上的所有结点。类似地Zep 的图复杂度随对话轮次的增加而增长导致去重和一致性维护的成本不断上升。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

Agent记忆架构从入门到精通:10种方案全解析,收藏这篇就够了!

继续看Agent记忆进展,看10种Agent记忆方案对比总结,可以借此机会,看看这些记忆系统在设计的时候都有哪些组件,有哪些优化策略,以及有哪些经验。【我们已经陆陆续续讲了多个了,也有一些综述,但拉…...

RL训练像点外卖?ProRL底层逻辑拆解(非常详细),从入门到精通看这篇!

一句话讲清楚👉🏻 NVIDIA提出ProRL Agent,把多轮LLM Agent的RL训练中「轨迹生成(Rollout)」这一步从训练框架中彻底剥离出来,变成一个独立的HTTP服务,训练侧只需发HTTP请求就能拿到轨迹和奖励信…...

Harness工程可视化入门基础教程(非常详细),拿捏Vibe Coding看这篇就够了!

在最新的 Routa Desktop 中,我们引入了 Harness 工程可视化系统。它并不是一个展示“AI 写了多少代码”的界面,也不是为了给生成式开发增加一层炫目的仪表盘, 而是试图回答一个更关键的问题: 当 AI 逐渐成为软件交付链路中的执行者…...

告别网络依赖:下载、切片、集成,三步构建你的专属高德离线地图库

构建企业级高德离线地图资产库:从瓦片管理到前端集成的工程化实践 在政务、军工、能源等对数据安全性要求极高的领域,或是偏远地区网络条件受限的场景,在线地图服务往往成为系统可靠性的短板。我曾参与某省级政务内网项目的架构设计&#xff…...

专业级反爬突破:实战解析开源Wenshu_Spider技术架构与完整解决方案

专业级反爬突破:实战解析开源Wenshu_Spider技术架构与完整解决方案 【免费下载链接】Wenshu_Spider :rainbow:Wenshu_Spider-Scrapy框架爬取中国裁判文书网案件数据(2019-1-9最新版) 项目地址: https://gitcode.com/gh_mirrors/wen/Wenshu_Spider 中国裁判文…...

League Akari:基于LCU API的模块化游戏自动化框架深度解析

League Akari:基于LCU API的模块化游戏自动化框架深度解析 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 在现代竞技游戏生态中&a…...

彻底解决AMD显卡风扇控制失效:FanControl ADLXWrapper初始化失败的终极修复指南

彻底解决AMD显卡风扇控制失效:FanControl ADLXWrapper初始化失败的终极修复指南 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcod…...

H-ui.Admin:轻量级后台开发的效率革命方案

H-ui.Admin:轻量级后台开发的效率革命方案 【免费下载链接】H-ui.admin 项目地址: https://gitcode.com/gh_mirrors/hu/H-ui.admin 1. 三大核心价值重新定义管理系统开发 1.1 零门槛上手:从环境配置到功能实现的极速体验 问题:传统…...

嵌入式实时系统AnOs的分时分区架构解析

1. AnOs:嵌入式分时分区实时系统解析作为一名在嵌入式领域摸爬滚打多年的工程师,第一次看到AnOs这个项目时眼前一亮。它让我想起了十年前在军工项目中调试VxWorks 653的经历——那种严格的分区保护和实时调度机制,在工业控制、航空航天等高安…...

深度学习模型压缩:从理论到实践

深度学习模型压缩:从理论到实践 1. 背景与意义 深度学习模型在取得显著性能提升的同时,也带来了模型规模的急剧增长。大型模型往往需要大量的计算资源和内存,这限制了它们在资源受限设备上的部署。模型压缩技术的意义在于: 减少模…...

AI辅助开发新思路:让快马AI智能生成可配置的403 forbidden全局处理组件

今天在开发一个后台管理系统时,遇到了一个常见的权限控制问题:当用户访问没有权限的页面时,系统直接抛出了403错误。这种生硬的体验显然不够友好,于是我决定开发一个智能化的403 forbidden处理组件。经过在InsCode(快马)平台上的实…...

团队协作文件总乱?试试用Nas-Cab+Cpolar搭建私有共享网盘,5分钟搞定远程文件同步

团队协作文件总乱?5分钟搭建私有共享网盘的全流程指南 每次收到同事发来的"最终版_v3.docx"时,是不是都想把键盘摔了?我们团队曾经也深陷文件版本混乱的泥潭,直到发现这套组合方案——用Nas-Cab搭建本地文件中心&#x…...

电力系统短路故障分析与电压暂降特征研究:三相不对称短路及其MATLAB仿真分析

1.电力系统短路故障引起电压暂降 2.不对称短路故障分析 包括:共两份自编word+相应matlab模型 1.短路故障的发生频次以及不同类型短路故障严重程度,本文选取三类典型的不对称短路展开研究,包含单相接地短路、相间短路和两相接地短…...

2025最权威的六大AI学术网站推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 现如今,在市面上存在的AI论文网站,它们所具备的功能是各不相同的&…...

2026届毕业生推荐的六大降重复率平台实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于学术研究范畴之内,人工智能技术已然被广泛应用至毕业论文的辅助写作方面。若能…...

2026最权威的十大AI辅助写作助手解析与推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 现今,人工智能辅助论文写作在学术研究里已渐渐变成常见的手段,当前&a…...

基于Maxwell的6极36槽水冷分布式绕组永磁同步电机(24.5kw, 额定转速9000rp...

基于maxwell的6极36槽永磁同步电机(永磁直流无刷)模型,水冷,24.5kw, 绕组类型:分布式绕组,直流电压270Vdc,对6极 额定转速9000rpm,扭矩额定扭矩:输出扭矩不低于26Nm,效率:不低于95%,低速点转速:…...

2026年Python生态:AI代理和数据工具,到底解决了什么,没解决什么?

先说结论AI代理框架的成熟度差异很大,LangGraph适合复杂状态管理,但学习曲线陡峭;CrewAI简化了多代理协作,但可能牺牲灵活性;smolagents轻量快速,但功能有限。数据工具如Polars和DuckDB在性能上显著超越传统…...

PADS Layout 设计规则优化:从安全间距到布线效率的实战指南

1. PADS Layout设计规则入门:为什么它比你想的更重要 刚接触PADS Layout的工程师常犯的一个错误,就是直接开始画板子,完全跳过设计规则设置。这就像开车不系安全带——短途可能没事,但迟早要出事。我见过太多因为间距设置不当导致…...

【LeetCode刷题日记】142.环形链表Ⅱ

🔥个人主页:北极的代码(欢迎来访) 🎬作者简介:java后端学习者 ❄️个人专栏:苍穹外卖日记,SSM框架深入,JavaWeb ✨命运的结局尽可永在,不屈的挑战却不可须臾或…...

JSON 格式:执行式AI数据交互核心语法

JSON 格式:执行式AI数据交互核心语法📝 本章学习目标:本章是入门认知部分,帮助零基础读者建立对AI Agent的初步认知。通过本章学习,你将全面掌握"JSON 格式:执行式AI数据交互核心语法"这一核心主…...

从测试到ISP调试:一名Camera Tuning工程师的四年转型与面试通关实录

1. 从测试到ISP调试:我的四年转型之路 四年前刚毕业时,我加入上海一家网络摄像头方案公司,最初做的是最基础的测试工作。每天重复着枯燥的测试用例执行、bug记录和报告撰写,一度怀疑自己是不是选错了职业方向。转折点出现在工作两…...

AI安全高阶:生成式AI的安全风险与防御体系

AI安全高阶:生成式AI的安全风险与防御体系📝 本章学习目标:本章深入探讨高阶主题,适合有一定基础的读者深化理解。通过本章学习,你将全面掌握"AI安全高阶:生成式AI的安全风险与防御体系"这一核心…...

Kafka性能测试实战:从脚本使用到参数调优全解析

1. Kafka性能测试入门指南 第一次接触Kafka性能测试时,我被各种专业术语和参数搞得晕头转向。后来在实际项目中反复实践才发现,掌握Kafka性能测试其实就像学开车一样,先了解基本操作,再逐步深入高级技巧。Kafka官方提供的两个测试…...

告别HASH_MOD报错:手把手教你为Sharding-JDBC 5.5.0编写自定义分表算法(附完整代码)

深度定制Sharding-JDBC分片策略:从算法原理到生产实践 当数据库表数据量突破千万级时,单表查询性能会显著下降。这时我们需要将数据分散到多个物理表中存储——这就是分表的核心价值。Sharding-JDBC作为轻量级的Java分库分表中间件,其内置的H…...

从插件到工作流:在Coze平台实战快商通AI语音防伪接口(避坑指南+节点连接技巧)

从插件到工作流:在Coze平台实战快商通AI语音防伪接口(避坑指南节点连接技巧) 当你已经按照教程在Coze开放平台创建了快商通AI的语音防伪检测插件,接下来面临的挑战是如何将这些独立的组件串联成一个自动化工作流。本文将带你深入实…...

保姆级教程:彻底解决Win11 CH340串口‘无法访问’问题(附2011版驱动下载与防捆绑指南)

终极指南:Win11系统CH340串口驱动兼容性问题的完整解决方案 最近不少开发者反馈在Windows 11系统下使用CH340串口模块时遇到了"无法访问"的问题。这个看似简单的驱动兼容性问题,实际上困扰了许多嵌入式开发者和硬件爱好者。本文将提供一个从问…...

终极游戏模组管理器:XXMI启动器让模组管理变得前所未有的简单

终极游戏模组管理器:XXMI启动器让模组管理变得前所未有的简单 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher XXMI启动器是一个开源的多游戏模组管理平台&#xff0c…...

基于Multisim的FM接收机中频点优化与正交鉴频器性能验证

1. FM接收机中频点优化设计实战 第一次用Multisim调FM接收机时,我被中频点漂移问题折磨得够呛。当时示波器上的波形就像喝醉了一样左右摇摆,根本抓不住稳定的10.7MHz信号。后来发现,中频点优化其实是个系统工程,需要从混频、滤波…...

SPSS老版本用户必看:如何用R3.2.5实现高级统计分析(附完整语法示例)

SPSS老版本用户必看:如何用R3.2.5实现高级统计分析(附完整语法示例) 对于长期使用SPSS老版本的研究者来说,面对日益复杂的数据分析需求时,常常会遇到软件功能受限的困境。特别是在临床医学和社会科学研究中&#xff0c…...