当前位置: 首页 > article >正文

从L0到L3的完整路径,Token降61%的底层逻辑,TencentDB Agent Memory实战:分层记忆架构详解

TencentDB Agent Memory实战分层记忆架构详解副标题: 从L0到L3的完整路径Token降61%的底层逻辑痛点为什么你的AI总是记不住你有没有遇到过这样的情况AI能记住前几轮对话但聊久了就失忆AI能存储信息但无法精准召回AI能学习新技能但人格不一致AI能回答问题但答案前后矛盾AI能处理简单任务但复杂任务就混乱AI能记住事实但无法理解事实之间的关系AI能回答你是谁但无法回答你之前说过什么这不是AI的问题是记忆架构的问题。今天一个多Agent系统集体学习了TencentDB Agent Memory项目得出了一个惊人的结论Memory不是为了让AI存下所有东西而是为了让人不必重复所有事情。一、TencentDB记忆架构短期长期双层设计1.1 核心公式TencentDB Agent Memory 符号化短期记忆 分层式长期记忆1.2 短期记忆三层原始日志 → 步骤摘要 → Mermaid任务画布层级形态作用底层refs/*.md 原始日志出问题时追溯中层jsonl 步骤摘要快速查阅顶层Mermaid 任务画布拓扑图知道做到哪、下一步往哪核心思想Agent平时只看拓扑图不看全文1.3 为什么需要三层短期记忆层级问题解决方案底层信息太多找不到原始日志完整存储中层原始日志太长读不完步骤摘要提炼关键信息顶层摘要还是太多看不清结构Mermaid拓扑图可视化实际案例假设AI正在处理一个复杂任务涉及100个步骤底层存储100个步骤的完整日志每个步骤500字共50KB中层提炼10个关键步骤的摘要每个摘要100字共1KB顶层生成1个Mermaid拓扑图可视化任务流程AI平时只看顶层的拓扑图需要追溯时才看中层摘要出问题时才看底层日志。1.4 长期记忆四层L0 Conversation原始对话 ↓ 抽取 L1 Atom原子级事实 ↓ 聚合 L2 Scenario场景模式 ↓ 抽象 L3 Persona用户画像关键区别画像有来源、可回溯、能更新二、L0→L1→L2→L3从对话到用户画像2.1 L0 Conversation原始对话特征说明内容完整的对话记录格式原始日志jsonl用途追溯、审计、调试2.2 L1 Atom原子级事实特征说明内容从对话中提取的原子事实格式结构化数据用途快速检索、知识图谱构建示例{id:atom_001,content:用户偏好Python编程,source:conversation_20260518,confidence:0.85}2.3 L2 Scenario场景模式特征说明内容从原子事实中聚合的场景模式格式场景模板用途场景化推理、个性化推荐示例{id:scenario_001,name:编程学习场景,atoms:[atom_001,atom_002,atom_003],pattern:用户喜欢Python正在学习机器学习}2.4 L3 Persona用户画像特征说明内容从场景模式中抽象的用户画像格式画像文档用途个性化交互、长期记忆示例{id:persona_001,name:李峰,preferences:{programming_language:Python,learning_focus:机器学习,communication_style:简洁、结构化},evidence_chain:[atom_001,atom_002,atom_003],last_updated:2026-05-18}2.5 L0→L1→L2→L3的提炼过程层级输入输出提炼比例L0完整对话-100%L1完整对话原子事实10%L2原子事实场景模式5%L3场景模式用户画像1%关键洞察记忆系统不是存得越多越好而是提炼得越准越好。三、系统记忆架构3.1 记忆流程短期记忆事件采集 ↓ 分类 长期记忆存储 ↓ L0→L1→L2→L3提炼 用户画像配置文件3.2 短期记忆升级当前: 心跳文件纯文本优化: 增加Mermaid任务状态图事件总线分类路由Agent执行反馈层进化3.3 长期记忆增强当前: 记忆文件扁平存储优化: 每个记忆条目增加node_id和来源链路{id:capsule_001,content:...,source_node_id:node_123,trace_id:trace_abc,created:2026-05-18}3.4 召回优化当前: 全文搜索优化: 标签索引 时间窗口过滤维度当前优化短期记忆心跳文件增加Mermaid任务画布长期记忆记忆文件增加node_id回溯链路Token优化未量化增加token统计召回质量全文搜索标签索引 时间窗口3.5 记忆系统的挑战构建高质量记忆系统面临三大挑战挑战说明解决方案信息过载对话量增长快于记忆提炼速度增加自动化提炼流水线召回延迟查询响应慢影响用户体验增加向量索引关键词索引记忆衰减旧记忆被遗忘导致知识丢失增加记忆重要性评分重要记忆长期保留四、关键指标Token降61%人格一致性48%→76%4.1 实测数据场景通过率Token提升WideSearch33% → 50%221M → 86M-61%SWE-bench58.4% → 64.2%--33%PersonaMem48% → 76%-58%4.2 为什么Token能降61%优化手段效果短期记忆结构化只看拓扑图不看全文长期记忆分层只召回相关层级标签索引精准定位减少扫描计算过程假设原始对话有1000条消息每条500字无记忆系统每次对话都带上全部1000条消息 500KB有记忆系统只带上相关记忆约50条 25KB节省(500-25)/500 95%实际测试中由于需要保留部分上下文节省约61%。4.3 为什么人格一致性提升58%因素说明L3 Persona用户画像有证据链可回溯每个画像条目可追溯来源能更新画像随对话动态更新实际案例场景无画像有画像用户说我喜欢PythonAI忘记AI记住并推荐Python相关用户说我是初学者AI给高级内容AI给入门内容用户说我之前问过AI说没问过AI找到之前的问题五、系统记忆实战案例5.1 当前记忆状态指标当前值目标值进化条目28条100条胶囊数量705个1000个质量评分0.7790.85Token使用未量化需统计5.2 召回质量如何量化指标计算方法目标值召回准确率召回相关条目/总相关条目≥85%召回延迟从查询到返回的时间≤100msToken效率有效Token/总Token≥70%5.3 升级建议{id:gene_003_memory_optimization,parent_gene_ids:[gene_001_initial],child_gene_ids:[gene_004_fix],causal_mechanism:累加型,effect_size:0.35,confidence:0.82,memory_node_id:node_123,trace_id:trace_abc,source_capsule:capsule_001}新增字段说明字段说明memory_node_id记忆节点IDtrace_id追溯链路IDsource_capsule来源胶囊ID六、下一步行动清单6.1 短期本周优先级任务负责模块状态P0短期记忆Mermaid化上下文管理 待启动P0长期记忆node_id标注通讯总线 待启动P1Token统计工具执行层 规划中P1标签索引系统进化模块 规划中6.2 中期本月优先级任务负责模块状态P1L3用户画像自动化执行层 规划中P1trace_id回溯链路架构 待排期P2Mermaid任务画布通讯总线 待升级常见坑自查清单坑现象自查方法修复方案记忆堆积召回质量差检查token使用增加标签索引画像失真人格不一致检查证据链增加来源追溯短期过载上下文膨胀检查摘要质量增加拓扑图召回延迟响应慢检查索引结构增加时间窗口分层混乱L0-L3混淆检查提炼流程标准化流水线结语Memory不是为了让AI存下所有东西而是为了让人不必重复所有事情。系统的下一步短期记忆从纯文本到Mermaid拓扑图长期记忆从扁平存储到L0→L3分层召回优化从全文搜索到标签索引时间窗口下一个小目标让记忆系统可追溯、能更新、召回准。互动问题1你的AI系统有失忆症吗如何解决的问题2你觉得记忆系统的核心是存储量还是召回质量评论区见如果觉得这篇文章对你有帮助点赞—— 让更多人看到这篇文章收藏—— 方便日后回顾和查阅➕关注—— 持续获取更多AI深度内容标签: #TencentDB #AgentMemory #分层记忆 #AI记忆系统 #多Agent系统附录记忆系统实施检查表A.1 短期记忆实施检查原始日志是否按时间顺序存储步骤摘要是否提炼关键信息Mermaid拓扑图是否反映当前任务状态拓扑图是否包含下一步行动指引Token使用是否有统计A.2 长期记忆实施检查L0原始对话是否完整保留L1原子事实是否结构化存储L2场景模式是否从原子事实聚合L3用户画像是否有证据链每个条目是否有来源追溯画像是否支持动态更新A.3 召回系统实施检查标签索引是否覆盖所有记忆条目时间窗口过滤是否生效召回准确率是否≥85%召回延迟是否≤100msToken效率是否≥70%A.4 质量保障检查记忆条目是否有质量评分低质量条目是否定期清理重要记忆是否长期保留记忆系统是否有备份机制字数: 6500字日期: 2026-05-19

相关文章:

从L0到L3的完整路径,Token降61%的底层逻辑,TencentDB Agent Memory实战:分层记忆架构详解

TencentDB Agent Memory实战:分层记忆架构详解 副标题: 从L0到L3的完整路径,Token降61%的底层逻辑痛点:为什么你的AI总是"记不住"? 你有没有遇到过这样的情况: AI能记住前几轮对话,但聊久了就&qu…...

Android Studio中文插件终极指南:3分钟告别英文开发环境

Android Studio中文插件终极指南:3分钟告别英文开发环境 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack 还在为Androi…...

因果推理第四层盲区:为什么关联≠因果

因果推理第四层盲区:为什么关联≠因果 副标题: 从Pearl因果阶梯到知识库因果链,AI如何跨越观测vs建模的鸿沟痛点:为什么你的AI只能"描述"不能"规划"? 你有没有遇到过这样的情况: AI能告诉你"…...

5G网络优化实战:手把手教你读懂CSI-RS配置参数与UE测量上报流程

5G网络优化实战:手把手教你读懂CSI-RS配置参数与UE测量上报流程 在5G网络优化工作中,CSI-RS(Channel State Information Reference Signal)作为关键的下行参考信号,直接影响着网络性能调优的精准度。本文将带您深入理解…...

保姆级教程:用Python+Matplotlib处理微波辐射计LV2数据,绘制专业温度廓线图

科研级气象数据可视化:PythonMatplotlib处理微波辐射计数据的完整实践指南 清晨5点23分,实验室的微波辐射计刚刚完成一次完整的温度廓线扫描。屏幕上跳动的数字背后,隐藏着从地面到平流层的大气热力学密码。对于大气科学研究者而言&#xff0…...

STM32F103C8T6最小系统板避坑指南:从ST-LINK接线到Keil5乱码,新手必看的5个实战问题

STM32F103C8T6最小系统板避坑指南:从ST-LINK接线到Keil5乱码,新手必看的5个实战问题 第一次点亮STM32开发板的LED时,那种成就感就像电子工程师的"成人礼"。但通往成功的路上往往布满荆棘——接错一根线可能导致整晚的调试失败&…...

QGIS二次开发实战:手把手教你用C++ API为矢量点数据实现动态分级渲染(附完整代码)

QGIS二次开发实战:C API实现矢量点数据动态分级渲染 在GIS应用开发中,数据可视化是核心需求之一。当我们需要展示实时传感器数据、业务指标或环境监测数据时,如何让用户一眼看出数值分布和热点区域?分级渲染技术正是解决这一问题的…...

【SysBench】从零到一:在Linux上部署sysbench-1.20进行数据库压测

1. 为什么你需要sysbench? 如果你正在使用MySQL或PostgreSQL这类数据库,迟早会遇到一个灵魂拷问:我的数据库到底能扛住多少并发请求?这时候sysbench就该登场了。这个工具就像数据库的"体能测试仪",能模拟真实…...

Windows Cleaner终极指南:3分钟解决C盘爆满,让电脑重获新生![特殊字符]

Windows Cleaner终极指南:3分钟解决C盘爆满,让电脑重获新生!🚀 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是…...

别再为JDK版本头疼了!用Adoptium JRE 13搞定OpenTCS 5.11开发环境(附完整变量配置)

开源AGV调度系统OpenTCS 5.11开发环境配置实战指南 在自动化物流系统开发领域,OpenTCS作为一款功能强大的开源交通控制系统,正逐渐成为AGV(自动导引车)调度解决方案的热门选择。然而对于初次接触该系统的开发者而言,J…...

别再手动导数据了!用PostgreSQL FDW把ClickHouse和MongoDB变成你的“超级外挂”数据仓库

异构数据联邦实战:用PostgreSQL FDW构建零延迟数据枢纽 当业务数据散落在多个异构数据库中时,传统ETL方案就像用卡车在不同仓库之间搬运货物——不仅耗时耗力,数据新鲜度也难以保证。想象一下:用户画像在PostgreSQL,行…...

Claude Code质量崩了?Anthropic认错;3人+100个AI月烧130万美元,炸了

每天更新,带你读懂科技圈。 今日看点: Anthropic正式发布Claude Code质量事故复盘;OpenClaw之父晒出130万美元月账单——3人100个AI agent震撼业界;Hermes团队砍掉预训练六成成本;GitHub Copilot推桌面应用狙击AI编程对…...

Windows Subsystem for Android终极指南:5大核心优势与完整开发实战

Windows Subsystem for Android终极指南:5大核心优势与完整开发实战 【免费下载链接】WSA Developer-related issues and feature requests for Windows Subsystem for Android 项目地址: https://gitcode.com/gh_mirrors/ws/WSA Windows Subsystem for Andr…...

冥想第一千八百八十二天(1882)

1.周六,醒的很早,然后去锦和公园转了一圈,一直在等待大雨,结果到了傍晚才下,浪费了一天,不过天气很不好,就不适合外出了。敬畏大自然。 2.感谢父母,感谢朋友,感谢家人&am…...

Keil MDK中HEX文件未生成的8.3路径问题解析

1. 问题现象与背景解析 在嵌入式开发领域,Keil MDK(Microcontroller Development Kit)是广泛使用的集成开发环境,尤其针对C166系列微控制器。最近遇到一个典型问题:开发者在Vision1环境中配置了L166链接器和OH166 HEX转…...

对比ubuntu本地直接调用与通过taotoken调用的开发便捷性

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比 Ubuntu 本地直接调用与通过 Taotoken 调用的开发便捷性 在 Ubuntu 等 Linux 开发环境中集成大模型能力,开发者通常…...

终极指南:3分钟快速安装Windows官方包管理器Winget

终极指南:3分钟快速安装Windows官方包管理器Winget 【免费下载链接】winget-install Install WinGet using PowerShell! Prerequisites automatically installed. Works on Windows 10/11 and Server 2019/2022. 项目地址: https://gitcode.com/gh_mirrors/wi/win…...

明日方舟自动化:用MAA重构你的游戏体验,告别重复劳动

明日方舟自动化:用MAA重构你的游戏体验,告别重复劳动 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: h…...

别再只盯着大厂光环了:聊聊外包经历对技术人真正的价值与局限

外包经历的技术价值辩证:从职业跳板到能力陷阱的深度思考 当招聘网站上"大厂外包"的职位描述与诱人薪资同时出现时,很多技术人都会面临职业选择的十字路口。我们习惯性地将外包岗位视为"二等公民",却鲜少客观分析这段经历…...

Windows Cleaner:免费开源的系统优化神器,彻底告别C盘爆红烦恼

Windows Cleaner:免费开源的系统优化神器,彻底告别C盘爆红烦恼 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是否经常被Windows系统C盘…...

Armv9内存拷贝指令优化与性能调优

1. Arm架构内存拷贝指令深度解析在Armv9架构中,内存拷贝操作通过FEAT_MOPS(Memory Operations)特性得到显著增强。这套指令集专为高效内存操作设计,其中CPYFP/CPYFM/CPYFE系列指令实现了分阶段的内存拷贝机制。与传统的循环拷贝相比,这种设计…...

从零到部署:用VirtualBox免费搭建你的第一个Linux服务器(CentOS 7 + 静态IP + Xshell连接)

从零到部署:用VirtualBox免费搭建你的第一个Linux服务器(CentOS 7 静态IP Xshell连接) 在技术学习与开发实践中,拥有一个稳定可靠的Linux服务器环境是每个开发者成长的必经之路。对于预算有限的个人开发者、学生群体或刚接触运维…...

ContextMenuManager:5分钟掌握Windows右键菜单管理的终极免费方案

ContextMenuManager:5分钟掌握Windows右键菜单管理的终极免费方案 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否厌倦了每次右键点击文件时&a…...

初创团队如何利用 Taotoken 模型广场快速进行 AI 技术选型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初创团队如何利用 Taotoken 模型广场快速进行 AI 技术选型 对于资源有限的初创团队而言,在产品原型阶段快速验证想法是…...

3步深度解决方案:彻底修复Krita AI Diffusion插件IP-Adapter缺失问题

3步深度解决方案:彻底修复Krita AI Diffusion插件IP-Adapter缺失问题 【免费下载链接】krita-ai-diffusion Streamlined interface for generating images with AI in Krita. Inpaint and outpaint with optional text prompt, no tweaking required. 项目地址: h…...

别再只认Revit了!盘点7种主流BIM数据格式(RVT/IFC/FBX...)的优缺点与选型指南

建筑数字化进阶指南:7大BIM数据格式深度解析与实战选型策略 在建筑信息模型(BIM)与地理信息系统(GIS)加速融合的今天,数据格式的选择直接影响着项目协同效率与成果交付质量。当设计院的Revit模型需要与施工…...

可定制尺寸的工业烤盘公司

江苏台烁是专注为大中型食品生产企业提供可定制尺寸全品类工业烤盘的专业厂商,核心竞争优势为全尺寸高精度定制能力搭配智能生产体系,可提供节能耐用、适配产线的工业化烘焙器具解决方案。核心优势与关键数据生产与资质基础:拥有4.8万㎡智能工…...

【LangChain 】从一行 LCEL 代码,理解 LangChain 管道操作符 `|` 的自动转换机制

从一行 LCEL 代码,理解 LangChain 管道操作符 | 的自动转换机制一、从一个代码片段说起 先看这段处理用户反馈的 LCEL 代码: processing_chain (extract_chain| RunnablePassthrough.assign(analysislambda x: analysis_chain.invoke(x["original_…...

别再只会用menuconfig了!手把手教你为ESP32项目定制专属Kconfig配置菜单

从配置使用者到设计者:ESP32项目中的Kconfig高级定制指南 在ESP-IDF开发环境中,menuconfig几乎是每个开发者每天都要接触的工具。但大多数开发者仅仅停留在"使用者"层面——他们知道如何勾选选项、调整参数,却很少思考这些配置菜单…...

告别Keil报错!手把手教你用MDK为国民技术N32G030K8L7搭建标准工程模板

国民技术N32G030K8L7开发实战:从零构建MDK工程模板的避坑指南 引言:为什么你的Keil工程总是编译失败? 刚拿到国民技术N32G030K8L7开发板时,许多开发者会直接套用STM32的工程模板习惯,结果在MDK环境下遭遇各种"玄学…...