当前位置：首页 > article >正文

AI的记忆问题解决了！最强记忆基准99%的准确率

article 2026/3/24 21:49:31

AI的记忆能力正在迎来一次重大的飞跃。Supermemory团队近期公布了一项研究成果他们构建的一个实验性AI智能体流程在LongMemEval基准测试中达到了接近99%的准确率。团队表示这是智能体记忆前沿的新突破。智能体的记忆问题也许完全解决了Agent memory might be completely solved now。这项技术摆脱了传统向量数据库和嵌入的限制以一种全新的方式处理海量、复杂和随时间变化的信息。未来高度个性化AI智能体即将到来。AI记忆的新突破长期记忆是AI发展的关键挑战之一。要让AI真正理解和运用信息特别是处理那些跨越多个对话会话、包含矛盾信息、并随时间推移而更新的事实需要一种超越传统方法的记忆系统。LongMemEval基准测试正是为模拟这种真实世界的复杂性而设计的它包含了超过115,000个token的对话历史以及需要时间推理的问题。大多数现有的记忆系统在面对这些挑战时往往败在信息检索的准确性上即使能够检索到信息如果包含大量噪音大型语言模型LLM也难以有效利用。一个核心的难题在于如何准确地提取必要信息并判断一个已检索到的事实是否已被更新的事实所取代。Supermemory团队的解决方案名为ASMRAgentic Search and Memory Retrieval彻底改变了信息处理的思路。这项技术不仅易于实现更关键的是它完全不需要向量数据库或嵌入所有操作都可以在内存中完成这为将其集成到各种系统中甚至包括机器人打开了方便之门。多智能体并行协作的机制ASMR的核心在于其创新的数据摄取和检索管道。与传统的按块分割和嵌入用户会话不同ASMR部署了一个由三个并行读取观察智能体组成的智能体编排器。这些智能体基于Gemini 2.0 Flash模型能够并发读取原始对话记录并针对个人信息、偏好、事件、时间数据、更新内容以及助手信息这六个维度进行目标化知识提取。提取出的结构化信息随后以原生格式存储并与它们的来源会话进行映射。当用户提出问题时ASMR不依赖于查询向量数据库。取而代之的是它部署了三个并行搜索智能体每个智能体都有特定的搜索侧重。第一个智能体负责搜索直接事实和明确陈述第二个智能体则关注相关的上下文、社交线索和潜在的含义第三个智能体则致力于重构时间线和关系图谱。编排器会汇总所有搜索智能体的发现提取逐字会话摘录以进行详细验证从而实现基于实际认知理解而非仅仅关键词或数学相似度的智能检索。为了应对LongMemEval测试中多样化的提问类型ASMR设计了两种不同的智能体回答流程。第一种是“8-变体合集”。在此流程中检索到的上下文被路由到8个高度专业化的提示变体中进行并行处理。每个变体独立评估上下文并生成答案。只要其中8个不同的推理路径之一能够成功得出正确答案该问题就被标记为正确。这种并行多重判断的方法使得整体准确率达到了令人瞩目的98.60%。第二种是“12-变体决策森林”。在这个流程中12个高度专业化的智能体基于GPT-4o-mini独立回答问题。随后一个聚合器AggregatorLLM充当最终的裁判。聚合器通过多数投票、领域信任度和冲突解决机制综合12个答案得出一个单一的、权威性的结论。这一共识模型也实现了高达97.20%的准确率。关键洞察与未来展望构建一个在生产级基准测试中达到近99%准确率的系统为Supermemory团队带来了几个重要的工程洞察。智能体检索优于向量搜索。抛弃向量嵌入转向主动搜索智能体是实现突破的关键。智能体通过主动搜索上下文有效避免了传统RAG在处理时间变化和信息更新时遇到的“语义相似性陷阱”。并行处理至关重要。将数据摄取和信息检索工作负载分配给多个专用智能体3个读取3个搜索极大地提高了信息提取的速度和精度。同时每个智能体都有其专门的侧重点这有助于防止信息冲突。专精化胜过泛化。将上下文路由到专门的智能体如“反驳者”或“细节提取者”进行处理其效果远远优于使用单个通用提示。尽管这是一个实验性的沙盒环境而非Supermemory的核心生产引擎但团队计划将完整的代码开源以供AI社区学习和构建。他们正在积极探索将这些纯智能体检索技术应用于核心生产环境。预计4月初Supermemory将公开发布并开源这一新智能体记忆系统的所有细节。AI的记忆问题或许真的已经找到了解决之道Supermemory这篇文章引起了不小的轰动。许多网友表示太烧Token了吧、3并行摄入 12判断慢贵。研究员表示开源的3B中国模型技术上也是可以的。ASMR真的解决了记忆问题吗网友们表示还有三大挑战如此多LLM调用的延迟挑战规模到百万Token时仍需验证摄入质量上游应该存储什么数据仍是天花板。参考资料https://x.com/DhravyaShah/status/2035517012647272689https://github.com/supermemoryai/supermemory

AI的记忆问题解决了！最强记忆基准99%的准确率

相关文章：

AI的记忆问题解决了！最强记忆基准99%的准确率

并网逆变器自适应控制：基于阻抗测量的参数辨识与PR控制器自整定

M10嵌入式开发：Zynq PL-PS协同实现信号I/O与寄存器控制

FLUX.1-dev效果验证：第三方评测机构对120亿参数模型的真实打分

若依前后端分离版实现MQTT消息实时推送

揭秘MCP Sampling接口RT飙升300%的真相：从gRPC拦截器到异步缓冲的7层调用链深度剖析

集团数字化建设里程碑：DMS/TMS与LIMS系统全面启动，赋能质量管理体系

JS射线法实战：5分钟搞定电子围栏与快递区域判断（附完整代码）

163MusicLyrics：一站式音乐歌词获取与管理工具完全指南

新手也能搞定的1kHz正弦波发生器：用运放和文氏电桥从仿真到洞洞板的完整避坑指南

全球UV打印机市场洞察：规模增长与竞争格局演变

CH592/CH582触摸按键开发实战：从官方例程到自定义按键（附完整代码）

GitHub Trending榜首：Python Agentic RAG企业级落地指南

别再混淆了！一文搞懂PyTorch中torch.cat()与torch.stack()的区别

BooruDatasetTagManager：从零到精通的智能图像标注全攻略

K8s节点死活加不进来？别急着重装，先检查这几个残留文件和端口（附一键清理脚本）

手把手教你：用lychee-rerank-mm给爬虫数据打分，绿色高分直接采用

棋盘多项式-进阶题17

MOSFET五大失效机理与工程防护指南

Qwen3-ASR-1.7B歌唱识别专项：流行歌曲歌词转录挑战

OFA图像描述模型Node.js环境配置：构建高性能图像描述API服务

威联通NAS+Docker Compose：打造全能媒体中心实战指南

论文图表救急包：5分钟学会AI/PSD转EPS矢量图的正确姿势

从Firebase迁移到Supabase：一个前端开发者的真实踩坑与平滑过渡指南

[知识自由获取]：智能适配技术驱动的内容访问优化解决方案

OpenClaw故障自愈方案：QwQ-32B监控脚本异常并自动恢复

数据质量评估：清洗前后的量化对比方法

用Flink Table API实现流批一体：订单数据SQL化处理与可视化实战

机器学习超清晰通俗讲解 + 核心算法全解（深度+易懂版）

AI 智能体（Agent）的开发费用