当前位置：首页 > news >正文

【大模型上下文长度扩展】MedGPT：解决遗忘 + 永久记忆 + 无限上下文

news 2026/2/9 14:10:35

MedGPT：解决遗忘 + 永久记忆 + 无限上下文

问题：如何提升语言模型在长对话中的记忆和处理能力？
子问题1：有限上下文窗口的限制
子问题2：复杂文档处理的挑战
子问题3：长期记忆的维护
子问题4：即时信息检索的需求
MemGPT 结构图

问题：如何提升语言模型在长对话中的记忆和处理能力？

论文：https://arxiv.org/abs/2310.08560

代码：https://github.com/cpacker/MemGPT#loading-local-files-into-archival-memory

MemGPT是为了解决“信息处理和记忆管理”的问题类别提出的。

具体问题是，在长期对话或处理大量文档时，传统聊天机器人无法记住所有信息，需要一种系统来扩展其记忆和处理能力。

是模仿了计算机操作系统中的内存管理，通过“分页”技术来扩展其记忆能力。

内存存放 “主记忆”，来处理当前的对话
硬盘存储 “外部记忆”，来回溯和引用以前存储的信息

当机器人需要回忆旧信息时，它可以从外部记忆中提取这些信息，就像人们从书架上取下一本旧书一样。

模仿计算机的内存管理机制
将不常用的数据页换出到硬盘，需要时再加载回内存
在不丢失过往信息的前提下，提升了对话的质量和文档处理的能力

这使得MemGPT可以处理非常长的对话（无限上下文），同时记住用户的所有偏好和历史，使交流更加个性化和连贯。

子问题1：有限上下文窗口的限制

背景: 现有语言模型因为上下文窗口大小有限，不能持续记住长对话中的所有信息。
子解法1: 外部存储上下文窗口扩展
- 特征: 使用外部存储来模拟无限上下文，让模型可以在需要时检索之前的对话内容。
- 例子: 就像玩具箱，当你的房间（主记忆）满了，你就把一些玩具放到玩具箱里（外部记忆），需要时再拿出来。

在这里插入图片描述

对话开始时，MemGPT（聊天机器人）和用户进行问候，并表现出对用户的兴趣，提到了F1赛车和帆船。
用户回复，表达了他对速度、刺激和肾上腺素的热爱。
系统随后发出警告，指出对话历史即将达到其最大长度并且将被修剪，提示MemGPT保存任何重要信息。
为响应这一警告，MemGPT使用了一个命令 working_context.append()，将用户的个性特征——享受高速、肾上腺素激增活动如F1赛车和CSGO游戏——添加到了工作上下文中。

这是MemGPT的一种记忆保存机制，可以在对话历史被修剪之前，将用户提供的关键信息保存下来。

这段对话体现了MemGPT如何动态管理对话内容，以确保即使在达到记忆容量上限时，也不会丢失对未来对话可能重要的用户信息。

通过这样的管理，MemGPT保持了对话的连贯性，并能够在未来的交互中利用这些信息，提供更个性化和相关的响应。

子问题2：复杂文档处理的挑战

背景: 当文档超出模型直接处理的长度时，模型难以理解整个文档内容。
子解法2: 分页长文档记忆检索
- 特征: 将长文档分成可管理的段落，逐段加载进行处理。
- 例子: 如果有一本很厚的故事书，你可能一次只能读几页，MemGPT可以通过“翻页”来继续阅读整个故事。

在这里插入图片描述

这张图展示了MemGPT在对话中的应用，具体是如何把对话中的重要信息保存到工作上下文中。

首先，MemGPT向用户Chad表示欢迎，并表现出对Chad的研究兴趣。这展示了MemGPT可以自然地开始对话，并表明了它对用户信息的兴趣。
用户回复说他今天休息，并提到了他妈妈为他做了生日蛋糕，是他最喜欢的巧克力熔岩蛋糕。
接下来，MemGPT使用命令working_context.append()将用户的生日（10月11日）和喜欢的蛋糕类型（由妈妈做的巧克力熔岩蛋糕）添加到它的工作上下文中。这是MemGPT记忆管理的一个例子，它能够抓住对话中的关键信息并保存下来。
然后，MemGPT使用这些信息来继续对话，祝Chad生日快乐，并询问Chad的年龄，同时表达希望让当天的聊天成为Chad的美好记忆。

图中的描述说明了MemGPT如何有效地在没有系统记忆警告的情况下，积极记录并利用对话中的信息。

这种能力对于创建能够维持连续对话并在多次互动中保持个性化交流的聊天机器人至关重要。

通过这种方式，MemGPT能够记住对用户重要的日期和细节，这有助于在未来的对话中创建更有深度和连贯性的体验。

子问题3：长期记忆的维护

背景: 对话代理在长时间的互动中需要保持信息的连贯性和个性化。
子解法3: 动态记忆更新
- 特征: 允许模型实时更新其记忆库，以包含新信息或修正旧信息。
- 例子: 如果你告诉MemGPT你换了新工作，它会更新它的记忆，下次对话时会询问你的新工作情况。

在这里插入图片描述
这张图展示 MemGPT 如何更正并更新关于用户的信息，以维护对话的准确性和连贯性。

首先，MemGPT问用户是否想聊关于恐怖电影的话题，并询问是否有最近看的电影给他留下了深刻印象。
用户回答说他实际上并不喜欢恐怖电影，而是更喜欢浪漫喜剧。
接着，MemGPT使用了一个命令 working_context.replace('I watch horror movies.','I like romantic comedies.') 来更正之前的信息。这意味着MemGPT在其工作上下文中替换了关于用户喜好的错误信息。
MemGPT随后用一条更新后的信息回应用户，不仅纠正了之前的错误，还询问用户是否有喜欢的浪漫喜剧电影，这表明MemGPT能够根据新的输入动态调整它的对话策略。

这个过程说明了MemGPT不仅能记忆用户提供的信息，还能在发现错误或更新的信息时进行自我修正。

这种能力对于创建能够与用户进行连续且个性化对话的聊天机器人是非常重要的。

通过这样的动态记忆更新，MemGPT能够维护对话的一致性，即使在长期的交互中也能保持个性化和相关性。

子问题4：即时信息检索的需求

背景: 用户可能会询问与过去对话相关的问题，模型需要快速提供准确回答。
子解法4: 快速信息检索
会在放东西的地方做个标记，这样下次就能快速找到。
- 特征: 模型能够迅速访问存储的信息，以回答用户的提问。
- 例子: 类似于谷歌搜索，当用户问到之前的话题，比如之前提过的喜欢的书，MemGPT能快速找到那次对话的内容。

在这里插入图片描述
这张图是MemGPT中的“深度记忆检索任务”（Deep Memory Retrieval Task）的示例。

演示了如何使用MemGPT来回忆并检索与用户先前会话相关的信息。

具体来说：

对话框显示用户问了一个问题，提到了之前的一个对话，询问：“你之前提到的你可能会喜欢的艺术家是谁？” 这表明用户希望MemGPT能记住他们以前讨论过的内容。
在用户的对话框旁边，有一段描述，解释说用户正在回忆过去的对话，并且MemGPT将搜索其“回忆存储”以找到艺术家的名字。
接下来，MemGPT使用命令search_recall_storage('music')来执行这一操作，这显示了MemGPT的能力，可以检索其存储的记忆以找到具体的信息。
展示的搜索结果是先前对话的一部分，这些对话提到了Taylor Swift，表明这可能是用户想起的艺术家。
最后，MemGPT确认了从对话历史中检索到的信息，并向用户确认艺术家是不是Taylor Swift。

即使某些信息不再处于当前上下文中，MemGPT也可以访问其记忆库中存储的过去对话，从而在必要时提供相关信息。

这种功能对于构建能够进行长期和深层次交互的对话代理至关重要，因为它使得代理能够记住用户的兴趣和历史，使对话更加个性化和连贯。

MemGPT通过外部存储扩展上下文窗口、分页长文档记忆检索、动态记忆更新和快速信息检索等多种方法，解决了传统语言模型在长对话和复杂任务处理中的限制。

这些方法的共同目标是使模型能够存储更多信息，更加智能地管理这些信息，并在需要时快速检索相关内容，从而使对话更加连贯和个性化。

MemGPT 结构图

在这里插入图片描述
将固定上下文的语言模型与包括主上下文、外部上下文和记忆管理功能的记忆系统整合在一起。

通过事件、解析、语言模型处理和功能执行的数据流动。

【大模型上下文长度扩展】MedGPT：解决遗忘 + 永久记忆 + 无限上下文

MedGPT：解决遗忘永久记忆无限上下文问题：如何提升语言模型在长对话中的记忆和处理能力？子问题1：有限上下文窗口的限制子问题2：复杂文档处理的挑战子问题3：长期记忆的维护子问题4：即时信息检…...

编程日记 2024/2/9 3:34:25

谷歌seo搜索引擎优化有什么思路？

正常做seo哪有那么多思路，其实就那么几种方法，无非就关键词，站内优化，外链，可以说万变不离其宗，但如果交给我们，你就可以实现其他的思路，或者说玩法收录可以说是一个网站的基础&…...

编程日记 2024/2/9 3:33:24

腾讯云与IBM共同打造“高性能计算服务解决方案“

腾讯云与IBM共同打造"高性能计算服务解决方案" 腾讯云与IBM达成战略合作，对优势产品及服务进行深度集成，基于腾讯云产品及服务，共同打造"腾讯-IBM混合云与人工智能解决方案"。双方通过更为紧密的嵌入式解决方案的深度合…...

编程日记 2024/2/9 3:31:22

【SparkML实践7】特征选择器FeatureSelector

本节介绍了用于处理特征的算法，大致可以分为以下几组： 提取（Extraction）：从“原始”数据中提取特征。转换（Transformation）：缩放、转换或修改特征。选择（Selection&…...

编程日记 2024/2/9 3:30:21

LeetCode983. Minimum Cost For Tickets——动态规划

文章目录一、题目二、题解一、题目 You have planned some train traveling one year in advance. The days of the year in which you will travel are given as an integer array days. Each day is an integer from 1 to 365. Train tickets are sold in three differen…...

编程日记 2024/2/9 3:28:18

百卓Smart管理平台 uploadfile.php 文件上传漏洞【CVE-2024-0939】

百卓Smart管理平台 uploadfile.php 文件上传漏洞【CVE-2024-0939】一、产品简介二、漏洞概述三、影响范围四、复现环境五、漏洞复现手动复现小龙验证Goby验证免责声明：请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息或者工…...

编程日记 2024/2/9 3:27:18

项目中常用的一些数据库及缓存

1、常见的开发工具介绍 MySQL: MySQL是一种流行的开源关系型数据库管理系统（RDBMS），由瑞典MySQL AB公司开发，并在后来被Sun Microsystems收购，最终成为Oracle公司的一部分。MySQL广泛用于各种Web应用程序和大型企业应…...

编程日记 2024/2/9 3:26:16

MoE-LLaVA:具有高效缩放和多模态专业知识的大型视觉语言模型

视觉和语言模型的交叉导致了人工智能的变革性进步，使应用程序能够以类似于人类感知的方式理解和解释世界。大型视觉语言模型(LVLMs)在图像识别、视觉问题回答和多模态交互方面提供了无与伦比的能力。 MoE-LLaVA利用了“专家混合”策略融合视觉和语言数据&#xff0…...

编程日记 2024/2/9 3:25:15

【Java】ArrayList和LinkedList的区别是什么

目录 1. 数据结构 2. 性能特点 3. 源码分析 4. 代码演示 5. 细节和使用场景 ArrayList 和 LinkedList 分别代表了两类不同的数据结构：动态数组和链表。它们都实现了 Java 的 List 接口，但是有着各自独特的特点和性能表现。 1. 数据结构 ArrayList…...

编程日记 2024/2/9 3:23:13

RabbitMQ-4.MQ的可靠性

MQ的可靠性 4.MQ的可靠性4.1.数据持久化4.1.1.交换机持久化4.1.2.队列持久化4.1.3.消息持久化 4.2.LazyQueue4.2.1.控制台配置Lazy模式4.2.2.代码配置Lazy模式4.2.3.更新已有队列为lazy模式 4.MQ的可靠性消息到达MQ以后，如果MQ不能及时保存，也会导致消…...

编程日记 2024/2/9 3:22:12

编程相关的经典的网站和书籍

经典网站： Stack Overflow：作为全球最大的程序员问答社区，Stack Overflow 汇聚了大量的编程问题和解答，为程序员提供了极大的帮助。GitHub：全球最大的开源代码托管平台，程序员可以在上面共享自己的项目代码…...

编程日记 2024/2/9 3:17:08

Java代码实现基数排序算法（附带源码）

基数排序是一种非比较型整数排序算法，其原理是将整数按位数切割成不同的数字，然后按每个位数分别比较。由于整数也可以表达字符串（比如名字或日期）和特定格式的浮点数，所以基数排序也不是只能使用于整数。 1. 基数排序…...

编程日记 2024/2/9 3:13:04

基于python+django，我开发了一款药店信息管理系统

功能介绍平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。功能包括：药品管理、分类管理、顾客管理、用户管理、日志管理、系统信息模块。代码结构 server目录是后端代码web目录是前端代码部署运行…...

编程日记 2024/2/9 3:12:03

VSCODE使用ssh远程连接时启动服务器失败问题

错误情况 ping服务器的ip可通并且使用terminal可以ssh连接到远程服务器。但使用vscode的remote-ssh时，在「输出」栏出现了一直报 Waiting for server log… 的情况！ 解决方法一重置服务器设置，包括以下手段： 1.清理服务器端的…...

编程日记 2024/2/9 3:11:01

easyexcle 导出csv

导入jar <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.3.3</version></dependency>代码 private static List<List<String>> head() {List<List<String>&g…...

编程日记 2024/2/9 3:08:59

Ubuntu22.04 gnome-builder gnome C 应用程序习练笔记(一)

一、序言 gnome-builder构建器是gnome程序开发的集成环境，支持主力语言C, C, Vala, jscript, python等，界面以最新的 gtk 4.12 为主力，将其下版本的gtk直接压入了depreciated，但gtk4.12与普遍使用的gtk3有很大区别，原…...

编程日记 2024/2/9 3:07:58

ESP32QRCodeReader库使用，ESP32-CAM识别二维码并向自写接口发出请求确认身份。

#include <Arduino.h> #include <WiFi.h> #include <HTTPClient.h> #include <ESP32QRCodeReader.h>#define WIFI_SSID "username" #define WIFI_PASSWORD "password" // 连接电脑主机的IP地址的8088端口 #define WEBHOOK_URL &qu…...

编程日记 2024/2/9 3:05:56

什么是网络渗透，应当如何防护？

什么是网络渗透网络渗透是攻击者常用的一种攻击手段，也是一种综合的高级攻击技术，同时网络渗透也是安全工作者所研究的一个课题，在他们口中通常被称为"渗透测试(Penetration Test)"。无论是网络渗透(Network Penetration)还是渗透…...

编程日记 2024/2/9 3:04:56

掌握C++中的动态数据：深入解析list的力量与灵活性

1. 引言简介std::list和其在C中的角色 std::list是C标准模板库（STL）中提供的一个容器类，实现了双向链表的数据结构。与数组或向量等基于连续内存的容器不同，std::list允许非连续的内存分配，使得元素的插入和删除操作…...

编程日记 2024/2/9 3:03:55

天地伟业接入视频汇聚/云存储平台EasyCVR详细步骤

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快，可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等，以及支持厂家私有协议与SDK接入，包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安…...

编程日记 2024/2/9 3:02:54

后进先出（LIFO）详解

LIFO 是 Last In, First Out 的缩写，中文译为后进先出。这是一种数据结构的工作原则，类似于一摞盘子或一叠书本： 最后放进去的元素最先出来 -想象往筒状容器里放盘子： （1）你放进的最后一个盘子&#xff08…...

编程新知 2026/2/8 1:22:58

HTML 语义化

目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性标准答案： 语义化标签： <header>：页头<nav>：导航<main>：主要内容<article>&#x…...

编程新知 2026/1/15 21:24:41

R语言AI模型部署方案：精准离线运行详解

R语言AI模型部署方案：精准离线运行详解一、项目概述本文将构建一个完整的R语言AI部署解决方案，实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点： 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...

编程新知 2025/12/6 1:56:35

通过Wrangler CLI在worker中创建数据库和表

官方使用文档：Getting started Cloudflare D1 docs 创建数据库在命令行中执行完成之后，会在本地和远程创建数据库： npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库： 现在，您的Cloudfla…...

编程新知 2026/1/31 6:18:08

【HarmonyOS 5.0】DevEco Testing：鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的一体化测试平台，覆盖应用全生命周期测试需求，主要提供五大核心能力： 测试类型检测目标关键指标功能体验基…...

编程新知 2026/1/28 8:17:53

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

MODBUS TCP转CANopen 技术赋能高效协同作业

在现代工业自动化领域，MODBUS TCP和CANopen两种通讯协议因其稳定性和高效性被广泛应用于各种设备和系统中。而随着科技的不断进步，这两种通讯协议也正在被逐步融合，形成了一种新型的通讯方式——开疆智能MODBUS TCP转CANopen网关KJ-TCPC-CANP…...

编程新知 2026/2/6 9:48:02

Qt Http Server模块功能及架构

Qt Http Server 是 Qt 6.0 中引入的一个新模块，它提供了一个轻量级的 HTTP 服务器实现，主要用于构建基于 HTTP 的应用程序和服务。功能介绍： 主要功能 HTTP服务器功能： 支持 HTTP/1.1 协议简单的请求/响应处理模型支持 GET…...

编程新知 2025/10/17 21:16:57

EtherNet/IP转DeviceNet协议网关详解

一，设备主要功能疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络，本网关连接到EtherNet/IP总线中做为从站使用，连接到DeviceNet总线中做为从站使用。在自动…...

编程新知 2026/1/31 6:53:51

QT： `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中，将 long long 类型转换为 QString 可以通过以下两种常用方法实现： 方法 1：使用 QString::number() 直接调用 QString 的静态方法 number()，将数值转换为字符串： long long value 1234567890123456789LL; …...

编程新知 2026/2/1 6:30:04

MedGPT：解决遗忘 + 永久记忆 + 无限上下文