当前位置: 首页 > article >正文

【实战】MemPalace 完整安装与使用指南

未来已来只需一句指令养龙虾专栏导航持续更新ing…什么是 MemPalaceMemPalace 是由好莱坞演员 Milla Jovovich《生化危机》《第五元素》主演与开发者 Ben Sigman 共同开发的本地 AI 记忆管理系统。它解决了传统 AI 对话中每次新开会话就失忆的核心痛点。核心理念不同于 Mem0、Zep 等系统让 AI 决定什么值得记住往往会丢弃推理过程和上下文MemPalace 选择存储所有对话原文通过向量搜索在需要时精准检索。这借鉴了古希腊记忆宫殿Method of Loci技巧——将信息按空间结构组织大幅提升检索效率。 前置环境条件1. Python 版本要求要求版本最低要求Python 3.9推荐版本Python 3.11性能最佳检查命令python--version# 或python3--version2. 包管理工具选择方案 Auv强烈推荐特点由 Astral 开发的现代 Python 包管理器速度极快支持自动 Python 版本管理安装curl-LsSfhttps://astral.sh/uv/install.sh|sh验证uv --version方案 Bpip venv传统方案Python 内置无需额外安装适合习惯传统工作流的用户3. 系统要求项目要求操作系统Linux / macOS / WindowsWindows 需设置PYTHONIOENCODINGutf-8内存至少 2GB 可用内存磁盘空间至少 500MB用于模型和向量数据库网络首次安装需下载 ONNX 嵌入模型约 80MB4. 模型下载说明首次运行时会自动下载all-MiniLM-L6-v2嵌入模型模型大小~79MB下载位置~/.cache/chroma/onnx_models/all-MiniLM-L6-v2/onnx.tar.gz作用将文本转换为 384 维向量用于语义相似度搜索 安装步骤方法一使用 uv推荐# 1. 创建虚拟环境自动安装 Python 3.11 如果未安装uv venv--pythonpython3.11 ~/.mempalace-venv# 2. 激活虚拟环境source~/.mempalace-venv/bin/activate# 3. 安装 MemPalaceuv pipinstallmempalace# 4. 验证安装mempalace--helpuv 的优势自动处理 Python 版本依赖解析速度比 pip 快 10-100 倍原子化安装失败自动回滚方法二使用 pip venv# 1. 创建虚拟环境python3.11-mvenv ~/.mempalace-venv# 2. 激活虚拟环境source~/.mempalace-venv/bin/activate# 3. 升级 pippipinstall--upgradepip# 4. 安装 MemPalacepipinstallmempalace# 5. 验证安装mempalace--help方法三全局安装⚠️ 不推荐pip3installmempalace为什么不推荐会污染系统 Python 环境可能导致依赖冲突且不利于后续卸载或版本管理。如下图所示 预下载模型网络慢的情况如果首次运行时下载模型超时可手动预下载# 1. 创建模型缓存目录mkdir-p~/.cache/chroma/onnx_models/all-MiniLM-L6-v2# 2. 下载模型cd~/.cache/chroma/onnx_models/all-MiniLM-L6-v2curl-L-oonnx.tar.gz https://chroma-onnx-models.s3.amazonaws.com/all-MiniLM-L6-v2/onnx.tar.gz# 3. 解压模型tar-xzfonnx.tar.gz️ 初始化与核心概念1. 初始化记忆宫殿# 激活环境source~/.mempalace-venv/bin/activate# 初始化项目扫描目录结构创建房间mempalace init /path/to/your/project初始化过程原理扫描目录结构识别项目文件、代码、文档实体检测自动识别人名、项目名如 “Kai”、“Driftwood”创建配置文件~/.mempalace/config.json全局配置~/.mempalace/wing_config.json翼楼映射~/.mempalace/identity.txt身份层L0记忆宫殿架构Wing 翼楼项目/人物Hall 大厅记忆类型Room 房间具体主题Closet 壁橱AAAK压缩摘要Drawer 抽屉原文存储核心概念解释概念说明类比Wing翼楼顶级容器每个项目或人物一个翼楼图书馆的不同分馆Hall大厅记忆类型走廊facts事实、events事件、discoveries发现、preferences偏好、advice建议图书馆的分类标签Room房间翼楼内的具体主题如 “auth-migration”、“pricing”图书馆的书架Closet壁橱存储 AAAK 压缩摘要指向原始内容书籍的索引卡片Drawer抽屉原始文件存储永不删除书籍本身2. 挖掘数据Mining项目文件挖掘# 挖掘代码、文档、笔记mempalace mine /path/to/your/project对话记录挖掘# 挖掘 Claude、ChatGPT、Slack 导出文件mempalace mine /path/to/chats--modeconvos# 自动分类为决策、里程碑等mempalace mine /path/to/chats--modeconvos--extractgeneral三种挖掘模式projects代码和文档按段落分块convos对话导出按问答对分块general自动分类为 decisions决策、milestones里程碑、problems问题、preferences偏好、emotional context情感上下文3. 搜索记忆# 基础搜索mempalace search为什么我们切换到 GraphQL# 在特定翼楼搜索mempalace search定价讨论--wingmy_app# 在特定房间搜索mempalace search定价讨论--wingmy_app--roomcosts# 查看状态mempalace status4. 唤醒上下文Wake-up# 显示 L0 L1 唤醒上下文约 170 tokensmempalace wake-up# 特定项目的唤醒上下文mempalace wake-up--wingmy_app四层记忆栈原理四层记忆栈主题匹配需要更多上下文语义搜索L0: Identity 身份层~50 tokens始终加载L1: Critical Facts 关键事实~120 tokens始终加载L2: Room Recall 房间回忆按需加载L3: Deep Search 深度搜索按需加载用户提问ChromaDB层级内容大小加载时机L0身份定义你是谁、AI 是谁~50 tokens始终加载L1关键事实团队、项目、偏好~120 tokensAAAK 压缩始终加载L2房间回忆当前主题相关会话可变主题匹配时L3深度语义搜索全文检索可变显式请求时成本对比基于 6 个月对话历史约 1950 万 tokens方案加载 Tokens年成本粘贴全部19.5M超出上下文窗口不可行LLM 摘要~650K~$507MemPalace wake-up~170~$0.70MemPalace 5 次搜索~13,500~$10 与 AI 集成Claude Code推荐方式 1插件市场安装claude plugin marketplaceaddmilla-jovovich/mempalace claude plugininstall--scopeuser mempalace方式 2手动 MCP 配置claude mcpaddmempalace -- python-mmempalace.mcp_server重启 Claude Code输入/skills验证 “mempalace” 是否出现。其他 MCP 兼容工具ChatGPT、Cursor、Gemini# 通用 MCP 配置命令claude mcpaddmempalace -- python-mmempalace.mcp_server配置后AI 可自动调用19 个 MCP 工具读取工具mempalace_status宫殿概览mempalace_list_wings列出翼楼mempalace_list_rooms列出房间mempalace_search语义搜索mempalace_kg_query知识图谱查询写入工具mempalace_add_drawer添加原文mempalace_diary_write写入代理日记本地模型Llama、Mistral 等方式 1唤醒命令mempalace wake-upcontext.txt# 将 context.txt 粘贴到本地模型的系统提示中方式 2命令行搜索mempalace searchauth decisionsresults.txt# 将结果包含在提示词中方式 3Python APIfrommempalace.searcherimportsearch_memories resultssearch_memories(auth decisions,palace_path~/.mempalace/palace)# 将结果注入本地模型上下文 目录结构详解安装后生成的文件结构~/.mempalace/ # 全局记忆宫殿 ├── palace.db # SQLite 元数据数据库 ├── chroma/ # ChromaDB 向量数据库 ├── config.json # 全局配置 ├── wing_config.json # 翼楼映射配置 ├── identity.txt # 身份层L0 └── wings/ # 翼楼目录 ├── wing_kai/ # 人物翼楼示例 │ ├── hall_facts/ │ ├── hall_events/ │ ├── hall_discoveries/ │ ├── hall_preferences/ │ └── hall_advice/ └── wing_driftwood/ # 项目翼楼示例 └── ... /path/to/your/project/ # 项目目录 ├── mempalace.yaml # 项目特定配置可选 └── .mempalace_entities.json # 项目实体检测缓存️ 常见问题与解决方案Q: pip: command not found解决方案# 使用 pip3pip3installmempalace# 或安装 uv推荐curl-LsSfhttps://astral.sh/uv/install.sh|shQ: Python 版本过低 3.9解决方案# 使用 uv 安装新 Pythonuv pythoninstall3.11uv venv--pythonpython3.11 ~/.mempalace-venvQ: 下载模型超时解决方案手动预下载模型见上方预下载模型部分Q: No palace found解决方案# 必须先初始化mempalace initdir# 然后挖掘数据mempalace minedirQ: 如何重置/删除记忆宫殿解决方案# 删除宫殿目录rm-rf~/.mempalace/palace# 然后重新初始化mempalace initdirQ: Windows 下 Unicode 编码错误GitHub issue #47解决方案# Windows PowerShell$env:PYTHONIOENCODING utf-8mempalace initQ: ChromaDB 依赖构建失败解决方案# macOSxcode-select--install# Ubuntu/Debiansudoapt-getinstallbuild-essential python3-dev# 然后重试安装pipinstallmempalace 性能参考与基准测试操作性能指标初始化扫描 100 个文件约 10-30 秒挖掘每分钟处理 10-50 个文件取决于大小搜索 1 秒返回结果首次运行额外 2-5 分钟下载模型基准测试成绩基准测试模式成绩API 调用LongMemEval R5Raw纯本地96.6%零LongMemEval R5Hybrid Haiku 重排序100%(500/500)~500 次LoCoMo R10Raw会话级别60.3%零与竞品对比系统LongMemEval R5成本本地运行MemPalace (hybrid)100%免费是Supermemory ASMR~99%付费否MemPalace (raw)96.6%免费是Mastra94.87%API 费用否Mem0~85%$19-249/月否Zep~85%$25/月否 官方资源资源链接GitHubhttps://github.com/milla-jovovich/mempalacePyPIhttps://pypi.org/project/mempalace/Discordhttps://discord.com/invite/ycTQQCu6kn基准测试https://github.com/milla-jovovich/mempalace/blob/main/benchmarks/BENCHMARKS.md官方网站https://www.mempalace.tech⚠️ 重要说明来自官方根据 Milla Jovovich 和 Ben Sigman 在 2026 年 4 月 7 日的声明AAAK 压缩是实验性的目前 LongMemEval 成绩 96.6% 来自Raw 模式原文存储而非 AAAK 压缩模式84.2%。AAAK 在大量重复实体场景下才能体现压缩优势。30x 无损压缩表述过度AAAK 是有损缩写系统通过实体编码和句子截断实现压缩并非无损压缩。34% 宫殿提升说明该数字比较的是无过滤搜索 vs 翼楼房间元数据过滤这是 ChromaDB 的标准元数据过滤功能并非全新的检索机制。矛盾检测fact_checker.py工具存在但尚未自动集成到知识图谱操作中。总结MemPalace 是一个真实、可用的开源项目其核心优势在于本地运行、零 API 成本、原文存储、高检索准确率。96.6% 的 LongMemEval 原始成绩零 API 调用是可信的代表了当前免费本地 AI 记忆系统的最高水平。

相关文章:

【实战】MemPalace 完整安装与使用指南

未来已来,只需一句指令,养龙虾专栏导航,持续更新ing… 什么是 MemPalace? MemPalace 是由好莱坞演员 Milla Jovovich(《生化危机》《第五元素》主演)与开发者 Ben Sigman 共同开发的本地 AI 记忆管理系统…...

【分析思考】银行AI转型:从“技术替换“到“价值重构“

引言:历史的回声——电动机革命的现代启示 历史背景补充:19世纪80年代,电力开始商业化应用。但直到20世纪20年代,美国工厂电气化才基本完成,历时近40年。这段延迟不是因为电力技术不成熟,而是因为生产组织方式的变革滞后于动力技术的变革。 关键洞察:电动机(1888年实用…...

第三十四章 ESP32S3 RGB 屏幕驱动优化与性能调优实战

1. ESP32S3 RGB屏幕驱动基础回顾 在开始性能优化之前,我们先快速回顾下ESP32S3驱动RGB屏幕的基础知识。ESP32S3内置了LCD控制器,可以直接驱动RGB接口的液晶屏,这种接口相比SPI或I2C接口的屏幕,具有更高的数据传输速率和刷新率。 R…...

Vxe-Table无限滚动踩坑实录:从‘假死’到流畅,我优化了这3个关键配置

Vxe-Table无限滚动性能优化实战:从卡顿到丝滑的进阶指南 上周接手了一个后台管理系统重构项目,当用户滚动浏览包含2万数据的表格时,页面直接卡成了PPT。这让我意识到,vxe-table的无限滚动功能虽然强大,但未经优化的实现…...

编写程序实现智能户外帐篷湿检测,内部结露时,提示“通风除湿”。

智能户外帐篷湿度检测系统:从原理到实现一、实际应用场景描述在户外露营场景中,帐篷内部湿度受外界环境(如雨天、清晨露水)和人体活动(呼吸、汗液蒸发)影响显著。当帐篷内湿度超过70%时,空气中的…...

5个内容访问解决方案:突破数字阅读限制的非技术人员实践指南

5个内容访问解决方案:突破数字阅读限制的非技术人员实践指南 在信息爆炸的时代,优质内容往往被付费墙阻隔,成为知识获取的障碍。本文将系统解析内容访问限制的技术原理,对比5种主流内容访问解决方案的适用场景与实施难度&#xff…...

别再被C++指针劝退了!用‘小本本记地址’的比喻,5分钟带你搞懂和*的日常用法

从零玩转C指针:用生活化比喻彻底理解内存操作 想象一下你刚搬进一栋巨大的公寓楼,每个房间都住着不同的数据——有的房间存着数字,有的存着文字,还有的存着复杂的数据结构。指针就像你手中的万能钥匙卡,不仅能告诉你具…...

基于MATLAB的16QAM系统仿真:从误码率分析到星座图可视化

1. 16QAM调制原理与MATLAB实现 16QAM(16进制正交幅度调制)是现代通信系统中常用的高效调制技术。我第一次接触这个概念是在研究生阶段的数字通信课上,当时对着星座图琢磨了半天才理解它的精妙之处。简单来说,它就像在一个二维平面…...

FairyGUI与Unity坐标转换实战:从屏幕到世界的完整指南

1. FairyGUI与Unity坐标系统差异解析 第一次用FairyGUI做Unity项目时,我被一个诡异的bug折磨了整整两天——明明按钮显示在屏幕中央,点击却总是对不准位置。后来才发现,这全是坐标系差异惹的祸。FairyGUI和Unity虽然都在处理屏幕上的UI元素&a…...

Cogito 3B效果展示:中文技术博客自动续写+风格迁移(严谨→通俗/幽默)

Cogito 3B效果展示:中文技术博客自动续写风格迁移(严谨→通俗/幽默) 1. 开篇:当技术博客有了“灵魂” 你有没有遇到过这种情况?写技术博客时,思路卡壳,对着空白文档发呆半小时,一个…...

2026智慧农业行业趋势白皮书

白皮书立足 “十四五” 农业发展成果,前瞻 “十五五” 农业现代化方向,围绕种植业领域,系统分析我国农业现状、农业 4.0 核心内涵、关键技术、应用场景及未来趋势,明确智慧农业是农业高质量发展的核心路径。关注公众号&#xff1a…...

claw-code 源码分析:大型移植的测试哲学——如何用 unittest 门禁守住「诚实未完成」的口碑?

涉及源码:tests/test_porting_workspace.py、src/setup.py、src/parity_audit.py、src/main.py、src/hooks/__init__.py、src/execution_registry.py;对照 Rust rust/crates/compat-harness 中「无夹具则早退」的测试写法。1. 门禁长什么样:单…...

内容访问工具高效解决方案:开源Bypass Paywalls Clean实用指南

内容访问工具高效解决方案:开源Bypass Paywalls Clean实用指南 在信息获取日益受限的数字时代,专业内容常被付费墙阻隔,影响研究效率与知识获取。本文将系统介绍一款开源内容访问工具的技术原理与实践方法,帮助用户在合规前提下优…...

制造业设计团队文档管理选型实战

制造业设计团队文档管理选型实战 某中型机械制造企业,研发团队47人,日常需要管理CAD图纸、BOM表、工艺文件、技术规范等超过120万份文件。过去三年,这支团队换了两次文档管理系统,第二套系统上线8个月后被迫重建——原因是设计部门…...

万字拆解 LLM 运行机制:Token、上下文与采样参数影

springboot自动配置 自动配置了大量组件,配置信息可以在application.properties文件中修改。 当添加了特定的Starter POM后,springboot会根据类路径上的jar包来自动配置bean(比如:springboot发现类路径上的MyBatis相关类&#xff…...

ESPS USB MSC 调试全过程记录岸

背景 在软件开发的漫长旅途中,"构建"这个词往往让人又爱又恨。爱的是,一键点击,代码变成产品,那是程序员最迷人的时刻;恨的是,维护那一堆乱糟糟的构建脚本,简直是噩梦。 在很多项目中…...

FireRedASR Pro学习笔记整理实战:录音转文字,复习效率翻倍

FireRedASR Pro学习笔记整理实战:录音转文字,复习效率翻倍 1. 为什么你需要这个语音转文字工具 作为一名经常需要听课、参加会议的学习者和职场人士,我一直在寻找能够提升笔记效率的工具。直到遇到FireRedASR Pro,这个基于工业级…...

GLM-. 全面支持与 Gemini CLI 集成:HagiCode 的多模型进化之路腾

1. 流图:数据的河流 如果把传统的堆叠面积图想象成一块块整齐堆叠的积木,那么流图就像一条蜿蜒流淌的河流,河道的宽窄变化自然流畅,波峰波谷过渡平滑。 它特别适合展示多个类别数据随时间的变化趋势,尤其是当你想强调整…...

显微图像拼接的三大困境与MIST的突破性解决方案

显微图像拼接的三大困境与MIST的突破性解决方案 【免费下载链接】MIST Microscopy Image Stitching Tool 项目地址: https://gitcode.com/gh_mirrors/mist3/MIST 你是否曾经面对数百张高分辨率显微图像,却苦于找不到一个既快速又精准的拼接工具?当…...

C99新特性:变长数组(VLA)

文章目录C99新特性:变长数组(VLA) 🚀什么是变长数组? 🤔为什么需要变长数组? 💡VLA的基本语法和用法 📝在函数内部使用VLAVLA作为函数参数多维VLAVLA的工作原理和内存分配…...

linux指令的介绍(2)

此次核心介绍新的指令1.rm 删文件2.man查指令使用3.cp 拷贝文件内容4.cat 打印文件内容5.mv 剪切内容6.less 一页一页的打印文件内容7.date 查时间1.rm删文件rmdir:只能删空目录ubuntuVM-0-2-ubuntu:~/lesson3$ ll total 12 drwxrwxr-x 3 ubuntu ubuntu 4096 Mar 2…...

C++的动态内存管理(new/delete的用法,malloc和new的区别,内存的具体分布)

C的动态内存管理允许程序在运行是根据需要分配内存和释放内存,主要通过new和delete运算符来完成。与静态内存分配相比,动态内存分配更具有灵活性,但它需要手动管理来避免内存泄漏。一C/C中内存的具体分布先来了解一下内存的几个区域&#xff…...

【OpenClaw企业级智能体实战】第27篇:Skill生态运营——企业私有Skill商店的搭建与审核机制

摘要:2026年ClawHavoc供应链攻击事件曝光超1200个恶意Skill渗透公共技能市场,工信部明确要求企业审慎使用第三方技能包并严格审查代码。本文基于真实安全事件与行业实践,完整讲解企业私有Skill商店从0到1搭建方案,覆盖小团队极简GitLab私有仓库、中大型企业Nacos 3.2私有Re…...

边缘计算语音识别实战:ARM平台深度部署方案与嵌入式AI部署指南

边缘计算语音识别实战:ARM平台深度部署方案与嵌入式AI部署指南 【免费下载链接】sherpa-onnx Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet con…...

IDA Pro 9.3sp1 发布,主要针对 V850 反编译器的改进与问题修复

IDA Pro 9.3sp1 (macOS, Linux, Windows) - 强大的反汇编程序、反编译器和多功能调试器 A powerful disassembler, decompiler and a versatile debugger. In one tool. 请访问原文链接:https://sysin.org/blog/ida-pro/ 查看最新版。原创作品,转载请保…...

【42】软考软件设计师——设计模式代码实战|单例/工厂/策略/观察者 真实业务案例精讲

摘要:本文是《软件设计师50讲通关|从零基础到工程师职称》专栏第42篇,属于模块五:算法与代码实战强化第四篇,聚焦软考上午选择题与下午代码填空题四大高频设计模式:单例模式(双重检查锁)、工厂模式、策略模式、观察者模式。全文超4800字,搭配Mermaid类图/时序图清晰展…...

CLIP ViT-H-14快速部署:Docker镜像替代方案与本地Python服务对比

CLIP ViT-H-14快速部署:Docker镜像替代方案与本地Python服务对比 想快速搭建一个能看懂图片的AI服务吗?比如,你想让电脑自动给照片打标签、找相似图片,或者做个以图搜图的功能。今天要聊的CLIP ViT-H-14模型,就是干这…...

js内建对象

JavaScript 对象 在 JavaScript中,几乎所有的事物都是对象、在 JavaScript 中,对象是非常重要的,当你理解了对象,就可以了解 JavaScript 。 一维数组: 第一种:使用new关键字和Array()构造函数 a、 va…...

FastAPI子应用挂载:别再让root_path坑你一夜案

Julia(julialang.org)由Stefan Karpinski、Jeff Bezanson等在2009年创建,目标是融合Python的易用性、C的高性能、R的统计能力、Matlab的科学计算生态。 其核心设计哲学是: 高性能:编译型语言(JIT&#xff0…...

用OpenSearch实现电商语义搜索

想象一下,一位顾客搜索"适合团队通话的经济型无线耳机"。传统的关键词搜索返回零结果,因为您的商品标题中并不包含所有这些确切词汇。但借助由生成式 AI 嵌入模型驱动的语义搜索,OpenSearch 能够理解用户意图——并将您最好的带降噪…...