当前位置：首页 > article >正文

基于 FAISS 的 AI 长期记忆系统示例

article 2026/4/27 8:57:38

FAISSFacebook AI Similarity Search是 Meta 开源的高性能向量检索库专为海量高维向量数据的快速近似搜索而设计。基于 FAISS 构建的 AI 长期记忆系统本质上是为 AI 模型尤其是大语言模型提供持久化、可检索的“外部大脑”。该系统通常采用“向量索引元数据存储”的双存储架构向量化Embedding利用嵌入模型如 OpenAI text-embedding-ada-002、Sentence-BERT将文本、图像等非结构化数据转换为高维向量例如 1536 维。索引构建Indexing使用 FAISS 将向量构建成高效的索引结构如 FlatL2、IVFFlat、HNSW支持毫秒级近似最近邻ANN搜索。元数据关联为每个向量附加原始文本、时间戳、来源等元数据通常存储在 JSON 或 SQLite 中。检索增强生成RAG当用户提问时系统将查询文本向量化通过 FAISS 召回最相关的历史记忆并将其作为上下文注入 LLM 的 Prompt实现“记忆唤醒”。核心优势高性能针对 GPU 和批量查询高度优化能在百万级向量中实现亚秒级检索。可扩展性支持从本地小文件到分布式集群的平滑扩展。灵活性提供多种索引算法精确搜索 vs. 近似搜索和距离度量L2、内积、余弦相似度可根据数据规模和精度需求灵活配置。典型应用场景对话记忆持久化跨会话记住用户的偏好、习惯和重要对话历史。知识库问答KBQA将企业文档、技术手册向量化构建私有知识库。智能助理实现基于历史交互的个性化推荐和上下文感知服务。需求分析本文示例代码实现了一个AI长期记忆系统其核心需求源于当前AI应用对上下文记忆和历史交互保持能力的迫切需求。随着大型语言模型的普及人们发现单次会话的AI虽然能提供即时响应但缺乏持续的学习和记忆能力导致每次对话都像是重新开始。这个记忆系统旨在解决这一痛点为AI提供类似人类长期记忆的功能使其能够跨会话保持知识、学习用户偏好、积累经验从而提供更加个性化、连贯和智能的服务。具体需求包括向量化存储和检索技术文档、会议记录、用户交互历史等非结构化信息支持高效的相似性搜索快速找到相关历史信息提供数据持久化机制确保记忆不因系统重启而丢失具备可扩展的架构能够适应不同规模的数据集和多样的应用场景。设计架构该系统采用经典的知识库检索架构以FAISS向量数据库为核心结合元数据管理实现完整的记忆生命周期管理。系统设计分为三层存储层使用FAISS索引进行高维向量的高效相似性搜索这是系统的性能基础业务层管理记忆的增删改查操作包括向量的添加、相似性检索、元数据更新和软删除持久化层负责将内存中的索引和元数据序列化到磁盘。系统采用模块化设计索引类型可配置FlatL2用于精确搜索HNSW用于近似大规模搜索维度可调节以适配不同的嵌入模型。元数据与向量通过索引位置隐式关联的设计简化了数据一致性维护但需要注意删除操作只能软删除的局限性。系统还包含一个简单的文本向量化示例展示了如何将文本转化为向量尽管实际应用中需要替换为更专业的嵌入模型。代码实现# -*- coding: utf-8 -*- Created on Wed Jul 9 09:11:42 2025 author: liguo import faiss import numpy as np from typing import List, Dict, Any import json import os class AIMemory: def __init__(self, dim: int 1536, index_type: str FlatL2, storage_path: str ai_memory): 初始化AI长期记忆系统 Args: dim: 向量维度 index_type: 索引类型支持FlatL2、HNSW等 storage_path: 数据存储路径 self.dim dim self.index_type index_type self.storage_path storage_path self.metadata [] # 存储向量对应的元数据 # 创建存储目录 if not os.path.exists(storage_path): os.makedirs(storage_path) # 初始化索引 self._init_index() # 加载已保存的数据 self._load_memory() def _init_index(self): 根据指定类型初始化FAISS索引 if self.index_type FlatL2: self.index faiss.IndexFlatL2(self.dim) elif self.index_type HNSW: self.index faiss.IndexHNSWFlat(self.dim, 32) self.index.hnsw.efConstruction 40 else: raise ValueError(f不支持的索引类型: {self.index_type}) def _load_memory(self): 从磁盘加载已保存的记忆 index_path os.path.join(self.storage_path, index.faiss) metadata_path os.path.join(self.storage_path, metadata.json) if os.path.exists(index_path) and os.path.exists(metadata_path): try: # 加载索引 self.index faiss.read_index(index_path) # 加载元数据 with open(metadata_path, r, encodingutf-8) as f: self.metadata json.load(f) print(f已从 {self.storage_path} 加载记忆: {len(self.metadata)} 条记录) except Exception as e: print(f加载记忆失败: {e}) # 重新初始化索引 self._init_index() def save_memory(self): 保存记忆到磁盘 index_path os.path.join(self.storage_path, index.faiss) metadata_path os.path.join(self.storage_path, metadata.json) try: # 保存索引 faiss.write_index(self.index, index_path) # 保存元数据 with open(metadata_path, w, encodingutf-8) as f: json.dump(self.metadata, f, ensure_asciiFalse, indent2) print(f已保存记忆到 {self.storage_path}) except Exception as e: print(f保存记忆失败: {e}) def add_memory(self, vector: np.ndarray, data: Dict[str, Any]): 添加记忆条目 Args: vector: 特征向量numpy数组 data: 相关元数据字典格式 # 确保向量维度正确 vector vector.reshape(1, -1) if vector.shape[1] ! self.dim: raise ValueError(f向量维度不匹配期望 {self.dim}实际 {vector.shape[1]}) # 添加到索引 self.index.add(vector) # 保存元数据 self.metadata.append(data) # 自动保存可优化为定期保存 self.save_memory() return len(self.metadata) - 1 # 返回添加的记忆ID def search_memory(self, query_vector: np.ndarray, k: int 5) - List[Dict[str, Any]]: 搜索相似记忆 Args: query_vector: 查询向量 k: 返回结果数量 Returns: 包含相似度和元数据的列表 # 确保向量维度正确 query_vector query_vector.reshape(1, -1) if query_vector.shape[1] ! self.dim: raise ValueError(f向量维度不匹配期望 {self.dim}实际 {query_vector.shape[1]}) # 搜索 distances, indices self.index.search(query_vector, k) # 构建结果 results [] for i, idx in enumerate(indices[0]): if idx ! -1: # -1表示未找到 results.append({ similarity: float(distances[0][i]), metadata: self.metadata[idx], memory_id: idx }) return results def update_memory(self, memory_id: int, new_data: Dict[str, Any]): 更新记忆元数据 Args: memory_id: 记忆ID new_data: 新的元数据 if 0 memory_id len(self.metadata): self.metadata[memory_id].update(new_data) self.save_memory() return True return False def delete_memory(self, memory_id: int): 删除记忆 Args: memory_id: 记忆ID if 0 memory_id len(self.metadata): # 注意FAISS不支持直接删除索引项这里采用标记删除 self.metadata[memory_id][deleted] True self.save_memory() return True return False # 简单的文本向量化器示例实际应用中应使用更强大的模型 def simple_text_embedding(text: str) - np.ndarray: 简单的文本向量化函数实际应用中应替换为如OpenAI Embeddings等 # 这里仅作示例返回随机向量 # 实际应用中应使用如sentence-transformers等模型 return np.random.random(1536).astype(float32) # 使用示例 if __name__ __main__: # 初始化记忆系统 memory AIMemory(dim1536, index_typeFlatL2) # 添加记忆 memory.add_memory( simple_text_embedding(机器学习是人工智能的一个分支), {text: 机器学习是人工智能的一个分支, timestamp: 2023-05-15, source: 教科书} ) memory.add_memory( simple_text_embedding(深度学习是机器学习的一个子领域), {text: 深度学习是机器学习的一个子领域, timestamp: 2023-05-16, source: 网络文章} ) # 搜索记忆 query_vector simple_text_embedding(人工智能的分支有哪些) results memory.search_memory(query_vector, k2) print(\n搜索结果:) for result in results: print(f相似度: {result[similarity]:.4f}) print(f内容: {result[metadata][text]}) print(f来源: {result[metadata][source]}) print(- * 40) # 更新记忆 memory.update_memory(0, {importance: high}) # 删除记忆 # memory.delete_memory(1)代码执行结果C:\Users\xiayu\miniconda3\envs\langchain03\python.exe C:\Users\xiayu\PyCharmMiscProject\AI-Agent-Dev-Practices-Code\第3章代码\3.18-实现了一个基于 FAISS 的 AI 长期记忆系统.py已从 ai_memory 加载记忆: 12 条记录已保存记忆到 ai_memory已保存记忆到 ai_memory搜索结果:相似度: 259.3894内容: 机器学习是人工智能的一个分支来源: 教科书----------------------------------------相似度: 260.8898内容: 机器学习是人工智能的一个分支来源: 教科书----------------------------------------已保存记忆到 ai_memoryProcess finished with exit code 0代码解析代码实现展示了清晰的面向对象设计AIMemory类封装了所有记忆管理功能。构造函数初始化向量维度、索引类型和存储路径并调用_init_index()根据配置创建FAISS索引。add_memory()方法首先验证输入向量维度然后将其添加到索引并关联元数据。search_memory()方法接收查询向量通过FAISS的search方法找到最相似的k个记忆返回包含相似度分数、元数据和内存ID的结果列表。持久化通过save_memory()和_load_memory()方法实现分别将FAISS索引和元数据JSON文件保存到磁盘。示例中使用的simple_text_embedding()函数只是随机向量生成器实际部署时需要替换为真正的嵌入模型如Sentence-BERT或OpenAI Embeddings。主程序示例演示了完整的工作流程初始化系统、添加记忆条目、执行搜索、更新和删除记忆展示了系统的基本使用模式。

基于 FAISS 的 AI 长期记忆系统示例

相关文章：

基于 FAISS 的 AI 长期记忆系统示例

面阵相机 vs 线阵相机：堡盟与海康相机选型差异全解析附Python实战演示

5个机器学习可视化黑马工具：从EDA到模型解释

边走边聊 Python 3.8：pandas 内存优化技巧（深度版）

Qwen3-32B镜像配置优化：提升响应速度与使用体验

PCA降维技术：原理、实现与优化实战

贝叶斯最优分类器：理论与应用解析

终极指南：UABEAvalonia - 跨平台Unity资源编辑器完全解析

PHP进程管理利器：轻量级工具pao的原理、配置与实战

RePKG终极指南：如何轻松搞定Wallpaper Engine资源提取与转换

视频字幕提取终极指南：用Video-subtitle-extractor本地提取87种语言字幕

高效QMC音频解密实战指南：qmc-decoder深度解析与跨平台部署

MongoDB Agent Skills：基于MCP协议构建AI与数据库的安全交互桥梁

掌握CefFlashBrowser：构建完整的Flash内容解决方案

Asian Beauty Z-Image Turbo 5分钟快速部署：本地东方美学AI绘画工具一键启动

丹青幻境部署教程：Z-Image Atelier与Gradio双前端部署及性能对比

3分钟快速上手：Iwara视频下载工具终极指南

Fashion-MNIST图像分类实战：CNN实现93%+准确率

如何快速解决chromatic开发中的5个常见问题？终极调试指南

如何在Windows上轻松运行Flash游戏：CefFlashBrowser完整解决方案指南

为什么92%的MCP项目卡在模态同步阶段？资深专家用3个数学模型讲透时序一致性本质

多智能体强化学习实战：基于PyMARL与SMAC环境的算法解析与代码实现

5步掌握猫抓资源嗅探：网页媒体下载终极指南

Python的getattribute性能分析

AI入门—— 一文读懂什么是RAG

基于大模型的AI外呼系统：语音与对话能力拆解（二）

单链表的多项式创建和相加

Android高级开发工程师技术深度解析与面试指南

GHelper终极指南：如何用轻量级工具全面掌控华硕笔记本性能

AIGC算法岗面试指南：从Transformer到AI Agent的求职秘籍