当前位置: 首页 > article >正文

别再纠结MySQL了!用MongoDB存储AI聊天记录,Spring Boot实战代码全解析

别再纠结MySQL了用MongoDB存储AI聊天记录Spring Boot实战代码全解析在构建AI对话系统时数据存储方案的选择往往成为技术决策的痛点。传统关系型数据库如MySQL虽然成熟稳定但在处理半结构化、快速迭代的聊天数据时文档型数据库MongoDB展现出独特的优势。本文将深入探讨如何利用Spring Boot MongoDB构建高性能的AI聊天存储系统从架构设计到代码实现提供一套完整的解决方案。1. 为什么MongoDB更适合AI聊天场景AI对话系统产生的数据具有几个典型特征消息格式多变文本、图片、语音混合、会话关系复杂、读写频率极高。MongoDB的文档模型与这些需求天然契合灵活的模式设计每条聊天消息可以包含动态字段无需预先定义严格表结构嵌套文档支持将会话和消息的关联关系内嵌存储减少联表查询水平扩展能力通过分片机制轻松应对海量聊天数据存储高性能读写BSON二进制格式和内存映射机制优化IO效率对比测试显示在10万条聊天记录的场景下指标MongoDBMySQL写入吞吐量12k/s3.5k/s查询延迟(avg)8ms23ms存储空间1.2GB2.7GB2. 核心数据模型设计2.1 会话与消息的文档结构采用两个集合Collection分别存储会话元数据和详细消息记录// 会话集合模型 Document(chat_sessions) public class ChatSession { Id private String sessionId; private String userId; private String aiAgentId; private String title; // 自动生成的会话标题 private LocalDateTime createTime; private LocalDateTime lastActiveTime; private MapString, Object metadata; // 扩展属性 }// 消息集合模型 Document(chat_messages) public class ChatMessage { Id private String messageId; private String sessionId; private String role; // user or assistant private String content; private String contentType; // text/image/voice private LocalDateTime sendTime; private Integer tokenCount; private MessageStatus status; }2.2 关键设计决策反范式化存储将会话最新状态冗余存储在会话文档中避免频繁join动态schema使用MapString, Object保留未来扩展字段时间序列优化对sendTime字段建立降序索引加速最近会话查询分片策略按sessionId哈希分片保证同一会话的消息物理相邻3. Spring Boot整合MongoTemplate实战3.1 基础CRUD操作Repository public class ChatRepository { private final MongoTemplate mongoTemplate; // 保存单条消息 public ChatMessage saveMessage(ChatMessage message) { return mongoTemplate.insert(message); } // 批量插入消息 public CollectionChatMessage saveMessages(ListChatMessage messages) { return mongoTemplate.insertAll(messages); } // 获取会话最新N条消息 public ListChatMessage getRecentMessages(String sessionId, int limit) { Query query new Query(Criteria.where(sessionId).is(sessionId)) .with(Sort.by(Sort.Direction.DESC, sendTime)) .limit(limit); return mongoTemplate.find(query, ChatMessage.class); } }3.2 高级查询示例分页查询带模糊搜索public PageChatMessage searchMessages(String sessionId, String keyword, Pageable pageable) { Criteria criteria Criteria.where(sessionId).is(sessionId); if (StringUtils.hasText(keyword)) { criteria.and(content).regex(Pattern.quote(keyword), i); } Query query new Query(criteria) .with(pageable) .with(Sort.by(sendTime).descending()); long total mongoTemplate.count(query, ChatMessage.class); ListChatMessage content mongoTemplate.find(query, ChatMessage.class); return new PageImpl(content, pageable, total); }聚合查询统计会话活跃度public ListSessionActivity getSessionActivities(LocalDate from, LocalDate to) { Aggregation aggregation Aggregation.newAggregation( Aggregation.match(Criteria.where(sendTime).gte(from).lte(to)), Aggregation.group(sessionId) .count().as(messageCount) .first(sendTime).as(firstMessageTime) .last(sendTime).as(lastMessageTime), Aggregation.project() .and(_id).as(sessionId) .and(messageCount).as(messageCount) .and(firstMessageTime).as(startTime) .and(lastMessageTime).as(endTime) .andExpression(dateDiff(lastMessageTime, firstMessageTime)).as(durationDays) ); return mongoTemplate.aggregate(aggregation, chat_messages, SessionActivity.class) .getMappedResults(); }4. 生产环境优化策略4.1 性能调优配置# application.yml spring: data: mongodb: auto-index-creation: true write-concern: ACKNOWLEDGED read-preference: PRIMARY_PREFERRED management: health: mongodb: enabled: true关键索引配置Configuration public class MongoIndexConfig { Bean public IndexOperations chatMessageIndexOps(MongoTemplate mongoTemplate) { IndexOperations ops mongoTemplate.indexOps(ChatMessage.class); ops.ensureIndex(new Index().on(sessionId, Sort.Direction.ASC) .on(sendTime, Sort.Direction.DESC) .named(idx_session_time)); return ops; } }4.2 安全与可靠性消息加密存储public class MessageEncryptor { private static final String ENCRYPTION_KEY System.getenv(CHAT_ENCRYPTION_KEY); public String encrypt(String content) { // 使用AES-GCM模式加密 // 实现细节省略... } public String decrypt(String encrypted) { // 解密实现 } }变更流监听实现审计EventListener(ApplicationReadyEvent.class) public void setupChangeStream() { ChangeStreamOptions options ChangeStreamOptions.builder() .returnFullDocumentOnUpdate() .filter(Aggregation.match( OperationType.in(insert, update, replace))) .build(); mongoTemplate.changeStream(chat_messages, options, ChatMessage.class) .forEach(event - { auditService.logChange( event.getOperationType(), event.getDocumentKey(), event.getFullDocument()); }); }5. 典型问题解决方案5.1 消息时序一致性使用MongoDB的乐观锁控制并发修改Document public class ChatMessage { Version private Long version; // 其他字段... } public void updateMessageStatus(String messageId, MessageStatus newStatus) { Query query new Query(Criteria.where(id).is(messageId)); Update update new Update().set(status, newStatus); // 返回修改后的文档 ChatMessage updated mongoTemplate.findAndModify( query, update, FindAndModifyOptions.options().returnNew(true), ChatMessage.class); if (updated null) { throw new ConcurrentModificationException(消息已被其他操作修改); } }5.2 历史数据归档TTL索引自动清理旧数据Configuration public class DataArchiveConfig { Bean public IndexOperations archiveIndex(MongoTemplate mongoTemplate) { IndexOperations ops mongoTemplate.indexOps(ChatMessage.class); ops.ensureIndex(new Index().on(sendTime, Sort.Direction.ASC) .expire(365, TimeUnit.DAYS) .named(idx_ttl)); return ops; } }对于需要长期保留的数据实现冷热分离public void archiveOldSessions(LocalDateTime cutoffDate) { Aggregation aggregation Aggregation.newAggregation( Aggregation.match(Criteria.where(lastActiveTime).lt(cutoffDate)), Aggregation.out(archived_sessions) ); mongoTemplate.aggregate(aggregation, chat_sessions, ChatSession.class); // 归档后删除原数据 mongoTemplate.remove( Query.query(Criteria.where(lastActiveTime).lt(cutoffDate)), ChatSession.class); }

相关文章:

别再纠结MySQL了!用MongoDB存储AI聊天记录,Spring Boot实战代码全解析

别再纠结MySQL了!用MongoDB存储AI聊天记录,Spring Boot实战代码全解析 在构建AI对话系统时,数据存储方案的选择往往成为技术决策的痛点。传统关系型数据库如MySQL虽然成熟稳定,但在处理半结构化、快速迭代的聊天数据时&#xff0c…...

Goland实战:除了Hello World,你的第一个Go项目还能这样玩(附赠实用工具类代码)

Goland实战:除了Hello World,你的第一个Go项目还能这样玩(附赠实用工具类代码) 刚学完Go语言的Hello World,是不是觉得少了点什么?那种在终端打印一行文字的成就感,很快就会被"接下来该做什…...

SignatureTools技术深度解析:安卓APK签名与渠道管理的3大核心机制

SignatureTools技术深度解析:安卓APK签名与渠道管理的3大核心机制 【免费下载链接】SignatureTools 🎡使用JavaFx编写的安卓Apk签名&渠道写入工具,方便快速进行v1&v2签名。 项目地址: https://gitcode.com/gh_mirrors/si/Signature…...

量子误差缓解与张量网络在NISQ时代的应用

1. 量子误差缓解:NISQ时代的噪声对抗策略量子计算正经历从理论走向实践的关键转型期,但噪声问题始终是横亘在实用化道路上的主要障碍。在无法实现完全容错的现阶段,量子误差缓解(Quantum Error Mitigation, QEM)技术成…...

PWM技术与函数发生器应用详解

1. PWM技术基础与函数发生器应用概述 脉冲宽度调制(PWM)作为数字控制领域的核心技术,其本质是通过调节数字脉冲的占空比(Duty Cycle)来实现模拟信号的等效控制。我在工业自动化项目中首次接触PWM技术是在2012年设计一个伺服电机控制系统时,当时使用普通信…...

CoolProp热力学计算引擎:开源实现与工程实践深度解析

CoolProp热力学计算引擎:开源实现与工程实践深度解析 【免费下载链接】CoolProp Thermophysical properties for the masses 项目地址: https://gitcode.com/gh_mirrors/co/CoolProp 引言:热力学计算的工程挑战 在能源系统设计、制冷工程、化工过…...

构建系统提示词探索器:工程化优化大语言模型应用性能

1. 项目概述:一个系统提示词探索器的诞生最近在折腾大语言模型应用开发的朋友,估计都绕不开一个核心问题:如何设计一个真正好用、能稳定发挥模型潜能的系统提示词(System Prompt)?这玩意儿就像是给AI大脑安…...

告别print!在Flutter中优雅替换调试输出:Logger插件配置、自定义输出与性能对比

Flutter日志革命:从print到Logger的全链路升级指南 如果你还在Flutter项目中使用print来调试代码,那么你可能正在错过一个更高效、更专业的开发体验。想象一下这样的场景:当应用在生产环境崩溃时,你只能看到一堆杂乱无章的打印信息…...

机器人记忆能力评估与优化实践指南

1. 项目背景与核心价值去年在开发服务机器人项目时,我们团队遇到了一个棘手问题:不同型号的机器人在执行相同任务时,表现差异巨大。有的机器人能准确记住三个月前的用户偏好,有的却连昨天设定的工作流程都会混淆。这促使我们开始系…...

CocosCreator 3.x ScrollView性能优化实战:告别卡顿,实现类TableView的流畅列表

CocosCreator 3.x ScrollView性能优化实战:告别卡顿,实现类TableView的流畅列表 在游戏开发中,滚动列表是极其常见的UI组件,无论是排行榜、背包系统还是聊天界面,都离不开它的身影。然而,当列表项数量激增时…...

UI粒子特效穿帮了?用这个Camera技巧让特效完美贴合你的Unity界面

UI粒子特效穿帮?三招Camera技巧让特效完美贴合Unity界面 刚完成一套华丽的粒子特效,兴奋地拖到UI界面上——结果要么被UI元素完全遮挡,要么在半空中诡异漂浮。这种"穿帮现场"几乎每个Unity开发者都遇到过。上周团队新来的特效师就…...

别再乱调了!Arcgis出图打印前,这3个页面和打印设置项必须检查(附A3/A4尺寸实战)

ArcGIS出图避坑指南:打印前必查的3个关键设置与实战参数 刚完成一张精美的地图设计,却在打印时发现要素错位、边距异常或比例失调?这不是技术问题,而是90%的ArcGIS初学者都会踩的"最后一公里"陷阱。本文将直击A3/A4纸张…...

告别第三方工具:手把手教你用vlmcsd在Windows Server上搭建私有KMS服务器,激活Office 2010 VOL版

企业级KMS私有化部署指南:安全激活Office 2010全流程解析 当企业IT管理员面对批量软件授权管理时,公共KMS服务器的安全性和稳定性往往成为痛点。我曾为某金融机构部署内部KMS系统时发现,使用第三方激活服务会导致安全审计无法通过&#xff0c…...

用AG10KSDE176国产FPGA点亮LED灯屏:从Altera迁移到AGM的实战避坑指南

从Altera到AGM:国产FPGA AG10KSDE176在LED灯屏控制中的迁移实战 LED显示屏作为信息展示的重要载体,其核心控制逻辑往往依赖于高性能的FPGA芯片。长期以来,Altera(现Intel PSG)的Cyclone系列FPGA凭借稳定的性能和成熟的…...

从Grafana到KubePi:手把手教你排查并加固那些容易被忽略的开源工具默认密码

云原生时代的安全必修课:深度解析开源工具默认密码风险与自动化加固方案 在DevOps和云原生技术快速普及的今天,开源工具已成为技术栈中不可或缺的部分。从监控告警的Grafana到Kubernetes管理面板KubePi,从SQL审核平台Yearning到配置中心Apoll…...

【人生底稿 18】风城再赴张家口:元旦战略签约盛会,孤身三日驻场需求攻坚成长记

一、元旦再赴风城,高铁辗转赶路时序跨入 2024 年元旦,我再度踏上奔赴张家口的旅途。这是我第二次来到这座风城,和第一次单纯的三日实地调研截然不同,此行身负战略合作签约的重要使命,规格、重视程度都远超上一回。原本…...

从特斯拉线圈到手机充电:用生活中的例子彻底搞懂交变电流

从特斯拉线圈到手机充电:用生活中的例子彻底搞懂交变电流 你是否曾好奇过,为什么手机放在无线充电板上就能自动补充电量?为什么特斯拉线圈能产生炫目的电弧?这些看似神奇的科技现象,背后都藏着一个共同的物理原理——交…...

Spartan-II FPGA在FIR滤波器设计中的架构优势与实现

1. Spartan-II FPGA在FIR滤波器设计中的架构优势Xilinx Spartan-II系列FPGA采用SRAM架构,其核心由可配置逻辑块(CLB)构成,每个CLB包含两个Slice,每个Slice配备两个4输入查找表(LUT)和两个寄存器。这种结构特别适合实现FIR滤波器所需的乘累加(…...

UML建模在系统工程中的核心价值与实践技巧

1. UML在系统工程中的核心价值UML(统一建模语言)作为面向对象系统设计的标准化建模工具,其核心价值在于为复杂系统提供了一套完整的可视化表达体系。想象一下建筑师在设计摩天大楼时使用的蓝图——UML就是软件工程师的"蓝图语言"。…...

Kettle 8.3服务器部署后,这3个性能调优和安全加固设置你做了吗?

Kettle 8.3生产环境部署后的关键调优与安全实践 当你完成Kettle服务器的初步部署时,真正的挑战才刚刚开始。生产环境中的ETL工具不仅需要稳定运行,更要兼顾性能与安全。本文将带你深入三个核心环节:JVM参数调优、访问控制强化和网络层防护&am…...

2026届学术党必备的AI论文方案实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 针对于维普系统越发精准的AI检测功能而言,要去降低文本里的人工智能生成痕迹&am…...

移动端多模态AI评测与优化实战

1. 项目背景与核心价值移动端多模态AI正在经历一场静默革命。过去一年,我们看到超过60%的新上市智能手机开始预装多模态AI功能,从相册场景识别到语音图文交互,但各家的技术方案和性能表现却存在巨大差异。Mobile-O评测体系的出现,…...

Kapitan:云原生配置管理的声明式编译引擎与实战指南

1. 项目概述:为什么我们需要一个“配置管理”的瑞士军刀? 如果你和我一样,在云原生和基础设施即代码(IaC)的世界里摸爬滚打过几年,大概率会对“配置管理”这四个字又爱又恨。爱的是,它让我们能…...

数据序列化协议设计:从原理到实践,构建高效跨语言数据交换方案

1. 项目概述与核心价值最近在整理一些分布式系统的数据同步方案时,我重新审视了“数据”在不同组件间流动的协议设计。这让我想起了几年前在GitHub上偶然发现的一个名为data-structure-protocol的项目,作者是k-kolomeitsev。这个项目名字听起来很学术&am…...

Python 3.15 WASM轻量化部署避坑清单(含12个致命陷阱):从__pycache__残留导致WASM崩溃,到async/await跨线程阻塞的底层修复方案

更多请点击: https://intelliparadigm.com 第一章:Python 3.15 WASM轻量化部署全景概览 Python 3.15 正式引入实验性 WASM(WebAssembly)目标后端,标志着 CPython 首次原生支持将标准 Python 字节码编译为可嵌入浏览器…...

OpenClaw工作空间管理工具:自动化扫描、修复与优化指南

1. 项目概述:OpenClaw工作空间管理工具如果你和我一样,日常工作中深度依赖OpenClaw来构建和管理AI智能体(Agent),那你一定对那几个核心的Markdown文件又爱又恨。AGENTS.md、SOUL.md、TOOLS.md、MEMORY.md,再…...

Get cookies.txt LOCALLY:三步搞定浏览器Cookie安全导出,彻底告别隐私泄露风险

Get cookies.txt LOCALLY:三步搞定浏览器Cookie安全导出,彻底告别隐私泄露风险 【免费下载链接】Get-cookies.txt-LOCALLY Get cookies.txt, NEVER send information outside. 项目地址: https://gitcode.com/gh_mirrors/ge/Get-cookies.txt-LOCALLY …...

Git实战进阶:从基础操作到团队协作与历史优化的完整指南

1. 项目概述:一个面向开发者的Git学习与实践仓库如果你是一名开发者,无论你是刚接触版本控制的新手,还是已经能熟练使用git add、git commit、git push的熟手,我敢打赌,你一定在某个时刻对Git感到过困惑或沮丧。可能是…...

AI-Browser:基于Electron的多模型AI对话桌面工作台设计与实战

1. 项目概述:一个为多模型AI对话而生的桌面工作台 如果你和我一样,每天需要在ChatGPT、Claude、Gemini、Kimi等多个AI模型之间来回切换,比较它们的回答,或者针对不同任务选择最合适的“专家”,那么你肯定也受够了在十…...

云原生可观测性新范式:基于MCP协议构建AI运维数据中台

1. 项目概述:一个为云原生观测而生的MCP服务器最近在折腾云原生环境下的可观测性,发现了一个挺有意思的项目:alexpota/cloudscope-mcp。简单来说,这是一个实现了MCP(Model Context Protocol)协议的服务器&a…...