当前位置: 首页 > article >正文

SpringAI实战:5分钟搞定聊天记录查询API,基于ChatMemory的RESTful接口开发

SpringAI实战5分钟构建高性能聊天记录查询API最近在开发一个智能客服系统时我发现聊天记录的快速检索功能对用户体验至关重要。SpringAI的ChatMemory组件恰好提供了简洁高效的存储方案但如何将其封装成易用的RESTful接口却鲜有完整案例。本文将分享一个经过生产验证的解决方案从零开始构建一个支持高并发的聊天记录查询服务。1. 环境准备与基础配置在开始编码前确保你的Spring Boot项目已集成SpringAI核心依赖。推荐使用Gradle构建工具在build.gradle中添加以下配置dependencies { implementation org.springframework.ai:spring-ai-core:1.0.0 implementation org.springframework.boot:spring-boot-starter-web compileOnly org.projectlombok:lombok annotationProcessor org.projectlombok:lombok }对于Maven项目对应的pom.xml配置如下dependency groupIdorg.springframework.ai/groupId artifactIdspring-ai-core/artifactId version1.0.0/version /dependency关键点说明确保Spring Boot版本≥3.0.0Lombok用于简化代码非必须但推荐生产环境建议添加spring-boot-starter-actuator用于健康检查2. 核心控制器实现基于RESTful设计原则我们创建HistoryController处理聊天记录请求。以下是经过优化的完整实现Slf4j RestController RequestMapping(/api/v1/chat) RequiredArgsConstructor public class HistoryController { private final ChatMemory chatMemory; GetMapping(/{chatId}/messages) public ResponseEntityListMessageDTO getChatHistory( PathVariable String chatId, RequestParam(required false) Integer limit) { ListMessage rawMessages chatMemory.get(chatId); ListMessageDTO result processMessages(rawMessages, limit); return ResponseEntity.ok() .cacheControl(CacheControl.maxAge(1, TimeUnit.HOURS)) .body(result); } private ListMessageDTO processMessages(ListMessage messages, Integer limit) { StreamMessage stream messages.stream(); if (limit ! null limit 0) { stream stream.limit(limit); } return stream.map(this::convertToDTO) .sorted(Comparator.comparing(MessageDTO::getTimestamp)) .collect(Collectors.toList()); } private MessageDTO convertToDTO(Message message) { return new MessageDTO( message.getMessageType().name(), message.getContent(), message.getMetadata().get(timestamp), message.getMetadata() ); } }关键改进点添加了分页参数(limit)支持实现了Message到DTO的转换层内置了HTTP缓存控制增加了时间戳排序逻辑对应的MessageDTO定义public record MessageDTO( String type, String content, String timestamp, MapString, Object metadata ) {}3. 高级功能扩展基础功能实现后可以考虑以下增强特性3.1 性能优化方案对于高频访问的聊天记录建议添加Redis缓存层Configuration EnableCaching public class CacheConfig { Bean public CacheManager cacheManager() { return new ConcurrentMapCacheManager(chatHistory); } } // 在Controller方法添加缓存注解 Cacheable(value chatHistory, key #chatId) GetMapping(/{chatId}/messages) public ListMessageDTO getChatHistory(...) { ... }3.2 安全控制添加基础的JWT认证GetMapping(/{chatId}/messages) PreAuthorize(#chatId.startsWith(authentication.name)) public ListMessageDTO getChatHistory(...) { ... }3.3 实时推送支持结合WebSocket实现消息实时更新通知Autowired private SimpMessagingTemplate messagingTemplate; PostMapping(/{chatId}/messages) public MessageDTO addMessage(...) { // 保存消息逻辑 messagingTemplate.convertAndSend(/topic/chatId, newMessage); return newMessage; }4. 生产环境最佳实践在实际部署时需要注意以下关键点性能调优参数配置项推荐值说明spring.ai.chat.memory.size1000单个会话最大消息数server.tomcat.max-threads200高并发场景适当增加线程数spring.cache.redis.timeout30m缓存过期时间异常处理建议对不存在的chatId返回404状态码添加速率限制防止接口滥用记录详细的访问日志用于审计ExceptionHandler(EmptyResultDataAccessException.class) public ResponseEntityErrorResponse handleNotFound() { return ResponseEntity.notFound().build(); }在微服务架构中建议通过FeignClient暴露接口FeignClient(name chat-service, path /api/v1/chat) public interface ChatHistoryClient { GetMapping(/{chatId}/messages) ListMessageDTO getHistory(PathVariable String chatId); }5. 前端集成示例现代前端框架如React可以这样调用我们的APIasync function fetchChatHistory(chatId) { const response await fetch(/api/v1/chat/${chatId}/messages); const data await response.json(); return data.map(msg ({ id: msg.metadata.messageId, text: msg.content, sender: msg.type USER ? me : bot, time: formatTimestamp(msg.timestamp) })); }对于Vue项目推荐使用axios库import axios from axios; export default { methods: { async loadHistory(chatId) { try { const { data } await axios.get(/api/v1/chat/${chatId}/messages, { params: { limit: 50 } }); this.messages data; } catch (error) { console.error(加载历史记录失败:, error); } } } }6. 监控与运维在生产环境部署后需要建立完善的监控体系关键监控指标接口响应时间P99每秒请求量(QPS)缓存命中率错误率Prometheus配置示例- name: chat_history_metrics metrics_path: /actuator/prometheus static_configs: - targets: [localhost:8080]Grafana监控面板建议包含请求延迟热力图流量变化趋势图错误类型分布饼图JVM内存使用曲线对于大规模部署可以考虑以下优化策略按用户ID分片存储聊天记录实现冷热数据分离存储添加消息内容敏感词过滤支持消息的全文检索功能

相关文章:

SpringAI实战:5分钟搞定聊天记录查询API,基于ChatMemory的RESTful接口开发

SpringAI实战:5分钟构建高性能聊天记录查询API 最近在开发一个智能客服系统时,我发现聊天记录的快速检索功能对用户体验至关重要。SpringAI的ChatMemory组件恰好提供了简洁高效的存储方案,但如何将其封装成易用的RESTful接口却鲜有完整案例。…...

高性能开源PLC编程平台:OpenPLC Editor工业自动化开发完整解决方案

高性能开源PLC编程平台:OpenPLC Editor工业自动化开发完整解决方案 【免费下载链接】OpenPLC_Editor 项目地址: https://gitcode.com/gh_mirrors/ope/OpenPLC_Editor OpenPLC Editor作为一款基于PLCopen国际标准的开源工业自动化编程平台,为工业…...

别让Claude Skill变‘话痨’:从官方最佳实践看如何写出‘省token’的高效技能

从Claude Skill设计哲学看高效AI交互的成本控制艺术 在AI技术快速迭代的今天,大型语言模型(LLM)的应用已经从简单的对话扩展到复杂的任务自动化。作为这一领域的先驱之一,Claude Skill系统为开发者提供了构建专业化AI能力的平台。然而,随着应…...

别再傻傻分不清:5分钟搞懂通信里的误比特率、误码率、误帧率和误块率(BLER)

通信系统中的错误率指标全解析:从比特到数据块的精准诊断 想象一下你正在网购一件心仪已久的商品,快递过程中可能会发生各种意外:包裹里的某个小零件损坏(比特错误)、整个配件盒丢失(数据块错误&#xff09…...

ITK-SNAP医学图像分割:3步掌握专业级医学影像分析

ITK-SNAP医学图像分割:3步掌握专业级医学影像分析 【免费下载链接】itksnap ITK-SNAP medical image segmentation tool 项目地址: https://gitcode.com/gh_mirrors/it/itksnap 想要在医学影像分析中实现精准分割却无从下手?ITK-SNAP这款开源工具…...

3 shell脚本编程

Shell脚本简介shell脚本是什么?shell脚本是由 shell命令组成 的文本文件。利用shell命令加shell语法,配合正则表达式、管道命令、数据流从定向等写成的纯文本脚本文件。以.sh为后缀为什么要写它?1、自动话重复任务:可以将重复性或…...

MSYS2安装GCC后,你的PATH环境变量可能踩了这些坑(附正确配置方法)

MSYS2安装GCC后PATH环境变量的深度避坑指南 当你在Windows上通过MSYS2安装GCC工具链时,PATH环境变量的配置可能是最容易被忽视却又最关键的一步。许多开发者按照教程安装完成后,在命令行或IDE中调用gcc时仍然会遇到各种问题——命令未找到、版本冲突、工…...

5分钟快速上手:Windows平台APK安装器完整指南

5分钟快速上手:Windows平台APK安装器完整指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否想在Windows电脑上直接运行安卓应用,却不想…...

告别永恒之蓝阴影:安全迁移Samba服务到非标端口的实战记录

企业级Samba服务安全迁移指南:从445端口到高位端口的完整实践 当企业IT管理员在云服务器上部署Samba服务时,往往会遇到一个令人头疼的问题——445端口被运营商封锁。这背后其实源于几年前席卷全球的"永恒之蓝"漏洞事件,该漏洞利用S…...

Lenovo Legion Toolkit:拯救者笔记本的终极性能控制中心

Lenovo Legion Toolkit:拯救者笔记本的终极性能控制中心 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit 想要完全…...

题解:AcWing 1192 奖金

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来,并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构,旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。 欢迎大家订阅我的专栏:算法…...

Unity 引擎中的 RuntimeInitializeOnLoadMethod 属性解析

在 Unity 游戏开发中,有许多细微但非常重要的特性,其中之一就是 RuntimeInitializeOnLoadMethod 属性。这篇博文将详细探讨这个属性的工作原理,并结合实例解释其在实际开发中的应用。 背景介绍 Unity 引擎虽然主要使用 C# 进行开发,但其核心是基于 C 和 C++ 构建的。这意…...

直播卡顿、首开慢、延时高?别慌!一份超全的排查手册(附FFmpeg/WebRTC实战参数)

直播质量优化全链路实战:从现象定位到参数调优 直播过程中突然出现的卡顿、首开延迟或音画不同步,往往让技术团队如临大敌。不同于点播的事后处理,直播问题的排查需要工程师在分钟级内完成根因定位与修复。本文将构建一套从现象分析到参数调优…...

awesome-engineering-team-management薪酬与股权谈判:如何获得公平的补偿方案

awesome-engineering-team-management薪酬与股权谈判:如何获得公平的补偿方案 【免费下载链接】awesome-engineering-team-management 👔 How to transition from software development to engineering management 项目地址: https://gitcode.com/gh_m…...

DeepSeek-OCR效果对比展示:传统OCR vs 多模态大模型在复杂版式上的差异

DeepSeek-OCR效果对比展示:传统OCR vs 多模态大模型在复杂版式上的差异 1. 引言:从文字识别到文档理解的跨越 在日常工作中,我们经常需要处理各种文档:扫描的合同、复杂的报表、手写的笔记,甚至是古籍文献。传统的OC…...

题解:洛谷 AT_abc399_e [ABC399E] Replace

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来,并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构,旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。 欢迎大家订阅我的专栏:算法…...

用旧手机和ESP8266-01做个智能开关:手把手教你用Arduino和巴法云实现远程控制

旧手机改造智能家居中枢:零成本玩转ESP8266与Arduino联动 家里抽屉角落那台积灰的旧安卓手机,除了换脸盆还能做什么?去年搬家时,我偶然发现五年前的小米6居然还能开机,充电器插上半小时后——电量从3%顽强爬升到78%。这…...

抖音评论采集完整指南:三步轻松获取完整评论数据

抖音评论采集完整指南:三步轻松获取完整评论数据 【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper 还在为无法批量获取抖音评论而烦恼吗?想要分析热门视频的用户反馈却无从下手&#x…...

超实用的移动端设计语言系统:VUX视觉设计指南

超实用的移动端设计语言系统:VUX视觉设计指南 【免费下载链接】vux Mobile UI Components based on Vue & WeUI 项目地址: https://gitcode.com/gh_mirrors/vu/vux VUX是一套基于Vue和WeUI的移动端UI组件库,为开发者提供了丰富的移动端界面设…...

告别单片机!纯硬件方案驱动RDA5807FP收音机模块,两个机械按键实现搜台与音量调节

纯硬件驱动RDA5807FP收音机模块:用两个机械按键实现全功能控制 在电子设计领域,追求极简主义往往能带来意想不到的突破。当大多数工程师习惯性地为每个项目配备单片机时,我们是否思考过:某些简单功能是否真的需要软件参与&#x…...

终极虚拟手柄驱动:ViGEmBus如何彻底改变Windows游戏控制器兼容性

终极虚拟手柄驱动:ViGEmBus如何彻底改变Windows游戏控制器兼容性 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus ViGEmBus是一款革命性的Windows…...

终极PrivateGPT批量部署指南:多实例管理与资源分配的完整方案

终极PrivateGPT批量部署指南:多实例管理与资源分配的完整方案 【免费下载链接】privateGPT Interact with your documents using the power of GPT, 100% privately, no data leaks 项目地址: https://gitcode.com/GitHub_Trending/pr/privateGPT PrivateGPT…...

如何彻底告别城通网盘下载限速:3种创新方案对比分析

如何彻底告别城通网盘下载限速:3种创新方案对比分析 【免费下载链接】ctfileGet 获取城通网盘一次性直连地址 项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 还在为城通网盘那令人抓狂的下载速度而烦恼吗?ctfileGet 是一个开源工具&…...

低代码≠低质量,R 4.5分析工具开发避坑手册,从原型到生产环境部署全流程拆解

第一章:低代码≠低质量:R 4.5分析工具开发的认知重构长久以来,“低代码”常被误读为“简化版编程”或“牺牲可维护性的快捷方式”,尤其在统计分析领域,开发者习惯性将 R 视为必须手写完整函数、手动管理依赖与环境的“…...

从VBA到Python:一个老工程师的HFSS脚本自动化升级之路(踩坑与收获)

从VBA到Python:一位资深工程师的HFSS自动化改造实战 十年前,当我第一次在HFSS中录制VBA脚本时,那种解放双手的兴奋感至今记忆犹新。但随着项目复杂度呈指数级增长——从简单的参数扫描到需要集成机器学习优化算法,从单一模型处理到…...

用HLS在Zynq上实现图像缩放IP:从720P到1080P,一个工程搞定OV5640摄像头适配

Zynq平台HLS图像缩放实战:从OV5640采集到HDMI输出的全链路解析 在嵌入式视觉系统中,实时图像缩放是一个常见但极具挑战性的需求。当使用Xilinx Zynq SoC搭配OV5640摄像头时,开发者往往需要处理不同分辨率间的转换——比如将摄像头采集的720P图…...

s2-pro语音合成多语言支持:中英日韩混合文本语音生成实测教程

s2-pro语音合成多语言支持:中英日韩混合文本语音生成实测教程 1. 前言:为什么选择s2-pro 如果你正在寻找一款专业级的语音合成工具,s2-pro绝对值得你关注。作为Fish Audio开源的专业级语音合成模型镜像,它不仅支持常规的文本转语…...

从北邮网安复试笔记看考研面试:如何用一个月时间系统梳理计算机核心八股文?

计算机考研复试30天冲刺指南:从知识框架构建到面试话术设计 复试准备的核心逻辑与认知重构 考研复试本质上是一场多维能力评估,尤其在计算机/网络安全领域,考官关注的不仅是知识储备量,更是知识结构化能力与工程思维。传统"八…...

别再死记硬背了!用生活中的例子彻底搞懂C#类型转换(int/double/string实战)

用生活化场景拆解C#类型转换:从菜市场到成绩单的编程思维 每次走进菜市场,摊主们熟练地将整鸡切块、把活鱼去鳞的过程,像极了编程中的类型转换——我们需要根据不同的烹饪需求(业务逻辑),将原材料&#xff…...

第一篇博客,自己大学后的目标

a.我是涛同学,来自重庆,学校是岭南师范大学,是一所普通本科,但我的目标却不普通。b.学习编程的目标是为了掌握编程技能,是为了以后更好的生活,是为了拿到大厂offerc.我打算先学好python和cd.我打算每周花5个…...