当前位置: 首页 > article >正文

Spring AI Alibaba零基础速成(5) ---- Memory(记忆)

大模型默认只能单轮对话每次对话完成后就会丢失当前对话记忆我们之前了解过可以通过AssistantMessage把大模型回复结果存储起来下次提问时在发送给大模型不过使用过于麻烦和受限Spring AI 和Spring AI Alibaba都实现了更好实现记忆化的方式1. 内存存储Configuration public class SaaLLMConfig { private final String QWEN_MODEL qwen-plus; Bean public DashScopeApi dashScopeApi() { return DashScopeApi.builder().apiKey(System.getenv(AliQWenAPIKey)).build(); } Bean public ChatModel qwenChatModel(DashScopeApi dashScopeApi) { return DashScopeChatModel .builder() .dashScopeApi(dashScopeApi) .defaultOptions(DashScopeChatOptions.builder().model(QWEN_MODEL).build()) .build(); } Bean public ChatClient qwenChatClient(Qualifier(qwenChatModel) ChatModel qwenChatModel) { MessageWindowChatMemory windowChatMemory MessageWindowChatMemory.builder() .maxMessages(10) .chatMemoryRepository(new InMemoryChatMemoryRepository()) .build(); return ChatClient .builder(qwenChatModel) .defaultAdvisors(MessageChatMemoryAdvisor.builder(windowChatMemory).build()) .build(); } }MessageWindowChatMemory维护固定容量的消息窗口默认 20 条。当消息超限时自动移除较早的对话消息始终保留系统消息。InMemoryChatMemoryRepository 基于 ConcurrentHashMap 实现内存存储。默认情况下若未配置其他 RepositorySpring AI 将自动配置 InMemoryChatMemoryRepository 类型的 ChatMemoryRepository Bean供直接使用。2. 源码解析关键在于MessageChatMemoryAdvisor这个类可以看到我们在配置ChatClient时配置了一个该对象这个就是生效的关键虽然名字叫Advisor但它和 Spring AOP 一点关系都没有。它是Spring AI 自己实现的一套独立拦截器机制。Override public ChatClientRequest before(ChatClientRequest chatClientRequest, AdvisorChain advisorChain) { String conversationId getConversationId(chatClientRequest.context(), this.defaultConversationId); // 1. Retrieve the chat memory for the current conversation. ListMessage memoryMessages this.chatMemory.get(conversationId); // 2. Advise the request messages list. ListMessage processedMessages new ArrayList(memoryMessages); processedMessages.addAll(chatClientRequest.prompt().getInstructions()); // 3. Create a new request with the advised messages. ChatClientRequest processedChatClientRequest chatClientRequest.mutate() .prompt(chatClientRequest.prompt().mutate().messages(processedMessages).build()) .build(); // 4. Add the new user message to the conversation memory. UserMessage userMessage processedChatClientRequest.prompt().getUserMessage(); this.chatMemory.add(conversationId, userMessage); return processedChatClientRequest; } Override public ChatClientResponse after(ChatClientResponse chatClientResponse, AdvisorChain advisorChain) { ListMessage assistantMessages new ArrayList(); if (chatClientResponse.chatResponse() ! null) { assistantMessages chatClientResponse.chatResponse() .getResults() .stream() .map(g - (Message) g.getOutput()) .toList(); } this.chatMemory.add(this.getConversationId(chatClientResponse.context(), this.defaultConversationId), assistantMessages); return chatClientResponse; }在该类源码中我们可以看到关键的两个方法before和afterbefore在发送请求前执行先从memoryMessages中获取历史对话再把本次对话的用户问题也存入chatMemory中。after在大模型返回后执行把大模型返回内容存储到chatMemory中3. Redis存储配置redis:spring: data: redis: host: localhost port: 6379 database: 0要使用Redis需要引入依赖!--redis-- dependency groupIdorg.springframework.boot/groupId artifactIdspring-boot-starter-data-redis/artifactId /dependency !-- Alibaba Spring AI Redis 记忆模块 -- dependency groupIdcom.alibaba.cloud.ai/groupId artifactIdspring-ai-alibaba-starter-memory-redis/artifactId /dependency可以看到这个依赖适配了Jedis和RedissonRedis以及springBoot的LettuceConfiguration public class SaaLLMConfig { private final String DEEPSEEK_MODEL deepseek-v3.2; Bean public ChatModel deepseekChatModel() { return DashScopeChatModel .builder() .dashScopeApi(DashScopeApi.builder().apiKey(System.getenv(AliQWenAPIKey)).build()) .defaultOptions(DashScopeChatOptions.builder().model(DEEPSEEK_MODEL).build()) .build(); } Bean public ChatClient deepseekChatClient(Qualifier(deepseekChatModel) ChatModel deepseekChatModel) { LettuceRedisChatMemoryRepository redisCMR LettuceRedisChatMemoryRepository.builder().build(); MessageWindowChatMemory chatMemory MessageWindowChatMemory.builder() .maxMessages(10) .chatMemoryRepository(redisCMR) .build(); return ChatClient .builder(deepseekChatModel) .defaultAdvisors(MessageChatMemoryAdvisor.builder(chatMemory).build()) .build(); } }同时一个大模型通常会服务多个用户对于不同用户的对话应该分开存储我们可以通过设置CONVERSATION_ID来实现RestController public class ChatMemoryController { Resource(name deepseekChatClient) ChatClient deepseekChatClient; GetMapping(/chatmemory/chat2) public FluxString chat2(String userId, String question) { return deepseekChatClient .prompt() .user(question) .advisors( advisorSpec - advisorSpec.param(CONVERSATION_ID, userId) ) .stream() .content(); } }通过.advisors方法设置如果不设置会使用默认的这样所有用户的对话是共享的可以看到是按id分别存储的4. 关系型数据库存储导入依赖!-- MySQL 驱动 -- dependency groupIdcom.mysql/groupId artifactIdmysql-connector-j/artifactId scoperuntime/scope /dependency !-- Spring JDBC -- dependency groupIdorg.springframework.boot/groupId artifactIdspring-boot-starter-jdbc/artifactId /dependency !--Spring AI JDBC 聊天记忆启动器-- dependency groupIdorg.springframework.ai/groupId artifactIdspring-ai-starter-model-chat-memory-repository-jdbc/artifactId /dependency增加配置spring: ai: chat: #开启Schema初始化,会自动创建表用 memory: repository: jdbc: initialize-schema: always # 数据库连接 datasource: url: jdbc:mysql://localhost:3306/ai_chat?useSSLfalseallowPublicKeyRetrievaltrueserverTimezoneAsia/Shanghai username: root password: 123456 driver-class-name: com.mysql.cj.jdbc.Driver # JDBC 自动建表 sql: init: mode: always配置ChatClient:Configuration public class SaaLLMConfig { private final String DEEPSEEK_MODEL deepseek-v3.2; private final String QWEN_MODEL qwen-plus; private final String GLM5 glm-5; Bean public DashScopeApi dashScopeApi() { return DashScopeApi.builder().apiKey(System.getenv(AliQWenAPIKey)).build(); } Bean public ChatModel glmChatModel() { return DashScopeChatModel .builder() .dashScopeApi(DashScopeApi.builder().apiKey(System.getenv(AliQWenAPIKey)).build()) .defaultOptions(DashScopeChatOptions.builder().model(GLM5).build()) .build(); } Bean public ChatClient glmChatClient(Qualifier(glmChatModel) ChatModel glmChatModel, JdbcChatMemoryRepository jdbcChatMemoryRepository) { MessageWindowChatMemory chatMemory MessageWindowChatMemory.builder() .maxMessages(10) .chatMemoryRepository(jdbcChatMemoryRepository) .build(); return ChatClient .builder(glmChatModel) .defaultAdvisors(MessageChatMemoryAdvisor.builder(chatMemory).build()) .build(); }Spring AI 为 JdbcChatMemoryRepository 提供自动配置可直接注入。RestController public class ChatMemoryController { Resource(name glmChatClient) ChatClient glmChatClient; GetMapping(/chatmemory/chat3) public FluxString chat3(String userId, String question) { return glmChatClient .prompt() .user(question) .advisors( advisorSpec - advisorSpec.param(CONVERSATION_ID, userId) ) .stream() .content(); } }

相关文章:

Spring AI Alibaba零基础速成(5) ---- Memory(记忆)

大模型默认只能单轮对话,每次对话完成后就会丢失当前对话记忆,我们之前了解过可以通过AssistantMessage把大模型回复结果存储起来下次提问时在发送给大模型,不过使用过于麻烦和受限,Spring AI 和Spring AI Alibaba都实现了更好实现…...

Modbus三种类型详解:RTU、ASCII、TCP

Modbus协议主要分为三种类型:Modbus RTU、Modbus ASCII和Modbus TCP。这三种类型基于不同的物理层和编码方式,以适应不同的通信环境和需求。 下表清晰地对比了这三种主要类型的核心差异: 特性维度Modbus RTU (Remote Terminal Unit)Modbus …...

为内部ai工具平台集成taotoken实现多模型灵活切换的方案

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为内部AI工具平台集成Taotoken实现多模型灵活切换的方案 在企业内部开发AI工具平台时,一个常见的挑战是如何为不同的业…...

Android 相机有线连接开发复盘:PTP/MTP 协议适配与稳定性实践

一、项目背景在做一个相机互联类 App 的过程中,我们需要在 Android 设备上通过 USB 有线方式​ 连接相机,实现:遥控拍摄实时获取照片稳定地进行文件同步最初评估时以为只要调用系统 API 就能跑起来,但实际开发中发现,标…...

CANN-MoE模型推理加速实战

MoE 模型推理加速实战:从入门到生产 MoE(Mixture of Experts)模型是当前大模型的主流架构,但它有个问题:8 个专家只激活 2 个,怎么让昇腾跑得更快?本文手把手教你。 一、前情提要:1 …...

3分钟免费汉化Android Studio:社区中文语言包完整安装教程

3分钟免费汉化Android Studio:社区中文语言包完整安装教程 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack 还在为Andr…...

Spring循环依赖与三级缓存:从原理到实战,彻底搞懂不踩坑

“Bean正在创建中,存在无法解决的循环引用”——这就是Spring循环依赖的典型表现。很多人只知道“用Lazy注解能解决”“改Set注入就行”,但背后的三级缓存机制却一知半解。一、什么是Spring循环依赖? 循环依赖,本质就是两个或多个…...

Langchain自定义LLM实战:我把一个简单的Python函数变成了AI模型接口

LangChain自定义LLM实战:从Python函数到智能接口的魔法变形记 在AI应用开发的世界里,大型语言模型(LLM)正以前所未有的速度改变着技术格局。但你是否想过,那些看似神秘的AI接口背后,其实隐藏着一个惊人的简单本质?今天…...

告别丢帧!用CANoe 12+和VN5610A搞定CSM ECAT模块高速采集(附100kHz采样率避坑要点)

突破100kHz采样率瓶颈:CANoe 12与VN5610A高速数据采集全攻略 在汽车电子测试领域,高速数据采集一直是工程师面临的重大挑战。当采样率超过100kHz时,传统配置方式往往会出现数据丢帧、时间戳错乱等问题。本文将深入解析CANoe 12与VN5610A硬件组…...

别让中文路径坑了你!FaceFusion在Windows和Mac上的完整环境配置与文件规范指南

别让中文路径坑了你!FaceFusion在Windows和Mac上的完整环境配置与文件规范指南 在数字创意领域,FaceFusion作为一款强大的AI换脸工具,正受到越来越多内容创作者的青睐。然而,许多用户在初次接触时往往会被一系列看似莫名其妙的错误…...

NY378固态MT29F32T08GSLBHL8-24QA:B

NY378固态MT29F32T08GSLBHL8-24QA:B你是否曾好奇,那些默默支撑着工业设备稳定运行、保障数据高速流转的存储核心,究竟蕴藏着怎样的技术密码?今天,我们将聚焦一颗在特定领域中扮演关键角色的芯片——来自美光(Micron&am…...

告别龟速下载!保姆级教程:用百度网盘离线下载搞定Android 1.6到16全版本AOSP源码

突破AOSP源码下载瓶颈:高效获取Android全版本开发资源的实战指南 每次打开终端准备下载AOSP源码时,看着缓慢增长的进度条和频繁中断的连接,你是否感到无比沮丧?作为Android开发者,获取完整源码是深入理解系统架构的第一…...

NY352固态MT29F32T08GWLBHD6-24QJ:B

NY352固态MT29F32T08GWLBHD6-24QJ:B从你的笔记本到高性能服务器,从智能仪表到工业机器人,一块灵魂级的存储芯片往往决定了系统的稳定与寿命。在众多闪存颗粒中,MT29F32T08GWLBHD6-24QJ:B 无疑是最具代表性的存在之一。它看似不起眼&#xff0…...

CAD专业看图师手机版安装使用教程

CAD专业看图师是一款专注于DWG/DXF图纸快速查看、精准测量、现场标注的手机端工具,适配建筑、机械、工程等场景,支持天正图纸、图层管理、PDF导出,适合工地/外勤快速核对图纸。以下是完整安装与使用指南。 一、安装前准备 1. 系统与格式要求…...

自驱动关节臂坐标测量机精度提升理论与技术【附程序】

✨ 长期致力于自驱动关节臂坐标测量机、关节模组、结构参数误差、动态综合误差、最佳测量区研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)关节模组转…...

AI Agent 艺术创作能力探索

AI Agent 艺术创作能力探索:从生成式工具到自主创作主体的范式跃迁 关键词 AI Agent、生成式艺术、多模态创作、自主创作系统、计算美学、大模型推理、人机协同创作 摘要 本文从第一性原理出发,系统拆解AI Agent艺术创作的底层逻辑、技术架构、实现机制与产业价值。我们将…...

硬核实战:调用Gemini多模态管道,直击办公中的图表解析、发票识别与自动化脚本生成(国内镜像免费方案)

办公室里的信息并不全以纯文本存在——扫描版合同、财报截图、会议白板照片、纸质发票,这些“非结构化视觉数据”才是拖慢效率的元凶。Gemini 的多模态能力可以同时理解图片和文字,直接从中提取数据、输出分析或生成脚本。目前国内用户可通过聚合镜像站 …...

快速傅里叶变换(FFT)原理与工程实践:从分治算法到信号处理应用

1. 从时域到频域:为什么我们需要FFT?如果你曾经处理过音频信号、图像数据,或者调试过通信系统,那你一定对“频谱”这个概念不陌生。我们生活的世界是时间的函数,声音随着时间起伏,图像像素在空间上排列&…...

Linux内核同步机制:从原子操作到RCU的实战指南

1. 项目概述:为什么我们需要同步机制?想象一下,你正在一个繁忙的十字路口指挥交通。如果没有红绿灯和交通规则,车辆和行人随意穿行,结果必然是混乱、拥堵,甚至发生事故。在操作系统的核心——Linux内核中&a…...

工业级AI计算机如何支撑机场eGate系统:BOXER-6646-ADP硬件与部署解析

1. 项目概述:当“刷脸通关”成为现实,背后是谁在支撑?每次在机场国际出发或到达大厅,看到那些排着长队等待人工查验护照、盖章的队伍,你是不是也幻想过能像科幻电影里那样,走到一个闸机前,刷一下…...

写给前端的 CANN-ops-transformer:昇腾Transformer进阶算子库到底是啥?

写给前端的 CANN-ops-transformer:昇腾Transformer进阶算子库到底是啥? 之前有兄弟跑大模型,问我:“哥,我想 用 FlashAttention,但 ATB 太重了,有没有轻量点的库?” 好问题。今天来说…...

数据挖掘与多层神经网络:极简学习路径,神经网络核心机制精要

核心理念:神经网络 可学习的多层次特征提取器 模式匹配器。它通过数据自动学习从输入到输出的复杂映射规则。一、 基础奠基(必须知道的概念)数学基础:线性代数(计算骨架):数据是向量/矩阵&…...

全志T113-i嵌入式Linux系统一键升级方案设计与实现

1. 项目概述:为什么我们需要“一键升级”?拿到一块全志T113-i的开发板,或者用它做产品的朋友,肯定都经历过手动更新固件的“痛苦”。传统的升级方式,比如用PhoenixSuit、LiveSuit这类PC端工具,需要连接USB线…...

如何彻底禁用iOS过热降频:thermalmonitordDisabler终极指南

如何彻底禁用iOS过热降频:thermalmonitordDisabler终极指南 【免费下载链接】thermalmonitordDisabler A tool used to disable iOS daemons. 项目地址: https://gitcode.com/gh_mirrors/th/thermalmonitordDisabler 你是否曾在游戏激战时遭遇iPhone突然卡顿…...

FanControl终极指南:5分钟让你的Windows风扇控制既智能又安静

FanControl终极指南:5分钟让你的Windows风扇控制既智能又安静 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tren…...

3个核心功能让Notepad++成为你的Markdown高效编辑器

3个核心功能让Notepad成为你的Markdown高效编辑器 【免费下载链接】MarkdownViewerPlusPlus A Notepad Plugin to view a Markdown file rendered on-the-fly 项目地址: https://gitcode.com/gh_mirrors/ma/MarkdownViewerPlusPlus 你是否曾经在Notepad中编写Markdown文…...

Inter字体终极指南:从零开始掌握现代界面设计的免费开源字体方案

Inter字体终极指南:从零开始掌握现代界面设计的免费开源字体方案 【免费下载链接】inter The Inter font family 项目地址: https://gitcode.com/gh_mirrors/in/inter Inter字体是一款专为计算机屏幕精心设计的开源无衬线字体系统,凭借其卓越的可…...

抖音内容采集系统架构设计与工程实践

抖音内容采集系统架构设计与工程实践 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音批量下载工具&#x…...

【Perplexity文学研究黄金配置】:1个提示词模板+2个权威元数据过滤器+4类文学体裁专属指令集

更多请点击: https://codechina.net 第一章:Perplexity文学作品查询 Perplexity 是一款以实时网络检索与引用溯源为特色的 AI 助手,其在人文领域尤其适用于文学研究场景。不同于传统大模型的静态知识库,Perplexity 在响应用户查询…...

Perplexity翻译查询功能进阶指南(企业级多语种实时校验工作流揭秘)

更多请点击: https://kaifayun.com 第一章:Perplexity翻译查询功能的核心定位与企业价值 Perplexity的翻译查询功能并非传统意义上的词句级机器翻译工具,而是深度集成于其AI推理引擎中的语义理解增强模块。它以“上下文感知翻译”为核心范式…...