当前位置: 首页 > article >正文

一次会员积分系统改造复盘:从同步阻塞到异步解耦的演进与多级缓存一致性保障

2026年4月我们的会员积分系统在经历一次大促后频繁告警。起初只是零星的用户投诉积分未到账但随着流量攀升积分服务响应时间从平均 80ms 飙升至 1.2s数据库连接池被打满甚至触发了熔断机制。我们意识到这套运行了三年的同步积分发放架构已经无法支撑当前的业务增长。这次改造的核心目标很明确在保证积分一致性的前提下将积分发放从同步阻塞模式升级为异步解耦架构。但真正落地时我们踩了不少坑也重新审视了缓存、消息队列、事务边界等多个技术点的适用边界。常见误区以为加个 MQ 就能解决问题在初期讨论中团队很快达成“引入消息队列解耦”的共识。但很快暴露出几个典型误区误区一MQ 能自动保证数据一致性。我们最初设计是“先写积分表再发消息”认为只要消息发出去了消费端总能处理成功。但忽略了网络抖动、消费者重启、死信堆积等场景下消息可能丢失或重复导致积分与订单状态不一致。误区二缓存只是为了加速读取。我们早期在积分查询层加了 Redis 缓存但写入时仍走数据库缓存更新依赖定时任务或延迟双删。结果在高并发下出现“用户刚消费完查询积分却未更新”的投诉。误区三异步化等于性能无上限。我们天真地认为只要把积分发放扔进消息队列系统就能扛住任意流量。但实际压测发现消费者处理能力受限于数据库写入速度且缺乏背压机制最终消息积压超过百万条反而拖垮了整个系统。这些误区让我们意识到异步解耦不是银弹必须结合业务语义、一致性要求和系统容量综合设计。正确理解一致性、性能与可观测性的三角平衡经过几轮评审我们重新梳理了积分系统的核心诉求最终一致性优先积分发放允许短暂延迟秒级但不能丢、不能重。高可用与弹性伸缩大促期间可快速扩容消费者平时资源可缩容。可观测与可回滚任何异常都能快速定位必要时可人工干预补偿。基于此我们确定了以下设计原则消息可靠性第一采用“本地事务 消息表”模式确保消息必达。缓存一致性保障引入多级缓存策略结合主动失效与版本号控制。消费幂等与去重每条消息携带唯一业务 ID消费端做幂等校验。监控覆盖全链路从消息生产、堆积、消费延迟到数据库写入全链路埋点。实战案例从同步阻塞到异步解耦的落地路径第一步改造消息生产端我们放弃了“先写 DB 再发 MQ”的方案改用Transactional Outbox 模式在订单服务中用户完成支付后开启本地事务。在事务内同时写入order表和outbox_message表消息表消息体包含订单 ID、用户 ID、积分值等。事务提交后由独立的Message Relay服务轮询outbox_message表将消息投递到 Kafka。投递成功后标记消息为“已发送”失败则重试最多 3 次。这种方式确保只要积分写入数据库成功消息就一定不会丢失。即使 Kafka 临时不可用消息也会在数据库中暂存待恢复后补发。 关键细节outbox_message表按用户 ID 分片避免单表过大Message Relay使用多实例部署通过分布式锁避免重复投递。第二步构建异步消费服务积分消费服务采用 Spring Boot Kafka 实现核心逻辑如下消费者订阅积分发放主题批量拉取消息每批 50 条。对每条消息先查询 Redis 中的dedup:{bizId}键若存在则跳过幂等。若不存在则执行业务校验如订单是否已取消然后写入积分明细表并更新用户总积分。写入成功后设置 Redis 去重键TTL 7 天并提交 offset。为了应对大促流量我们做了以下优化动态线程池使用ThreadPoolTaskExecutor配合Resilience4j实现弹性线程池根据 Kafka lag 自动扩缩容。批量写入积分明细表采用INSERT ... ON DUPLICATE KEY UPDATE实现批量 upsert减少数据库压力。热点用户隔离对高频积分用户如 VIP单独分配消费线程避免阻塞普通用户。第三步多级缓存一致性保障积分查询是高频操作我们设计了三级缓存架构本地缓存Caffeine缓存用户最近一次积分值TTL 10 秒用于快速响应。Redis 缓存存储用户积分快照TTL 60 秒写入时主动失效。数据库兜底最终一致性保障支持手动刷新缓存。关键难点在于缓存失效时机。我们采用“写后主动失效 版本号兜底”策略每次积分变更后调用cache.invalidate(userId)清除 Redis 缓存。同时在 Redis 中维护user:version:{userId}每次变更递增版本号。查询时先比较本地缓存版本号与 Redis 版本号若不一致则强制回源。这样既避免了缓存击穿又保证了最终一致性。第四步监控与补偿机制我们搭建了完整的可观测体系Kafka 监控通过 Prometheus Grafana 监控消息堆积、消费延迟、错误率。数据库监控慢 SQL 告警、连接池使用率、锁等待。业务监控积分发放成功率、延迟分布、补偿任务执行状态。同时开发了补偿任务系统定时扫描outbox_message表中超过 5 分钟未发送的消息重新投递。对消费失败的消息进入死信队列由运维手动处理或自动重试。提供后台界面支持按用户 ID 手动触发积分重算。延伸建议系统改造的通用思考框架这次改造让我们总结出系统演进的四步法识别瓶颈通过监控和压测定位性能拐点不要盲目优化。定义边界明确一致性、延迟、可用性等 SLA避免过度设计。渐进式改造先灰度验证再全量切换保留回滚能力。建设可观测性没有监控的异步系统等于黑盒必须提前规划。此外对于类似积分、优惠券、活动权益等低频写入、高频读取、允许短暂不一致的业务异步解耦 多级缓存是成熟范式但必须配套完善的幂等、去重、补偿机制。技术补丁包Transactional Outbox 模式原理利用数据库事务原子性将消息写入与业务数据写入放在同一事务中确保消息不丢失。 设计动机解决“先写 DB 再发 MQ”可能因网络问题导致消息丢失的问题。 边界条件需额外维护消息表增加数据库写入压力消息投递需独立服务保障。 落地建议消息表建议分库分表投递服务需支持幂等和重试可结合 CDC 工具如 Debezium替代轮询。多级缓存一致性策略原理结合本地缓存、分布式缓存和数据库通过主动失效与版本号机制保障数据一致性。 设计动机减少数据库读压力同时避免缓存脏读。 边界条件版本号需全局唯一且递增缓存失效可能因网络延迟导致短暂不一致。 落地建议本地缓存 TTL 不宜过长Redis 缓存建议设置合理 TTL版本号可存储在 Redis 或数据库。Kafka 消费者幂等设计原理通过唯一业务 ID 实现消息去重避免重复处理。 设计动机防止因消息重试、消费者重启等导致业务重复执行。 边界条件去重键需设置合理 TTL避免内存无限增长需考虑分布式环境下键的唯一性。 落地建议去重键建议使用 RedisTTL 设为业务最大容忍延迟的 2-3 倍可结合布隆过滤器优化内存。异步系统监控体系原理通过埋点采集消息生产、传输、消费各阶段指标实现全链路可观测。 设计动机快速定位异步链路中的瓶颈和异常。 边界条件监控数据量可能较大需考虑存储成本告警需避免误报。 落地建议使用 Prometheus Grafana 监控 Kafka lag 和消费延迟业务指标建议自定义埋点告警需分级处理。补偿任务设计原则原理针对异步系统中可能出现的异常设计自动化或半自动化的修复机制。 设计动机提升系统自愈能力减少人工干预。 边界条件补偿任务本身需幂等需防止补偿风暴。 落地建议补偿任务建议定时执行频率根据业务容忍度设定提供人工干预接口记录补偿日志用于审计。

相关文章:

一次会员积分系统改造复盘:从同步阻塞到异步解耦的演进与多级缓存一致性保障

2026年4月,我们的会员积分系统在经历一次大促后频繁告警。起初只是零星的用户投诉积分未到账,但随着流量攀升,积分服务响应时间从平均 80ms 飙升至 1.2s,数据库连接池被打满,甚至触发了熔断机制。我们意识到&#xff0…...

django基于Spark的南昌房价数据分析系统的设计与实现_45i0b357_c018

前言   系统旨在通过采集和分析南昌地区的房价数据,包括二手房信息、房价走势、区域均价等,为房地产开发商、投资者、购房者以及政府相关部门提供全面、准确、实时的房价信息,辅助其制定更精准的营销策略、投资决策和政策制定。 一、项目介…...

【书生·浦语】internlm2-chat-1.8b部署教程:支持WASI兼容沙箱安全运行

【书生浦语】internlm2-chat-1.8b部署教程:支持WASI兼容沙箱安全运行 想快速体验一个轻量级但能力不俗的中文对话模型吗?今天给大家介绍一个好消息:InternLM2-Chat-1.8B模型现在可以通过Ollama一键部署了,而且运行在WASI兼容的沙箱…...

大模型基础无非就这些!(附学习资料)

今年春招,算法岗位中,薪资开的最高的无疑是大模型相关的岗位,大模型相关应用正在逐步落地,往后3-5年,大模型仍是热门方向 大家常听到的AI算法工程师,基座大模型,大模型应用工程师等都属于大模型…...

紧急!GraalVM上线后OOM频发?立即执行这5个内存安全检查项——覆盖Quarkus/Spring Native主流框架

第一章:GraalVM静态镜像内存异常的典型表征与根因定位全景图GraalVM 静态镜像(Native Image)在启动性能与资源占用方面具备显著优势,但其编译期内存模型与运行时行为存在根本性差异,导致内存异常表现隐晦且难以复现。典…...

chrony命令实验

理论基础授时服务器(NTP服务器)定义:是一种专门提供高精度时间服务的设备或服务,用于告诉设备目前的时间作用:提供标准时间换句话说统一时间、持续校准时间误差在此命令的配置文件/etc/chrony.conf中的 pool ... iburst 这就是授时服务器的地…...

Pebblebee Halo:追踪标签与个人安全的创新融合

兼具追踪与安全的多功能神器Pebblebee Halo 作为 Safe Haven 系列的首款产品,将追踪与个人安全功能完美融合。它不仅是一个传统的追踪标签,兼容 Apple 的 Find My 和 Google 的 Find Hub,能在地图上显示位置,蓝牙追踪范围在理想条…...

Raspberry Pi Imager 终极指南:如何轻松创建树莓派启动盘

Raspberry Pi Imager 终极指南:如何轻松创建树莓派启动盘 【免费下载链接】rpi-imager The home of Raspberry Pi Imager, a user-friendly tool for creating bootable media for Raspberry Pi devices. 项目地址: https://gitcode.com/gh_mirrors/rp/rpi-imager…...

2025最权威的六大AI论文网站推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当下的学术研究环境里头,若是合理地运用AI写作工具,那么能够有效地…...

10分钟搞懂大模型Agent记忆系统四层架构,附Python实现

花 10 分钟,搞清楚 Agent 记忆系统的四层架构。 目录什么是 Agentic Memory?四种记忆类型 2.1 上下文记忆(In-context Memory)2.2 外部记忆(External Memory)2.3 情景记忆(Episodic Memory&…...

小白程序员必看:收藏这份大模型学习指南(Agent/MCP全解析)

引言 – 随着生成式人工智能的兴起,“智能体(Intelligent Agent)”、“Agent”以及“Model Context Protocol (MCP)”这些名词频频出现。但它们之间的边界往往模糊:有人把 Agent 当作“智能体”,有人又提到 MCP 协议&a…...

AI Agent Harness Engineering 未来技术突破点:自主进化与跨域协作的研究方向

AI Agent Harness Engineering的未来:自主进化与跨域协作如何重塑智能世界 关键词:AI Agent、Harness Engineering、自主进化、跨域协作、多智能体系统、自适应学习、通用人工智能 摘要:随着大语言模型(LLM)和强化学习(RL)的快速发展,AI Agent已从早期的“规则驱动工具…...

推荐一家专业做标签打印软件

1. 上海敖维科技(本地自研代理双强) • 定位:中大型企业/工厂级标签管理,上海本土17年行业经验 • 核心产品: ◦ 自研:码尚智汇链/云标签平台(B/S架构,模板云端下发、打印监控、追溯…...

25大数据 6-1 for循环

嵌套if if 判断条件1:if 判断条件2:执行语句1else:执行语句2 else:if 判断条件3:执行语句3else:执行语句4驾照资格审核 1.检查年龄是否达标 >18岁 a.如果年龄达标&#xff0c;检查视力是否合格 >0.8 合格返回 可以参加考试 b.否则 不能参加考试 2.如果年龄不达标 <18 …...

短剧小程序系统选型指南:为什么1%加密+99%开源是最优解?

最近半年&#xff0c;短剧赛道持续火爆&#xff0c;不少开发者和创业者找我咨询短剧小程序的源码选型问题。我自己带团队从零到一搭建了一套日活过万的短剧平台&#xff0c;期间踩过SaaS的坑、全加密的坑、所谓“全开源”的坑&#xff0c;最终落地了一套1%核心加密99%全开源的方…...

Pretext:值得关注的文本排版引擎睦

一、语言特性&#xff1a;Java 26 与模式匹配进化 1.1 Java 26 语言级别支持 IDEA 2026.1 EAP 最引人注目的变化之一&#xff0c;就是新增 Java 26 语言级别支持。这意味着开发者可以提前体验和测试即将在 JDK 26 中正式发布的语言特性。 其中最重要的变化是对 JEP 530 的全面支…...

PHP支付配置安全加固指南:从SSL证书到PCI DSS合规,7步实现生产环境零漏洞上线

第一章&#xff1a;PHP支付配置安全加固的核心原则与风险全景在现代Web应用中&#xff0c;PHP支付模块常因配置疏忽成为攻击者突破口。密钥硬编码、环境变量泄露、未校验回调签名、调试模式残留等隐患&#xff0c;极易导致资金盗刷、订单篡改或敏感信息外泄。安全加固并非仅依赖…...

M24C32-RMN6TP如何用两根线搞定4KB非易失存储

做嵌入式设计的人都知道一个道理&#xff1a;MCU可以复位、电源可以波动、通信可以重试&#xff0c;但配置数据和校准参数一旦丢了&#xff0c;设备就“不认识自己”了。在工业现场、汽车电子、医疗设备这些场景里&#xff0c;“掉电不丢数据”不是锦上添花&#xff0c;而是底线…...

AI Coding越来越强,我们还有必要学Processing吗? · 创意编程挚

故障表现 发现请求集群 demo 入口时卡住&#xff0c;并且对应 Pod 没有新的日志输出 rootce-demo-1:~# kubectl get pods -n deepflow-otel-spring-demo -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NO…...

向上生长,智赢未来 | 优美优品2026经销商大会圆满

引言2026年3月18日&#xff0c;一个看似平常的日子。但对优美优品而言&#xff0c;这是值得被标记的一天。全国各地的经销商伙伴跨越山海&#xff0c;奔赴而来。他们不是来参加一场普通的年度会议&#xff0c;而是来寻找一个答案。当房地产下行、消费信心不足、行业加速洗牌&am…...

GitHub Copilot - 尝试使用一下GitHub Copilot SDK

1. 简单介绍 AI的浪潮奔涌向前&#xff0c;微软在2021年就推出了GitHub Copilot&#xff0c;当前AI Coding在项目开发中使用比重越来越大。在年初参加的微软会议中&#xff0c;有参会者的观点认为有了AI coding之后&#xff0c;开发者对于算法&#xff0c;设计模式&#xff0c…...

AI终于学会“动手”了:让ToClaw在高铁上帮我干活

在高铁上&#xff0c;我让 AI 帮我把电脑上的活干完了 上周出差&#xff0c;高铁上突然收到老板消息&#xff1a;「那份数据表记得今天下班前发我。」 我人在车上&#xff0c;电脑却留在公司。按以前&#xff0c;这事基本没戏——要么改签提前回去&#xff0c;要么硬着头皮说「…...

大数据专业如何补齐实战型数据分析能力?从工具、项目到求职一文讲清

大数据专业如何补齐实战型数据分析能力大数据专业学生在理论学习之外&#xff0c;需通过工具熟练度提升、实战项目积累和求职策略优化三方面构建核心竞争力。以下为具体实施路径&#xff1a;工具技能矩阵大数据分析需掌握的工具可分为数据处理、可视化、编程语言三类&#xff0…...

Agent Client Protocol 全景解析涛

1. 核心概念 在 Antigravity 中&#xff0c;技能系统分为两层&#xff1a; Skills (全局库)&#xff1a;实际的代码、脚本和指南&#xff0c;存储在系统级目录&#xff08;如 ~/.gemini/antigravity/skills&#xff09;。它们是“能力”的本体。 Workflows (项目级)&#xff1a…...

如何永久保存微信聊天记录并生成个人数据报告?WeChatMsg让数据掌握在自己手中

如何永久保存微信聊天记录并生成个人数据报告&#xff1f;WeChatMsg让数据掌握在自己手中 【免费下载链接】WeChatMsg 提取微信聊天记录&#xff0c;将其导出成HTML、Word、CSV文档永久保存&#xff0c;对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/Gi…...

阿里架构师手码的Java工程师面试知识解析笔记 pdf

最近我整理了一份复习用的面试题及面试高频的考点题及技术点梳理成一份“Java 程序员高频面试解析及知识点体系笔记.pdf&#xff08;实际上比预期多花了不少精力&#xff09;&#xff0c;包含集合&#xff0c;JVM&#xff0c;并发编程、Spring&#xff0c;MyBatis&#xff0c;微…...

终极指南:3分钟掌握TegraRcmGUI,让Switch破解像玩游戏一样简单

终极指南&#xff1a;3分钟掌握TegraRcmGUI&#xff0c;让Switch破解像玩游戏一样简单 【免费下载链接】TegraRcmGUI C GUI for TegraRcmSmash (Fuse Gele exploit for Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/te/TegraRcmGUI 还在为复杂的Switch破…...

初始Flask框架

摘要Flask 作为 Python 生态中最受欢迎的轻量级 Web 框架&#xff0c;以其 “微内核、易扩展” 的设计理念&#xff0c;成为 Web 开发初学者的首选工具。本文基于 Flask 核心基础&#xff0c;从框架概述、环境搭建、路由视图、模板渲染、表单处理、项目结构到生产部署&#xff…...

政务帮办新范式:基于检索增强与多智能体协同的智能系统实践

一、引言:政务帮办的挑战与智能化需求 在数字化转型浪潮中,政务服务正从传统的人工办理向智能化帮办演进。然而,当前政务帮办系统普遍存在三类典型问题: 1.1 现有三类系统的局限性 基于预定义规则的传统流程系统 优势:处理标准化业务(如社保基数核定、公积金提取)时表…...

高效掌握Ryujinx:从入门到精通的开源Switch模拟器实战指南

高效掌握Ryujinx&#xff1a;从入门到精通的开源Switch模拟器实战指南 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx Ryujinx作为一款用C#编写的开源Nintendo Switch模拟器&#xff0…...