当前位置: 首页 > article >正文

扛住十万并发的“冷面保安”:一文扒透限流的四大经典算法与代码实战

在高并发架构中如果说缓存和 MQ 是替服务器扛伤害的“防弹衣”那么限流Rate Limiting就是守在系统大门外的“冷面保安”。他的核心逻辑极其冷酷不管外面排队的人有多急只要超过了系统的最大接待能力多出来的人直接拒之门外或者拉入等待区返回 429 Too Many Requests。为了把这位“保安”训练得既严格又懂变通前人总结了四种最经典的限流算法。今天我们就由浅入深一层层扒开它们的底裤并用一段极简的代码实战演练目前大厂使用频率最高的那一个。一、 固定窗口算法Fixed Window最死板的保安这是最简单粗暴的算法适合用 Redis 的INCR命令结合过期时间快速实现。核心逻辑设定一个时间窗口比如 1 分钟和一个阈值比如 100 次。在一分钟内来一个请求就记一次数。一旦达到 100后续请求全部拒绝。等下一个 1 分钟到来计数器清零重新开始。致命痛点临界点突刺假设 0:59 秒瞬间涌入 100 个请求计数器满了到了 1:00 秒计数器清零又瞬间涌入 100 个请求。对于系统来说它在 2 秒钟内承受了 200 个请求的暴击而限流器竟然觉得“很合理”。这极易导致系统在这个临界点被打崩。二、 滑动窗口算法Sliding Window精细化的查岗为了解决固定窗口的“临界点突刺”问题滑动窗口应运而生TCP 协议底层的流量控制也是这个思想。核心逻辑把 1 分钟的窗口划分成多个更小的“格子”比如 6 个格子每个格子 10 秒。随着时间推移这个窗口会以 10 秒为单位向前“滑动”。统计的时候只统计当前窗口包含的 6 个格子里的总请求数。优势与代价完美抹平了临界点突刺。你划分的格子越细比如精细到 1 秒 1 个格子限流就越平滑。代价是需要在内存里记录每个小格子的访问记录稍微费点内存。三、 漏桶算法Leaky Bucket绝对的“强迫症”如果我们希望系统以绝对稳定、不可改变的速率处理请求就像工厂的流水线一样漏桶算法就是最佳选择。常见的消息队列MQ削峰填谷本质上就是漏桶思想。核心逻辑用户的请求就像是“往桶里倒水”倒水的速度可以非常快、非常狂暴。如果倒水太快导致桶满了溢出来的水请求直接被无情抛弃。系统处理请求的速度就像桶底“漏水”的速度这个速度是永远恒定的比如绝对的 100个/秒。痛点太死板了即使你的服务器现在闲得发慌遇到突发的一小波流量它也只能慢吞吞地以恒定速度滴水。它完全缺乏应对合理突发流量的弹性。四、 令牌桶算法Token Bucket大厂实战的最优解这是目前业界使用最广泛的算法各大 API 网关默认首选。它完美融合了“平滑限流”和“允许突发流量”的需求。核心逻辑这次我们换个思路桶里装的不再是请求而是“通行证Token”。系统会以一个恒定的速度比如 100个/秒往桶里“放入”令牌。桶的容量是有限的比如最多装 500 个令牌。如果桶满了新生成的令牌就会被丢弃。当一个请求过来时它必须从桶里拿走一个令牌才能被系统处理。如果桶里没令牌了请求就被拒绝。终极杀招弹性突发假设系统闲置了一段时间桶里已经攒满了 500 个令牌。此时突然有一波 500 个并发请求砸过来令牌桶可以瞬间把 500 个令牌全部发出去让这波突发流量瞬间通过随后它又会恢复到 100个/秒 的平稳限制。这就是它的王牌优势。五、 令牌桶代码实战、分布式限流代码Redisson 落地下面我们直接拉起一个标准的生产级分布式限流示例。使用非阻塞的tryAcquire()快速失败机制当请求拿不到令牌时立刻触发限流兜底。1. 引入 Maven 依赖XMLdependency groupIdorg.redisson/groupId artifactIdredisson/artifactId version3.27.0/version /dependency2. 核心限流引擎实现Javaimport org.redisson.Redisson; import org.redisson.api.RRateLimiter; import org.redisson.api.RateIntervalUnit; import org.redisson.api.RateType; import org.redisson.config.Config; import java.time.LocalTime; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; public class DistributedRateLimiterDemo { public static void main(String[] args) throws InterruptedException { // 1. 初始化 Redisson 客户端配置连接本地 Redis Config config new Config(); config.useSingleServer() .setAddress(redis://127.0.0.1:6379); // .setPassword(your_password); // 有密码则配置 Redisson redisson (Redisson) Redisson.create(config); // 2. 获取一个全局分布式限流器对象 // 这个 Key 会持久化在 Redis 中所有集群节点使用同一个 Key 即可实现全局联动 RRateLimiter rateLimiter redisson.getRateLimiter(global_order_limiter); // 3. 【核心配置】设置限流规则 // 参数1RateType.OVERALL 表示这 5 个令牌是给整个微服务集群共享的而不是单机 // 参数2每个时间窗口内产生的令牌数 (5个) // 参数3时间窗口的长度 (1) // 参数4时间窗口的单位 (秒) // 综合含义整个分布式集群每 1 秒钟一共只生成 5 个令牌 rateLimiter.trySetRate(RateType.OVERALL, 5, 1, RateIntervalUnit.SECONDS); System.out.println( 分布式限流器初始化成功开始模拟集群并发压测...); // 4. 模拟高并发线程池代表多台服务器同时收到了并发流量 ExecutorService executorService Executors.newFixedThreadPool(15); for (int i 1; i 15; i) { final int requestId i; executorService.submit(() - { try { // 【高并发核心防线】非阻塞式尝试获取 1 个令牌 // tryAcquire() 会瞬间返回结果绝不卡死当前线程 boolean hasToken rateLimiter.tryAcquire(1); if (hasToken) { // 拿到了全局令牌允许执行高价值的业务逻辑如写 MySQL、调用支付接口 System.out.println(LocalTime.now() | 节点线程 | ✅ 请求 requestId 抢到全局令牌成功进入下单主链路); } else { // 没抢到令牌直接触发限流快速失败返回友好提示或走降级逻辑 System.out.println(LocalTime.now() | 节点线程 | ❌ 请求 requestId 被全局限流拦截 - 返回提示: [服务太火爆请稍后再试]); } } catch (Exception e) { e.printStackTrace(); } }); } // 优雅关闭 executorService.shutdown(); // 生产环境中通常伴随应用销毁时关闭 redisson 实例 // redisson.shutdown(); } }深入底层Redisson 是如何避免“系统休克”的在前面的设计中聪明的架构师一定会问一个深刻的问题“如果 Redis 里的限流器空闲了很久突然放进去一个巨大的并发会不会瞬间把系统冲垮”仔细观察rateLimiter.trySetRate(RateType.OVERALL, 5, 1, RateIntervalUnit.SECONDS)这行代码。Redisson 在内部 Lua 脚本中做了一个非常聪明的防御设定在一个时间窗口如 1 秒内允许积攒的最大令牌总数是严格受限于你设置的rate值即 5 个的。这意味着即使你的系统在深夜几个小时无人访问全局水桶里的令牌也不会无限膨胀到几万个。当第二天的第一波突发流量砸过来时Redis 最多也只会瞬间放行 5 个请求后续的请求依旧要严格按照“每秒生成 5 个”的平滑速率规律流转。这在分布式架构中被称为“防休克保护Anti-Shock Protection”完美兼顾了对突发流量的轻度弹性又死死守住了后端持久层数据库的最后一道红线。结语高并发架构没有银弹。如果你要保护的是绝对不能承受突发压力的老旧底层数据库选漏桶。如果你要保护的是对外暴露的 Web API 接口希望在平时平滑限制偶尔遇到大促又能扛住一波突发的积攒流量果断选令牌桶。认清每种算法的脾气才能给你的服务器配上最合适的“冷面保安”。

相关文章:

扛住十万并发的“冷面保安”:一文扒透限流的四大经典算法与代码实战

在高并发架构中,如果说缓存和 MQ 是替服务器扛伤害的“防弹衣”,那么限流(Rate Limiting)就是守在系统大门外的“冷面保安”。他的核心逻辑极其冷酷:不管外面排队的人有多急,只要超过了系统的最大接待能力&…...

iTop实战指南:3个关键挑战与ITSM平台架构优化策略

iTop实战指南:3个关键挑战与ITSM平台架构优化策略 【免费下载链接】iTop A simple, web based CMDB & IT Service Management tool 项目地址: https://gitcode.com/gh_mirrors/it/iTop 在数字化转型浪潮中,企业IT服务管理面临配置信息分散、…...

如何扛住十万级流量洪峰?扒开高并发架构的五层防御体系

在互联网的残酷战场上,流量既是黄金,也是洪水。试想这样一个场景:你们公司花重金请了一位顶流代言人,晚上 8 点准时开启一场“一元秒杀”活动。时间一到,原本平时只有几百 QPS(每秒请求数)的系统…...

NAS如何变身创作利器?基于绿联DX4600 Pro自建图床与Typora无缝协作

1. 为什么选择NAS自建图床? 作为一名长期使用Markdown写作的内容创作者,我深知图片管理的重要性。过去三年我先后尝试过七牛云、又拍云等第三方图床服务,虽然费用不高(每月约5-10元),但经常遇到两个致命问题…...

如何用韭菜盒子打造你的VSCode投资信息中心:5大实用功能深度体验

如何用韭菜盒子打造你的VSCode投资信息中心:5大实用功能深度体验 【免费下载链接】leek-fund :chart_with_upwards_trend: 韭菜盒子VSCode插件,可以看股票、基金、期货等实时数据。 LeekFund turns your VS Code and Cursor into a real-time stock, fun…...

新手避坑指南:用CCS10和LaunchXL-F28379D点亮第一个LED(GPIO输出两种方法详解)

从零点亮LED:LaunchXL-F28379D开发板GPIO实战避坑手册 刚拿到LaunchXL-F28379D开发板时,那种既兴奋又忐忑的心情我至今记忆犹新。作为TI C2000系列中的明星产品,这块板子强大的DSP性能与丰富的外设令人跃跃欲试,但面对密密麻麻的英…...

互联网大厂 Java 求职面试全景:从音视频场景到微服务架构的深入探讨

互联网大厂 Java 求职面试全景:从音视频场景到微服务架构的深入探讨 在互联网大厂的招聘中,Java 开发者的面试不仅技术含量高,还充满了戏剧性。今天,我们将通过一位求职者燕双非与面试官的对话,带你走进这个复杂而有趣…...

i.MX6Q烧录翻车实录:从‘No Device Connected’到‘Push error’,我拔掉一个USB WiFi才搞定

i.MX6Q烧录实战:当USB设备冲突遇上OTG接口的排查指南 那天下午的阳光透过窗户斜射进实验室,我正对着i.MX6Q开发板进行例行固件更新。Mfgtools工具已经准备就绪,开发板电源接通,一切看起来都很完美——直到屏幕上跳出那个令人沮丧…...

知识库搭建:从认知到实践的完整指南

知识库搭建:从认知到实践的完整指南一、先搞清楚:什么是知识? 数据 → 信息 → 知识 → 智慧 是经典的 DIKW 金字塔,描述了认知逐层升维的过程:层级核心定义关键特征回答的问题示例数据原始事实,raw facts离…...

1951-2025年中国1km月平均气温逐年年内季节波动幅度数据集

中国1000米分辨率月平均气温数据集(1951-2025)提供了长时间序列、规则网格的气象背景信息,为开展气候变化分析和区域比较研究提供了基础数据支撑。针对原始月尺度序列直接使用不够便捷的问题,需要进一步形成具有明确主题和统一格式…...

3分钟解决游戏操作冲突:Hitboxer SOCD工具让你的键盘操作职业化

3分钟解决游戏操作冲突:Hitboxer SOCD工具让你的键盘操作职业化 【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否在玩《街头霸王6》时连招总是失败?或者在《Apex英雄》中急停转向时…...

AI 落地精准测试平台:从排障定位、回归决策到智能分析实战课系列导航

本目录沉淀了一套围绕“采集接入、报告分析、治理沉淀、智能运维”展开的教学文章系列。 共 120 篇,适合拆分发布,也适合按专题连续阅读。 AI 落地精准测试平台:从排障定位、回归决策到智能分析实战课 这套系列适合谁 测试工程师&#xff…...

VBS转VBE不只是加密:聊聊Scripting.Encoder的‘黑历史’与现代替代方案

VBS转VBE:从Scripting.Encoder的兴衰到现代脚本保护方案 在Windows脚本技术的发展长河中,VBScript(VBS)曾经是自动化任务和系统管理的重要工具。而与之相伴的VBE(VBScript Encoded)格式,则承载着…...

为什么你的Perplexity薪资查询总返回403?3类Token权限陷阱+2种合法绕行路径(含Postman配置模板)

更多请点击: https://intelliparadigm.com 第一章:为什么你的Perplexity薪资查询总返回403?3类Token权限陷阱2种合法绕行路径(含Postman配置模板) 当你调用 Perplexity 提供的薪资数据 API(如 /v1/salari…...

OpenHarmony与嵌入式Linux实战:从社区项目到深度开发指南

1. 项目概述:从社区精选到深度解析每周浏览技术社区,总能看到不少让人眼前一亮的项目分享,但信息往往比较零散,像是“嵌入式学习资料包”、“OpenHarmony挑战赛作品赏析”这类帖子,标题很吸引人,点进去却常…...

拯救吃灰的MT7921网卡:保姆级教程,在Ubuntu 22.04上为联想拯救者系列驱动Wi-Fi

拯救吃灰的MT7921网卡:联想拯救者Ubuntu 22.04无线驱动全攻略 当联想拯救者Y9000P/R7000P等2021款笔记本遇上Ubuntu 22.04,那块被诟病已久的MT7921无线网卡往往成为最大的绊脚石。不同于Windows下的即插即用,Linux环境需要精准的内核版本与固…...

从仿真到现实:用Unity+ROS2搭建激光雷达小车,为实体机器人开发做预演

从仿真到现实:用UnityROS2搭建激光雷达小车,为实体机器人开发做预演 在机器人开发领域,仿真环境正逐渐成为不可或缺的工具。想象一下,你可以在不购买任何硬件的情况下,验证复杂的导航算法;或者在投入大量资…...

BiliDownloader实战演练:解锁B站视频离线观看的智能解决方案

BiliDownloader实战演练:解锁B站视频离线观看的智能解决方案 【免费下载链接】BiliDownloader BiliDownloader是一款界面精简,操作简单且高速下载的b站下载器 项目地址: https://gitcode.com/gh_mirrors/bi/BiliDownloader 你是否曾为无法下载B站…...

GD32 vs STM32:除了参数表,新手选型还得看这几点(附快速上手指南)

GD32与STM32实战选型指南:新手避坑与快速上手指南 当你在电子市场拿起一片GD32开发板和一片STM32开发板时,它们看起来几乎一模一样——同样的引脚排列,同样的封装尺寸,甚至连丝印字体都相似。但当你真正开始项目开发时&#xff0c…...

生物医学论文降AI工具免费推荐:2026年生物医学毕业论文知网AIGC超标免费4.8元一次过完整方案

生物医学论文降AI工具免费推荐:2026年生物医学毕业论文知网AIGC超标免费4.8元一次过完整方案 整理了一份生物医学论文降AI的完整选购指南,按性价比排序。 首推嘎嘎降AI(www.aigcleaner.com),4.8元,99.26%…...

工业软件与高性能算力融合:重构智能制造核心引擎

在制造业数字化转型向纵深推进的今天,工业软件与高性能算力的深度融合,正在成为驱动高端制造、关键装备、核心工业领域突破瓶颈的关键力量。长期以来,我国工业领域面临着研发周期长、仿真效率低、系统集成复杂、国产化替代缓慢等多重难题&…...

HS2-HF_Patch汉化补丁:3分钟打造完美中文游戏体验

HS2-HF_Patch汉化补丁:3分钟打造完美中文游戏体验 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 还在为Honey Select 2的日文界面而烦恼吗&#xf…...

对比直接使用厂商API与通过Taotoken聚合调用的费用观感

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接使用厂商API与通过Taotoken聚合调用的费用观感 1. 引言:成本感知的演变 在构建基于大模型的应用时&#xff0…...

Linux用户的终极翻译助手:3种智能翻译方式完全指南

Linux用户的终极翻译助手:3种智能翻译方式完全指南 【免费下载链接】CuteTranslation Linux屏幕取词翻译软件 项目地址: https://gitcode.com/gh_mirrors/cu/CuteTranslation 你是否曾在Linux系统中阅读英文文档时频繁切换浏览器查词?是否因为图片…...

共享麻将室无人化运营:技术架构、硬件选型与实战避坑指南

1. 项目概述:当传统棋牌室遇上“无人化”浪潮最近几年,如果你留意过城市里的商业形态,会发现一个挺有意思的现象:那些曾经需要前台、服务员、保洁阿姨的传统棋牌室,特别是麻将馆,正在悄然“变身”。它们门口…...

Wireshark 和 tcpdump 到底怎么选?一线排障中抓包工具的适用场景、边界与判断标准

Wireshark 和 tcpdump 到底怎么选?一线排障中抓包工具的适用场景、边界与判断标准 很多团队一遇到网络慢、连接断续、接口超时,第一反应就是“先抓包”。问题是:抓包不是答案,抓什么、在哪抓、用什么工具抓,才决定你能…...

Docker 网络模式详解:bridge、host、overlay 和 macvlan

Docker 网络模式详解:bridge、host、overlay 和 macvlan Docker 提供了多种网络模式,让容器既能灵活通信,又能实现安全隔离。无论是单机多容器应用,还是跨主机的 Swarm 集群,亦或需要直接接入物理网络的 IoT 设备&…...

从VS2019调试到IIS部署:一个.NET Core Web API的‘完整旅程’与避坑实录

从VS2019调试到IIS部署:一个.NET Core Web API的‘完整旅程’与避坑实录 当第一次尝试将.NET Core Web API从开发环境部署到生产服务器时,许多开发者都会遇到各种预料之外的挑战。本文将以第一人称视角,详细记录我从零开始创建项目、本地调试…...

Apollo2 BLE自定义服务开发指南:GATT数据库配置与回调实现

1. 项目概述与核心价值最近在折腾一个基于Apollo2 Blue的低功耗蓝牙项目,需要自定义一个服务(Service)来实现特定的数据交互功能。如果你也在用Ambiq Micro的Apollo2或Apollo3 Blue系列芯片做BLE开发,大概率会遇到类似的需求&…...

深度解析SacreBLEU:5个实战技巧提升机器翻译评估效率

深度解析SacreBLEU:5个实战技巧提升机器翻译评估效率 【免费下载链接】sacrebleu Reference BLEU implementation that auto-downloads test sets and reports a version string to facilitate cross-lab comparisons 项目地址: https://gitcode.com/gh_mirrors/s…...