当前位置：首页 > news >正文

k8s API限流——server级别整体限流和客户端限流

news 2025/12/15 9:42:07

1. 背景

为了防止突发流量影响apiserver可用性，k8s支持多种限流配置，包括：

MaxInFlightLimit，server级别整体限流
Client限流
EventRateLimit, 限制event
APF，更细力度的限制配置

1.1 MaxInFlightLimit限流

apiserver默认可设置最大并发量（集群级别，区分只读与修改操作）
通过参数–max-requests-inflight代表只读请求
–max-mutating-requests-inflight代表修改请求
可以简单实现限流。

1.1.1 源码解读

入口 GenericAPIServer.New中的添加hook

 	// FlowControl为nil ，代表未启用 APF，API 服务器中的整体并发量将受到 kube-apiserver 的参数 --max-requests-inflight 和 --max-mutating-requests-inflight 的限制。if c.FlowControl != nil {const priorityAndFairnessFilterHookName = "priority-and-fairness-filter"if !s.isPostStartHookRegistered(priorityAndFairnessFilterHookName) {err := s.AddPostStartHook(priorityAndFairnessFilterHookName, func(context PostStartHookContext) error {genericfilters.StartPriorityAndFairnessWatermarkMaintenance(context.StopCh)return nil})if err != nil {return nil, err}}} else {const maxInFlightFilterHookName = "max-in-flight-filter"if !s.isPostStartHookRegistered(maxInFlightFilterHookName) {err := s.AddPostStartHook(maxInFlightFilterHookName, func(context PostStartHookContext) error {genericfilters.StartMaxInFlightWatermarkMaintenance(context.StopCh)return nil})if err != nil {return nil, err}}}// StartMaxInFlightWatermarkMaintenance starts the goroutines to observe and maintain watermarks for max-in-flight
// requests.
func StartMaxInFlightWatermarkMaintenance(stopCh <-chan struct{}) {startWatermarkMaintenance(watermark, stopCh)
}// startWatermarkMaintenance starts the goroutines to observe and maintain the specified watermark.
func startWatermarkMaintenance(watermark *requestWatermark, stopCh <-chan struct{}) {// 定期更新inflight使用指标go wait.Until(func() {watermark.lock.Lock()readOnlyWatermark := watermark.readOnlyWatermarkmutatingWatermark := watermark.mutatingWatermarkwatermark.readOnlyWatermark = 0watermark.mutatingWatermark = 0watermark.lock.Unlock()metrics.UpdateInflightRequestMetrics(watermark.phase, readOnlyWatermark, mutatingWatermark)}, inflightUsageMetricUpdatePeriod, stopCh)// 定期观察watermarks。这样做是为了确保他们不会落后太多。当他们//落后太多时，在响应接收到的下一个请求时会有很长的延迟，而观察者//会赶上来。go wait.Until(func() {watermark.readOnlyObserver.Add(0)watermark.mutatingObserver.Add(0)}, observationMaintenancePeriod, stopCh)
}

WithMaxInFlightLimit代表限流处理函数

调用入口: staging\src\k8s.io\apiserver\pkg\server\config.go

DefaultBuildHandlerChain中，判断FlowControl为nil就开启WithMaxInFlightLimit，

if c.FlowControl != nil {requestWorkEstimator := flowcontrolrequest.NewWorkEstimator(c.StorageObjectCountTracker.Get)handler = filterlatency.TrackCompleted(handler)handler = genericfilters.WithPriorityAndFairness(handler, c.LongRunningFunc, c.FlowControl, requestWorkEstimator)handler = filterlatency.TrackStarted(handler, "priorityandfairness")} else {handler = genericfilters.WithMaxInFlightLimit(handler, c.MaxRequestsInFlight, c.MaxMutatingRequestsInFlight, c.LongRunningFunc)}func WithMaxInFlightLimit(handler http.Handler,nonMutatingLimit int,mutatingLimit int,longRunningRequestCheck apirequest.LongRunningRequestCheck,
) http.Handler {// 如果limit num为0就不开启限流了if nonMutatingLimit == 0 && mutatingLimit == 0 {return handler}var nonMutatingChan chan boolvar mutatingChan chan bool// 构造限流的chan，类型为长度=limit的 bool chanif nonMutatingLimit != 0 {nonMutatingChan = make(chan bool, nonMutatingLimit)klog.V(2).InfoS("Initialized nonMutatingChan", "len", nonMutatingLimit)} else {klog.V(2).InfoS("Running with nil nonMutatingChan")}if mutatingLimit != 0 {mutatingChan = make(chan bool, mutatingLimit)klog.V(2).InfoS("Initialized mutatingChan", "len", mutatingLimit)} else {klog.V(2).InfoS("Running with nil mutatingChan")}initMaxInFlight(nonMutatingLimit, mutatingLimit)// 发起请求return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {ctx := r.Context()requestInfo, ok := apirequest.RequestInfoFrom(ctx)if !ok {handleError(w, r, fmt.Errorf("no RequestInfo found in context, handler chain must be wrong"))return}// 检查是否是长时间运行的请求if longRunningRequestCheck != nil && longRunningRequestCheck(r, requestInfo) {handler.ServeHTTP(w, r)return}。。。。。。。。
}// LongRunningRequestCheck is a predicate which is true for long-running http requests.
type LongRunningRequestCheck func(r *http.Request, requestInfo *RequestInfo) bool

使用BasicLongRunningRequestCheck检查是否是watch或者pprof debug等长时间运行的请求，因为这些请求不受限制，位置

func BasicLongRunningRequestCheck(longRunningVerbs, longRunningSubresources sets.String) apirequest.LongRunningRequestCheck {return func(r *http.Request, requestInfo *apirequest.RequestInfo) bool {if longRunningVerbs.Has(requestInfo.Verb) {return true}if requestInfo.IsResourceRequest && longRunningSubresources.Has(requestInfo.Subresource) {return true}if !requestInfo.IsResourceRequest && strings.HasPrefix(requestInfo.Path, "/debug/pprof/") {return true}return false}
}

检查是只读操作还是修改操作，决定使用哪个chan限制

		var c chan boolisMutatingRequest := !nonMutatingRequestVerbs.Has(requestInfo.Verb)if isMutatingRequest {c = mutatingChan} else {c = nonMutatingChan}

如果队列未满，有空位置，则更新排队数字

使用select 向c中写入true，如果能写入到说明队列未满
记录下对应的指标

		select {case c <- true:// We note the concurrency level both while the// request is being served and after it is done being// served, because both states contribute to the// sampled stats on concurrency.if isMutatingRequest {watermark.recordMutating(len(c))} else {watermark.recordReadOnly(len(c))}// default代表队列已满defer func() {<-cif isMutatingRequest {watermark.recordMutating(len(c))} else {watermark.recordReadOnly(len(c))}}()handler.ServeHTTP(w, r)

但是如果请求的group中含有 system:masters，则放行, 因为apiserver认为这个组是很重要的请求，不能被限流.

group=system:masters 对应的clusterRole 为cluster-admin, 队列已满，如果请求的group中没有 system:masters，则返回http 429错误,并且丢弃请求

				// at this point we're about to return a 429, BUT not all actors should be rate limited.  A system:master is so powerful// that they should always get an answer.  It's a super-admin or a loopback connection.if currUser, ok := apirequest.UserFrom(ctx); ok {for _, group := range currUser.GetGroups() {if group == user.SystemPrivilegedGroup {handler.ServeHTTP(w, r)return}}}

http 429 代表当前有太多请求了，请重试，并设置 response 的header Retry-After =1

// We need to split this data between buckets used for throttling.metrics.RecordDroppedRequest(r, requestInfo, metrics.APIServerComponent, isMutatingRequest)metrics.RecordRequestTermination(r, requestInfo, metrics.APIServerComponent, http.StatusTooManyRequests)tooManyRequests(r, w)func tooManyRequests(req *http.Request, w http.ResponseWriter) {// Return a 429 status indicating "Too Many Requests"w.Header().Set("Retry-After", retryAfter)http.Error(w, "Too many requests, please try again later.", http.StatusTooManyRequests)
}

1.2 Client限流

client-go默认的qps为5，但是只支持客户端限流，只能由各个发起端限制

集群管理员无法控制用户行为。

k8s API限流——server级别整体限流和客户端限流

1. 背景为了防止突发流量影响apiserver可用性，k8s支持多种限流配置，包括： MaxInFlightLimit，server级别整体限流Client限流EventRateLimit, 限制eventAPF，更细力度的限制配置 1.1 MaxInFlightLimit限流 apiserver…...

编程日记 2023/5/18 10:12:08

在华为做了三年软件测试被裁了，我该怎么办

近年来，随着经济环境的变化和企业战略的调整，员工被裁员的情况变得越来越普遍。无论是因为企业经营困难还是因为业务调整，员工们都可能面临被裁员的风险。如果你也遇到了这样的情况，那么你应该怎么办呢？ 首先&#xf…...

编程日记 2023/4/20 13:41:55

Spring cloud 限流的多种方式

在频繁的网络请求时，服务有时候也会受到很大的压力，尤其是那种网络攻击，非法的。这样的情形有时候需要作一些限制。本文主要介绍了两种限流方法，感兴趣的可以了解一下目录一、实战基于 Spring cloud Gateway 的限流二、基于阿…...

编程日记 2023/4/26 3:55:36

Linux命令·top

top命令是Linux下常用的性能分析工具，能够实时显示系统中各个进程的资源占用状况，类似于Windows的任务管理器。下面详细介绍它的使用方法。top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止…...

编程日记 2023/4/23 23:12:24

springmvc之编程步骤 springmvc初始化过程用WebServlet和WebFilter干掉web.xml 没有web.xml怎么写web程序一次GET请求在springmvc中是的处理流程 springMVC的handler都有哪些类型 springmvc主要组件简单介绍 springmvc 的Servlet WebApplicationContext springmvc 的…...

编程日记 2023/4/22 2:27:58

Matlab实现深度学习（附上完整仿真源码）

文章目录简单案例完整仿真代码下载简单案例深度学习是一种能够自动学习和提取数据特征的机器学习方法，它已经在图像识别、语音识别、自然语言处理等领域取得了显著的成果。而Matlab作为一个强大的数学计算工具，也提供了丰富的深度学习工具箱&#xff0…...

编程日记 2023/4/26 3:54:57

我的谷歌书签

Form 表单 | Element Plusa Vue 3 based component library for designers and developershttps://element-plus.gitee.io/zh-CN/component/form.html#%E5%AF%B9%E9%BD%90%E6%96%B9%E5%BC%8F three.js exampleshttp://www.yanhuangxueyuan.com/threejs/examples/#software_geo…...

编程日记 2023/4/22 2:28:05

day3 数据库技术考点汇总

一、重点知识点基本概念：三级模式-两级映像、数据库设计数据库模型：E-R模型、关系模型、关系代数（结合SQL语言）规范化：函数依赖、健与约束、范式、模式分解事务并发：并发三种问题、三级封锁协议数据库新技…...

编程日记 2023/4/22 4:14:18

学剪辑难吗如何使用会声会影2023做剪辑视频

很多剪辑初学者都问过一个问题，学剪辑难吗？其实不论学什么，只要用心学都不难，今天我们就来讲讲如何学做剪辑视频，感兴趣的小伙伴们不要走开！一、学剪辑难吗其实学剪辑并不是件难事，但是需要掌握…...

编程日记 2023/4/23 19:26:27

django学习日记

1、虚拟环境 virtualenv "加虚拟环境名字" 在当前目录下创建一个虚拟环境进入虚拟环境执行activate进入该虚拟环境，再执行deactivate退出虚拟环境安装一个包来管理虚拟环境，每次创建虚拟环境都放到同一位置，以及在任意位置都可…...

编程日记 2023/5/18 10:29:05

在线教学视频课程如何防止学员挂机？

阿酷TONY / 2023-3-31 / 长沙 / 原创 / 要不？交个朋友吧？ 在线教学视频课程如何防止学员挂机？siri:这是个有意思的问题哈~~~在线教育、在线企业培训机构通常是如何处理的呢？ 答：在视频播放过程中，弹出问题…...

编程日记 2023/5/18 10:30:21

【Redis】安装配置

文章目录Redis简介Redis版本迭代Redis安装配置官网地址操作系统环境基础查看本地redis版本修改配置文件docker容器安装redis测试linux版Redis简介简介与传统数据库关系(mysql)，Redis是key-value数据库(NoSQL一种)，mysql是关系数据库。Redis数据操作主要…...

编程日记 2023/4/21 23:55:38

ChatGPT批量生成文章-ChatGPT文章生成器

ChatGPT：一键批量生成高质量文章，提高生产效率！ 随着信息爆炸的时代，文本生产成为了各个行业必不可少的一部分。但面对高强度的生产需求，人力资源却难以跟上步伐。现在，我们有一款基于人工智能和自然语言处…...

编程日记 2023/4/20 23:48:04

Linux命令 ——sed

介绍 sed 是一种流式文本编辑器，常用于在 Unix 和类 Unix 系统中对文本进行处理。它可以将文本从标准输入或文件中读取，对其进行修改，然后将修改后的文本输出到标准输出或文件中。sed 是 “stream editor” 的缩写。语法 sed 的基本语法为…...

编程日记 2023/5/17 11:53:01

C++常用字符串string方法

文章目录字符串string操作方法1. 类方法使用示例2. 头文件cstring方法使用示例字符串string操作方法 1. 类方法在C中，引入string.h头文件可以使用C语言中的字符串操作函数。然而，C提供了一个更加方便的字符串类string，不需要引入string.h头…...

编程日记 2023/4/21 10:25:37

XML树结构和语法

文章目录一、XML 树结构二、XML 语法规则总结一、XML 树结构 XML 树结构 XML 文档形成了一种树结构，它从"根部"开始，然后扩展到"枝叶"。一个 XML 文档实例 XML 文档使用简单的具有自我描述性的语法： <?xml vers…...

编程日记 2023/4/21 7:44:34

【Qt】Qt单元测试详解（四）：Google Test 断言

1、创建测试工程【Qt】Qt单元测试详解（一）：通过QtCreator创建测试工程 2、添加测试代码 2.1 默认生成的代码 1）项目工程pro include(gtest_dependency.pri)TEMPLATE = app CONFIG += console c++14 CONFIG -= app_bundle CONFIG += thread CONFIG -= qtHEADERS += \t…...

编程日记 2023/4/20 19:11:44

句柄和指针的区别

句柄和指针都是一种数据结构，都常用于访问内存，下面介绍他们的一些不同点。 1 数据结构类型不同指针的数据类型是无符号整数，占用4或8个字节（在32位和64位系统中），它就像一个变量一样，这个变量…...

编程日记 2023/4/24 12:28:54

Linux 网络编程学习笔记——十四、多线程编程

目录早期 Linux 不支持线程，直到 1996 年，Xavier Leroy 等人才开发出第一个基本符合 POSIX 标准的线程库 LinuxThreads 。但 LinuxThreads 效率低而且问题很多。自内核 2.6 开始，Linux 才真正提供内核级的线程支持，并有两个组织…...

编程日记 2023/4/29 3:09:13

JS 获取时区

JS 获取时区啥是时区？ 时区是地球上的区域使用同一个时间定义。以前，人们通过观察太阳的外置（时角）决定时间，这就使得不同经度的地方的时间各有不同，为了统一使用同一个时间，就引入了时区的概…...

编程日记 2023/4/26 3:56:06

业务系统对接大模型的基础方案：架构设计与关键步骤

业务系统对接大模型：架构设计与关键步骤在当今数字化转型的浪潮中，大语言模型（LLM）已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中，不仅可以优化用户体验，还能为业务决策提供…...

编程新知 2025/12/13 10:34:14

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2025/12/14 22:18:05

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

深入浅出：JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出：JavaScript 中的 window.crypto.getRandomValues() 方法在现代 Web 开发中，随机数的生成看似简单，却隐藏着许多玄机。无论是生成密码、加密密钥，还是创建安全令牌，随机数的质量直接关系到系统的安全性。Jav…...

编程新知 2025/10/8 4:56:09

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

0. 概述上一节对安装和使用有个基本介绍。根据这个 issue 的描述，后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作，其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

编程新知 2025/12/13 6:34:06

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2025/12/8 23:39:28

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2025/12/15 1:12:09

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题：docker pull 失败网络不同，需要使用镜像源按照如下步骤操作 sudo vi /etc/docker/dae…...

编程新知 2025/9/5 21:18:15

根据万维钢·精英日课6的内容，使用AI（2025）可以参考以下方法：

根据万维钢精英日课6的内容，使用AI（2025）可以参考以下方法： 四个洞见模型已经比人聪明：以ChatGPT o3为代表的AI非常强大，能运用高级理论解释道理、引用最新学术论文，生成对顶尖科学家都有用的…...

编程新知 2025/10/15 12:45:18

有限自动机到正规文法转换器v1.0

1 项目简介这是一个功能强大的有限自动机（Finite Automaton, FA）到正规文法（Regular Grammar）转换器，它配备了一个直观且完整的图形用户界面，使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...

编程新知 2025/12/9 7:17:28

k8s API限流——server级别整体限流和客户端限流

1. 背景

1.1 MaxInFlightLimit限流

1.1.1 源码解读

1.2 Client限流

相关文章：

k8s API限流——server级别整体限流和客户端限流

在华为做了三年软件测试被裁了，我该怎么办

Spring cloud 限流的多种方式

Linux命令·top

springmvc之系列文章

Matlab实现深度学习（附上完整仿真源码）

我的谷歌书签

day3 数据库技术考点汇总

学剪辑难吗如何使用会声会影2023做剪辑视频

django学习日记

在线教学视频课程如何防止学员挂机？

【Redis】安装配置

ChatGPT批量生成文章-ChatGPT文章生成器

Linux命令 ——sed

C++常用字符串string方法

XML树结构和语法

【Qt】Qt单元测试详解（四）：Google Test 断言

句柄和指针的区别

Linux 网络编程学习笔记——十四、多线程编程

JS 获取时区

业务系统对接大模型的基础方案：架构设计与关键步骤

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

Admin.Net中的消息通信SignalR解释

深入浅出：JavaScript 中的 `window.crypto.getRandomValues()` 方法

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

visual studio 2022更改主题为深色

抖音增长新引擎：品融电商，一站式全案代运营领跑者

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

根据万维钢·精英日课6的内容，使用AI（2025）可以参考以下方法：

有限自动机到正规文法转换器v1.0