当前位置: 首页 > article >正文

K8s控制平面升级

K8s 的升级只要按标准流程来完全可以做到零中断升级用户完全感知不到。基础逻辑什么是控制平面K8s 的集群分成两部分控制平面Master 节点可以理解成集群的 “大脑”负责管整个集群的状态比如调度 Pod、维护集群配置、提供 API 接口核心组件有kube-apiserver、kube-controller-manager、kube-scheduler还有存数据的 etcd。工作节点Worker 节点就是真正跑你业务 Pod 的机器上面跑kubelet来管理本地的 Pod。升级集群的时候有个固定的顺序先升级控制平面再升级工作节点。因为控制平面要向下兼容旧版本的工作节点保证你升控制平面的时候旧版本的工作节点还能正常工作业务不会断。我们用什么来升级这次我们用的是kubeadm——K8s 官方的集群搭建 升级工具大部分人搭集群都是用的它它会帮你处理所有的配置升级、组件更新不用你自己一个个改配置、换镜像非常省心。而且我们这次是同大版本的补丁升级从v1.30.0升到v1.30.3这种补丁版本基本都是修 bug没有大的功能变更升级风险非常小当然这个流程也适用于跨小版本的升级比如 1.29 升到 1.30。完整升级流程第一步先确认我能升到哪个版本首先我得先看看我的包管理器里有哪些可用的 kubeadm 版本因为我用的是 Ubuntu 系统用 apt 作为包管理器所以先执行apt list kubeadm -a输出是这样的kubeadm/unknown,now 1.30.3-1.1 amd64 [upgradable from: 1.30.0-1.1] kubeadm/unknown 1.30.2-1.1 amd64 kubeadm/unknown 1.30.1-1.1 amd64 kubeadm/unknown 1.30.0-1.1 amd64很清楚我当前装的是 1.30.0-1.1最新的补丁版本是 1.30.3-1.1就它了这就是我们这次的目标版本。第二步给 Master 节点拉个 “警戒线”升级之前我得先不让集群把新的 Pod 调度到 Master 节点上 —— 不然我升级到一半调度器又把一个新的业务 Pod 安排到 Master 上那我之前的准备不就白做了执行这个命令kubectl cordon cka-master这里的cka-master是我的 Master 节点的名字cordon这个命令的作用就是把节点标记为不可调度。什么意思就是节点本身还是正常运行的已经在上面跑的 Pod 也不会动但是调度器不会再把新的 Pod 往这个节点上放了相当于给节点拉了个警戒线只出不进。执行完我查一下节点状态kubectl get nodesNAME STATUS ROLES AGE VERSION cka-master Ready,SchedulingDisabled control-plane 5d6h v1.30.0 cka-worker1 Ready worker 5d6h v1.30.0 cka-worker2 Ready worker 5d5h v1.30.0看到 Master 节点的状态里多了SchedulingDisabled就说明这步成了。第三步把 Master 上的旧 Pod 都挪走警戒线拉完了接下来要把 Master 上已经在跑的普通 Pod都赶到其他工作节点上去 —— 不然我等下重启 kubelet 的时候这些 Pod 不就被杀了业务不就断了用这个命令排空节点kubectl drain cka-master --delete-emptydir-data --ignore-daemonsets这里的两个参数是你必须要加的--ignore-daemonsets忽略 DaemonSet 类型的 Pod DaemonSet 是什么就是那种每个节点都必须跑一个的 Pod比如我们的网络插件 calico每个节点都得有一个不然网络就不通了。这种 Pod 你赶不走的你把它删了它立刻就会在这个节点上重建一个所以我们要告诉命令别管这些 Pod直接忽略它们。--delete-emptydir-data删除 Pod 的临时本地数据 有些 Pod 会用emptydir存临时数据这些数据是跟着 Pod 走的Pod 挪到别的节点这些数据就没用了会在新节点重新生成。不加这个参数的话drain 会怕你丢数据不敢删 Pod直接卡在这里。加了这两个参数命令一下就跑通了它把 Master 上的普通 Pod 一个个驱逐到其他工作节点整个过程也就十几秒那些 Pod 在别的节点上重新启动业务完全没感知。第四步升级 kubeadmPod 都挪走了接下来就可以开始升级组件了首先要升级的就是 kubeadm 本身 —— 毕竟要让新版本的 kubeadm 来帮我们升级集群。为了防止系统自动升级把 K8s 的版本搞乱我把kubeadm、kubelet、kubectl这三个包锁定了也就是apt-mark hold这样平时执行apt upgrade的时候就不会不小心把它们升了。现在要主动升级所以先把锁解开apt-mark unhold kubeadm然后更新包列表装新版本的 kubeadmapt-get update apt install kubeadm1.30.3-1.1 -y这里一定要指定版本号不然它会给你装最新的我们要装我们选好的 1.30.3 版本。装完我查一下版本确认没问题kubeadm versionkubeadm version: version.Info{Major:1, Minor:30, GitVersion:v1.30.3, GitCommit:6f6904f41ac384ec4391224a2df241460, GitTreeState:clean, BuildDate:2024-07-16T23:53:15Z, GoVersion:go1.22.5, Compiler:gc, Platform:linux/amd64}okkubeadm 已经是新版本了。第五步执行集群控制平面的升级接下来就是最核心的一步用 kubeadm 升级整个控制平面。首先我先做个预检查看看集群有没有问题别升一半失败了kubeadm upgrade plan这个命令会帮我检查etcd 是不是健康各个组件是不是正常有没有不兼容的配置全部检查完之后告诉我可以执行的升级命令。预检查没问题就可以执行实际的升级了kubeadm upgrade apply v1.30.3 --etcd-upgradefalse这里我加了--etcd-upgradefalse因为我这次不想升级 etcd只升其他控制平面组件如果你想连 etcd 一起升去掉这个参数就可以默认是会一起升的。执行的时候它会问我确认[upgrade/version] You have chosen to change the cluster version to v1.30.3 [upgrade/versions] Cluster version: v1.30.0 [upgrade/versions] kubeadm version: v1.30.3 [upgrade] Are you sure you want to proceed? [y/N]:我输入y确认然后它就开始逐个升级组件了[apiclient] Found 1 Pods for label selectorkube-apiserver [upgrade/staticpods] Component kube-apiserver upgraded successfully! [apiclient] Found 1 Pods for label selectorkube-controller-manager [upgrade/staticpods] Component kube-controller-manager upgraded successfully! [apiclient] Found 1 Pods for label selectorkube-scheduler [upgrade/staticpods] Component kube-scheduler upgraded successfully!它是一个一个升的升一个的时候其他的控制平面组件还在正常跑所以整个过程集群完全可用业务一点都没断。全部升完之后它给我返回了成功的提示[upgrade/successful] SUCCESS! Your cluster was upgraded to v1.30.3. Enjoy! [upgrade/kubelet] Now that your control plane is upgraded, please proceed with upgrading your kubelets if you havent already done so.控制平面的核心组件已经升完了第六步升级 kubelet 和 kubectl核心组件升完了接下来要把 Master 节点上的kubelet和kubectl也升了这两个是节点上的代理和命令行工具也要和控制平面版本一致不然会有兼容问题。同样的先解锁这两个包apt-mark unhold kubelet kubectl然后安装新版本apt install kubelet1.30.3-1.1 kubectl1.30.3-1.1 -y搞定这两个也升级完成了。第七步把 Master 节点恢复正常所有组件都升完了现在要做收尾工作把 Master 节点恢复成正常的状态先把三个包重新锁上防止以后不小心自动升级apt-mark hold kubelet kubectl kubeadm重启 kubelet让新的 kubelet 生效systemctl daemon-reload systemctl restart kubelet.service最后把之前的调度禁止取消让 Master 节点可以重新接新的 Podkubectl uncordon cka-master做完这些我再查一下节点状态kubectl get nodesNAME STATUS ROLES AGE VERSION cka-master Ready control-plane 5d7h v1.30.3 cka-worker1 Ready worker 5d6h v1.30.0 cka-worker2 Ready worker 5d6h v1.30.0Master 节点的版本已经变成 1.30.3 了状态也恢复正常了整个升级过程就完成了注意别直接装包就完事不排空节点别忘了锁包版本。别同时升所有节点跨版本别跳太多

相关文章:

K8s控制平面升级

K8s 的升级只要按标准流程来,完全可以做到零中断升级,用户完全感知不到。基础逻辑什么是控制平面?K8s 的集群分成两部分:控制平面(Master 节点):可以理解成集群的 “大脑”,负责管整…...

K8s访问控制

用cluster-admin的权限随便操作,所有 Pod 之间网络全通,反正测试环境怎么玩都无所谓。 但当你的集群上了生产,跑了核心业务,你就会发现问题:开发同学误操作,把线上的 Deployment 删了,整个服务挂…...

FLUX.1海景美女图新手教程:3分钟掌握提示词结构——主体+环境+光线+风格

FLUX.1海景美女图新手教程:3分钟掌握提示词结构——主体环境光线风格 你是不是也遇到过这种情况?看到别人用AI生成的“海景美女图”美轮美奂,自己试了试,结果出来的图片要么人物奇怪,要么背景模糊,要么光线…...

DELMIA焊枪批量导入实战:宏命令脚本优化与CATIA协同操作指南

1. DELMIA焊枪批量导入的核心逻辑 在焊装仿真项目中,批量导入焊枪姿态是个让人头疼的活儿。我做过十几个汽车焊装项目,发现传统手动操作不仅效率低下,还容易出错。后来摸索出这套宏命令脚本CATIA协同的工作流,效率直接提升5倍不止…...

MedGemma-1.5-4B镜像特性:内置医学影像预处理Pipeline与安全脱敏机制

MedGemma-1.5-4B镜像特性:内置医学影像预处理Pipeline与安全脱敏机制 1. 引言:当AI遇见医学影像 想象一下,你是一位医学研究者,手头有大量的X光片、CT扫描和MRI影像需要分析。传统方法需要逐张查看、手动标注,既耗时…...

从Goldschmidt到代码:我如何用Python脚本‘侦探’出钙钛矿论文里的隐藏计算参数

解码钙钛矿论文中的隐藏参数:Python逆向工程实战 在材料科学领域,钙钛矿化合物的稳定性预测一直是个关键课题。Goldschmidt容忍因子(t)作为经典判据已有近百年历史,但鲜少有人讨论一个核心问题:当不同研究团队报告"相同&quo…...

PTA L2-039 清点代码库:STL容器组合实战解析

1. 题目背景与需求分析 这道PTA L2-039题目来自中国高校计算机大赛-团体程序设计天梯赛(GPLT),考察的是STL容器的综合运用能力。题目要求我们对代码库中的功能模块进行去重统计,这在软件开发中是个非常实际的需求——想象一下&…...

别再只会显示‘Hello World’了!用OLED玩点花的:SPI硬件滚动 vs I2C软件动画效果实现详解

让OLED屏动起来:SPI硬件滚动与I2C软件动画的进阶实战指南 当你的OLED项目已经能够稳定显示基础信息后,是否想过让这块小屏幕真正"活"起来?本文将带你突破静态显示的局限,深入探讨两种截然不同的动态效果实现方案&#…...

Phi-4-mini-reasoning开发者案例:为低代码平台注入多步推理能力

Phi-4-mini-reasoning开发者案例:为低代码平台注入多步推理能力 1. 模型介绍 Phi-4-mini-reasoning是一款专注于推理任务的文本生成模型,特别擅长处理需要多步逻辑推导的问题。与通用聊天模型不同,它被设计用来解决数学题、逻辑题等需要逐步…...

Path of Building终极指南:流放之路离线构建规划器深度解析

Path of Building终极指南:流放之路离线构建规划器深度解析 【免费下载链接】PathOfBuilding Offline build planner for Path of Exile. 项目地址: https://gitcode.com/GitHub_Trending/pa/PathOfBuilding Path of Building(简称PoB&#xff09…...

新手避坑指南:DC综合后report_timing报告里‘MET’旁边slack=0.01,这算时序过了吗?

数字IC设计新手必读:当DC综合报告显示slack0.01ns时,我们该警惕什么? 第一次看到Design Compiler综合后的时序报告里出现"MET"旁边跟着一个接近零的slack值,就像在高速公路上以120km/h的极限速度通过测速摄像头——表面…...

Flowframes视频插帧工具:5步快速上手AI视频补帧完整指南

Flowframes视频插帧工具:5步快速上手AI视频补帧完整指南 【免费下载链接】flowframes Flowframes Windows GUI for video interpolation using DAIN (NCNN) or RIFE (CUDA/NCNN) 项目地址: https://gitcode.com/gh_mirrors/fl/flowframes 想要将24fps的视频轻…...

终极免费调试工具:解锁AMD Ryzen处理器隐藏性能的完整指南

终极免费调试工具:解锁AMD Ryzen处理器隐藏性能的完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https:…...

知识竞赛系统的多端适配

📱 知识竞赛系统的多端适配实现PC、手机与平板的全场景覆盖📌 多端适配的时代必要性在数字化学习与竞赛日益普及的今天,用户设备呈现多元化趋势。专业场景下的集中培训可能使用PC电脑,碎片化时间的个人练习依赖智能手机&#xff0…...

手把手教你用PyTorch从零搭建并调优MobileNetV2图像分类模型

1. 环境准备与项目初始化 第一次接触MobileNetV2和PyTorch时,我也被各种环境配置搞得头大。后来发现用Anaconda管理环境能省去80%的兼容性问题。这里分享我的标准配置流程: conda create -n mobilenetv2 python3.8 -y conda activate mobilenetv2安装PyT…...

Cursor AI Pro功能持续使用技术方案:多语言环境下的设备限制解决方案

Cursor AI Pro功能持续使用技术方案:多语言环境下的设备限制解决方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve re…...

OP-TEE安全存储深度解析(一):密钥体系与文件加密流程

1. OP-TEE安全存储的核心价值 第一次接触OP-TEE的安全存储功能时,我完全被它的精妙设计震撼到了。想象一下,你的手机里存着指纹、人脸识别模板这些极度敏感的数据,如果这些信息被普通应用程序随意读取,后果简直不堪设想。而OP-TEE…...

【技术解析】SwAV:用在线聚类与最优运输破解无监督视觉特征学习难题

1. SwAV:无监督视觉特征学习的破局者 想象一下你面前有100万张没有标签的图片,现在需要让AI自动学会识别其中的物体特征——这就是SwAV要解决的核心问题。传统方法就像让一个孩子通过反复对比无数相似图片来学习,不仅效率低下,还特…...

Intel RealSense D435i数据采集避坑指南:Python脚本获取相机内参、外参并同步保存多传感器图像

Intel RealSense D435i多模态数据采集工程实践:从参数解析到高精度同步方案 在机器人导航、三维重建和增强现实等领域,多传感器数据采集的精度和同步性直接决定了后续算法的上限。Intel RealSense D435i作为一款集成了RGB、深度和IMU的视觉传感器&#x…...

从入门到实战:在UniApp中高效集成uCharts图表(组件与原生双模式详解)

1. uCharts图表库简介与UniApp集成优势 uCharts是一款专为移动端优化的高性能图表库,最初为微信小程序设计,现已全面支持UniApp平台。我在多个商业项目中实测发现,它的渲染速度比同类库快30%以上,特别适合需要快速响应的数据可视化…...

STM32 FOC电机库PID调参避坑指南:为什么你的定点参数调不好?

STM32 FOC电机库PID调参避坑指南:为什么你的定点参数调不好? 调试电机控制系统的PID参数就像在给一台精密仪器做微创手术——参数调整的每一个细节都可能影响最终性能表现。对于使用STM32 FOC电机库的工程师来说,定点PID参数的调试尤其考验技…...

用Java Stream一行代码搞定彩票随机选号(双色球/大乐透)

用Java Stream一行代码搞定彩票随机选号(双色球/大乐透) 每次路过彩票站,总忍不住想试试手气。但机选号码总感觉少了点参与感?不如用Java Stream API自己写个随机选号器,既锻炼编码能力又能享受"定制化"选号…...

智能代码生成可读性优化(工业级SOP手册):含12个真实Git Diff对比案例与自动化检测脚本

第一章:智能代码生成代码可读性优化 2026奇点智能技术大会(https://ml-summit.org) 智能代码生成工具(如Copilot、CodeWhisperer、Tabnine)在提升开发效率的同时,常产出语法正确但语义模糊、命名随意、结构扁平的代码&#xff0c…...

光轮智能揽5.5亿订单引爆具身数据元年,物理AI时代数据成竞争焦点

1. 光轮智能订单刷新纪录,引爆“具身数据元年” 全球首个具身数据独角兽光轮智能,2026年一季度狂揽5.5亿元订单,刷新具身数据行业纪录,直接引爆“具身数据元年”。把订单拆开来看,背后浮现出的并非单一需求&#xff0c…...

别再傻傻地直接扫了!手把手教你用wafw00f在Windows和Kali上优雅地“试探”网站防火墙

优雅识别Web应用防火墙:wafw00f在Windows与Kali中的实战指南 当安全研究员面对一个陌生网站时,直接发起攻击就像蒙着眼睛走雷区——不仅危险,而且低效。真正的高手总会先做一件事:识别目标网站的防护体系。本文将带你用wafw00f这…...

AMD平台ESXI 7.0实战:避坑部署Win11与TrueNAS虚拟化存储方案

1. AMD平台与ESXI 7.0的兼容性陷阱 AMD平台在虚拟化领域的崛起让不少玩家跃跃欲试,但ESXI 7.0对AMD处理器的支持并非完美无缺。我最近用Ryzen 9 5900X搭建测试环境时,就遭遇了三个典型问题:首先是安装界面卡在"Loading modules"阶段…...

Vue项目实战:用3d-force-graph和Neo4j打造炫酷的3D知识图谱(附完整代码)

Vue与Neo4j深度整合:构建高性能3D知识图谱的工程实践 知识图谱作为结构化知识的表现形式,正在成为企业知识管理和智能应用的核心基础设施。本文将深入探讨如何利用Vue.js前端框架与Neo4j图数据库,结合3d-force-graph可视化库,构建…...

SR-MPLS TE隧道配置实战:基于ENSP的流量工程实验指南

1. SR-MPLS TE技术入门:从理论到实验环境搭建 第一次接触SR-MPLS TE时,我被它"无状态隧道"的特性惊艳到了。传统MPLS TE需要每台设备维护RSVP信令状态,而SR-MPLS TE只需要在头节点计算路径就能实现流量工程,这就像自驾…...

告别弹窗与捆绑:用Geek Uninstaller与SoftCnKiller打造纯净Windows系统

1. 为什么你的Windows系统总是越用越卡? 相信很多朋友都有这样的体验:新买的电脑用起来飞快,但半年后就开始卡顿、弹窗不断,甚至莫名其妙多出一堆没安装过的软件。这种情况我遇到过太多次了——上周帮同事修电脑,发现…...

Hive数据操作与查询实战:从DDL到DQL的完整工作流解析

1. Hive数据库与表的基础操作 Hive作为构建在Hadoop之上的数据仓库工具,其核心功能之一就是通过类SQL语法(HiveQL)管理结构化数据。我们先从最基础的数据库和表操作开始,这是每个Hive用户必须掌握的技能点。 创建数据库时&#xf…...