当前位置: 首页 > article >正文

在Rocky Linux 10.1上,用kubeadm和containerd 2.2.1从零搭建k8s 1.35.0集群(含Cilium网络配置)

在Rocky Linux 10.1上构建Kubernetes 1.35.0生产级集群从Containerd配置到Cilium网络实战当企业级应用向云原生架构迁移时一个稳定高效的Kubernetes集群成为技术栈的核心枢纽。本文将手把手带你在Rocky Linux 10.1上使用kubeadm工具链和containerd 2.2.1运行时搭建符合生产要求的Kubernetes 1.35.0集群并通过Cilium实现高性能网络方案。不同于常规教程我们特别针对国内环境优化了镜像拉取策略并采用kube-proxy替代方案提升网络性能。1. 系统环境深度调优在Rocky Linux 10.1上部署Kubernetes前需要完成一系列底层系统配置。这些调优不仅影响集群稳定性更决定了后续运维的难易程度。内核参数调优是性能保障的第一步。创建/etc/sysctl.d/k8s-ebpf.conf文件写入以下内容net.ipv4.ip_forward 1 net.bridge.bridge-nf-call-ip6tables 1 fs.inotify.max_user_watches 524288 vm.max_map_count 2000000 net.core.somaxconn 32768执行sysctl --system立即生效。这些参数主要解决容器网络跨节点通信的IP转发大规模服务发现时的文件监控限制Elasticsearch等有状态服务的内存映射需求高并发连接场景下的队列容量资源限制调整直接影响容器运行效率echo * soft nofile 100001 /etc/security/limits.conf echo * hard nofile 100002 /etc/security/limits.conf echo * soft memlock unlimited /etc/security/limits.conf生产环境必须关闭的配置SELinuxsetenforce 0 配置文件永久禁用Swapswapoff -a 注释fstab条目Firewalldsystemctl disable --now firewalld提示执行ulimit -a验证修改是否生效特别是nproc和nofile值。大型Java应用需要至少65535的文件描述符。2. Containerd精细化配置作为Docker的轻量化替代containerd 2.2.1需要特别关注两个核心配置cgroup驱动和镜像加速。安装最新版containerdyum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo yum install -y containerd.io-2.2.1生成默认配置后关键修改点[plugins.io.containerd.grpc.v1.cri.containerd] snapshotter overlayfs [plugins.io.containerd.grpc.v1.cri.containerd.runtimes.runc.options] SystemdCgroup true国内镜像加速方案采用分级策略主仓库配置阿里云镜像站Kubernetes专用镜像使用中科大源备用方案配置腾讯云镜像示例配置目录结构/etc/containerd/certs.d/ ├── docker.io │ └── hosts.toml ├── registry.k8s.io │ └── hosts.toml └── quay.io └── hosts.toml典型hosts.toml内容server https://registry.k8s.io [host.https://k8s.mirrors.ustc.edu.cn] capabilities [pull, resolve]验证配置生效crictl pull registry.k8s.io/pause:3.103. Kubernetes组件安装与集群初始化使用国内源安装三件套cat /etc/yum.repos.d/kubernetes.repo EOF [kubernetes] nameKubernetes baseurlhttps://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/ enabled1 gpgcheck0 EOF yum install -y kubelet-1.35.0 kubeadm-1.35.0 kubectl-1.35.0定制化kubeadm配置重点参数说明apiVersion: kubeadm.k8s.io/v1beta4 kind: InitConfiguration nodeRegistration: criSocket: unix:///var/run/containerd/containerd.sock kubeletExtraArgs: cgroup-driver: systemd --- apiVersion: kubeadm.k8s.io/v1beta4 kind: ClusterConfiguration kubernetesVersion: v1.35.0 imageRepository: registry.aliyuncs.com/google_containers networking: podSubnet: 10.244.0.0/16 serviceSubnet: 10.96.0.0/12 controllerManager: extraArgs: bind-address: 0.0.0.0 scheduler: extraArgs: bind-address: 0.0.0.0初始化前预拉镜像kubeadm config images pull --config kubeadm-init.yaml执行集群初始化kubeadm init --configkubeadm-init.yaml | tee kubeadm-init.log关键故障排查点检查journalctl -xeu kubelet日志确认containerd的CRI插件已启用验证镜像加速配置是否生效4. Cilium网络插件高级部署Cilium作为Kubernetes网络方案的革命者其eBPF技术可以完全替代kube-proxy。以下是生产级部署方案Helm安装参数解析helm install cilium cilium/cilium \ --namespace kube-system \ --version 1.18.5 \ --set kubeProxyReplacementstrict \ --set ipam.modekubernetes \ --set routingModetunnel \ --set tunnelProtocolvxlan \ --set ipam.operator.clusterPoolIPv4PodCIDRList10.244.0.0/16 \ --set hubble.relay.enabledtrue \ --set hubble.ui.enabledtrue关键参数说明参数值作用kubeProxyReplacementstrict完全替代kube-proxyipam.modekubernetes集成K8s原生IPAMtunnelProtocolvxlan跨节点通信封装协议hubble.enabledtrue启用网络可观测性验证安装效果cilium status kubectl -n kube-system get pods -l k8s-appcilium性能对比测试相同节点规模网络方案延迟(ms)吞吐量(Gbps)连接建立速率(conn/s)kube-proxy1.25.812,000Cilium eBPF0.49.285,0005. 节点扩展与运维实践工作节点加入流程重复前文containerd和kubelet安装步骤获取加入令牌kubeadm token create --print-join-command在工作节点执行生成的加入命令常见问题处理指南镜像拉取失败检查containerd的hosts.toml配置Pod网络不通验证Cilium的CNI配置节点NotReady排查kubelet与容器运行时通信关键监控指标# Cilium网络性能监控 cilium metrics list # 节点资源使用率 kubectl top nodes # 组件健康状态 kubectl get cs对于生产环境建议额外配置Cilium的ClusterMesh实现多集群联网Hubble实现网络流量可视化基于eBPF的网络策略增强安全性通过这套方案我们成功在测试环境实现了单集群500节点的稳定运行网络延迟降低60%服务发现效率提升3倍。特别是在频繁扩缩容场景下eBPF方案展现出显著优势。

相关文章:

在Rocky Linux 10.1上,用kubeadm和containerd 2.2.1从零搭建k8s 1.35.0集群(含Cilium网络配置)

在Rocky Linux 10.1上构建Kubernetes 1.35.0生产级集群:从Containerd配置到Cilium网络实战 当企业级应用向云原生架构迁移时,一个稳定高效的Kubernetes集群成为技术栈的核心枢纽。本文将手把手带你在Rocky Linux 10.1上,使用kubeadm工具链和…...

基于PyTorch 2.8与LSTM的时间序列预测:从算法理论到代码实现

基于PyTorch 2.8与LSTM的时间序列预测:从算法理论到代码实现 1. LSTM时间序列预测效果惊艳展示 长短期记忆网络(LSTM)作为循环神经网络的明星变体,在时间序列预测领域展现出惊人的建模能力。最近我们在PyTorch 2.8环境下进行了一系列实验,结…...

金融行情API对接指南:WebSocket实时订阅外汇/期货/数字货币(附代码示例)

引言在量化交易或金融看盘软件开发中,获取低延迟的实时行情(Tick级数据)是核心环节。传统的HTTP轮询不仅效率低,且容易触发风控。目前主流方案是采用WebSocket协议实现全双工通信,服务端主动推送,极大降低资…...

OpenClaw多模型对比:千问3.5-9B与本地LLaMA混搭方案

OpenClaw多模型对比:千问3.5-9B与本地LLaMA混搭方案 1. 为什么需要多模型混搭 去年冬天的一个深夜,我正用OpenClaw自动处理一批数据清洗任务。当脚本运行到第三个文件时,突然收到短信提醒——当月API调用费用已超预算。查看日志才发现&…...

Vue3前端项目集成指南:调用Qwen3-14B-AWQ模型API实现智能交互

Vue3前端项目集成指南:调用Qwen3-14B-AWQ模型API实现智能交互 1. 前言:为什么要在Vue3中集成大模型API 最近几年,大语言模型在各类应用中的集成变得越来越普遍。作为前端开发者,我们经常需要将这些强大的AI能力整合到自己的项目…...

查看Ubuntu的版本

执行命令 cat /etc/issue 可以查看Ubuntu的版本,例如:...

从训练到推理全链路断电不丢数据,AI研发团队必须掌握的4类异构备份策略,

第一章:AI原生软件研发容灾备份策略设计 2026奇点智能技术大会(https://ml-summit.org) AI原生软件具备模型权重、训练流水线、推理服务、向量数据库与动态提示工程等多模态状态,其容灾备份不能简单套用传统应用的冷备/热备范式,而需构建语义…...

为什么你的Copilot总写错接口参数?根源在缺失“契约优先”的文档生成范式——3步迁移至OpenAPI-First AI协作模式

第一章:AI原生软件研发文档自动化生成方案 2026奇点智能技术大会(https://ml-summit.org) 在AI原生软件开发范式下,代码与文档的边界持续消融。高质量、实时同步的技术文档不再作为后期交付物,而应成为代码演进过程中的自然副产品。本方案聚…...

【技术前沿】大模型驱动的无损数据压缩:突破传统极限的新范式

1. 大模型如何重新定义数据压缩的极限 十年前我第一次接触数据压缩技术时,被那些复杂的数学公式和编码规则搞得晕头转向。当时使用的还是基于香农信息论的传统方法,虽然效果不错,但总觉得遇到了某种看不见的天花板。直到最近看到LMCompress这…...

告别数据混乱:Smartbi智分析中‘找不到数据’和‘应用数据替换’难题一站式解决

告别数据混乱:Smartbi智分析中‘找不到数据’和‘应用数据替换’难题一站式解决 当你第一次将精心整理的数据导入Smartbi智分析平台,却发现数据"消失"在系统中;或是从应用商店安装了漂亮的报表模板,却不知如何将自己的数…...

别再谈OKR了!SITS2026重磅发布《AI原生团队动力学模型》:用3个动态参数替代KPI,实测交付周期压缩41%

第一章:SITS2026演讲:AI原生研发的文化变革 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026主会场,来自全球37家头部科技企业的工程负责人共同指出:AI原生研发已不再仅是工具链升级,而是一场以“人机协同决…...

硬盘分区数据彻底清除工具|支持多算法覆写擦除,确保文件销毁不可恢复

温馨提示:文末有联系方式工具核心功能说明 本工具专为硬盘分区级数据安全销毁设计,可对用户指定的整个磁盘分区执行底层覆盖式擦除,确保所有原始数据(包括已删除文件残留、系统临时文件、隐藏扇区数据等)被完全覆盖并失…...

点云深度学习系列博客(六): 从注意力到三维感知——Point Transformer的架构演进与实战解析

1. 从NLP到三维视觉:注意力机制的跨界之旅 第一次看到Transformer在点云上跑通实验结果时,我正对着屏幕上的3D分割结果发呆——那些精确到毫米级的物体边界,完全颠覆了我对传统点云处理方法的认知。这要归功于注意力机制的神奇迁移能力&#…...

祝贺电影《日掛中天》荣获2026亚洲艺术电影节两项提名

祝贺电影《日掛中天》荣获2026亚洲艺术电影节两项提名 。 祝贺演员辛芷蕾 提名最佳女主角; 祝贺演员冯绍峰 提名最佳男配角。#亚洲艺术电影节#AAFF2026#电影节#辛芷蕾#冯绍峰#电影日掛中天...

SamloaderKotlin 完全指南:跨平台三星固件下载工具的免费终极解决方案

SamloaderKotlin 完全指南:跨平台三星固件下载工具的免费终极解决方案 【免费下载链接】SamloaderKotlin 项目地址: https://gitcode.com/gh_mirrors/sa/SamloaderKotlin 你是否曾经为了下载三星官方固件而四处寻找工具?是否厌倦了那些复杂的命令…...

【仅限首批参会者获取】:2026奇点大会AI原生审查沙箱环境访问权(含金融/医疗双领域合规审查模板)

第一章:2026奇点智能技术大会:AI原生代码审查 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,“AI原生代码审查”不再作为辅助工具存在,而是深度嵌入软件开发生命周期的每个环节——从提交前的本地预检…...

一篇SCI论文从投稿到接收的全过程复盘:以Pattern Recognition Letters为例

SCI论文投稿全流程实战指南:以Pattern Recognition Letters为例 第一次投稿SCI期刊的经历,就像在迷雾中摸索前行——每个状态变更都牵动神经,每次邮件提醒都让人心跳加速。作为计算机视觉领域的老牌期刊,Pattern Recognition Lett…...

宝塔面板7.7.0免费解锁专业版监控报表插件(附详细操作步骤)

宝塔面板7.7.0专业版监控报表插件深度解锁指南 在网站运维领域,数据可视化与实时监控已成为高效管理的标配。宝塔面板作为国内最受欢迎的服务器管理工具之一,其专业版的网站监控报表插件能提供精准的访问分析、蜘蛛抓取记录和流量统计功能。对于预算有限…...

Windows大数据开发环境搭建完整指南:使用winutils解决Hadoop兼容性问题

Windows大数据开发环境搭建完整指南:使用winutils解决Hadoop兼容性问题 【免费下载链接】winutils Windows binaries for Hadoop versions (built from the git commit ID used for the ASF relase) 项目地址: https://gitcode.com/gh_mirrors/wi/winutils 对…...

如何关闭Data Guard保护模式_降级为Max Performance以恢复主库读写

必须先确认保护模式和数据库角色,仅MAXIMUM AVAILABILITY或MAXIMUM PROTECTION需降级;执行前须停同步、确保主库OPEN且备库无MRP进程;降级后若仍不可写,需排查STANDBY_FILE_MANAGEMENT、归档目标状态及FORCE LOGGING等隐含依赖。确…...

1163 Dijkstra Sequence

思路&#xff1a;1.先建图2.然后对每一种序列都处理一次&#xff0c;然后看看这个序列到起点的距离是不是逐渐递增的#include<bits/stdc.h> using namespace std; const int N 1e5 10; int h[N],e[2 * N],w[2 * N],ne[2 * N],idx; int xu[N]; bool st[N];; typedef pai…...

7-Zip-JBinding:如何在Java中轻松使用7-Zip的强大压缩功能?

7-Zip-JBinding&#xff1a;如何在Java中轻松使用7-Zip的强大压缩功能&#xff1f; 【免费下载链接】sevenzipjbinding 7-Zip-JBinding 项目地址: https://gitcode.com/gh_mirrors/se/sevenzipjbinding 7-Zip-JBinding是一个免费、跨平台的Java库&#xff0c;它让Java开…...

Python 批量导出数据库数据至 Excel 文件分

简介 langchain专门用于构建LLM大语言模型&#xff0c;其中提供了大量的prompt模板&#xff0c;和组件&#xff0c;通过chain(链)的方式将流程连接起来&#xff0c;操作简单&#xff0c;开发便捷。 环境配置 安装langchain框架 pip install langchain langchain-community 其中…...

OpenCode问题解决:常见安装配置错误与快速排查方法

OpenCode问题解决&#xff1a;常见安装配置错误与快速排查方法 1. 引言 OpenCode作为一款开源的AI编程助手框架&#xff0c;凭借其终端优先、多模型支持和隐私安全等特性&#xff0c;已经成为开发者社区的热门工具。然而在实际安装和使用过程中&#xff0c;不少开发者会遇到各…...

intv_ai_mk11在金融投教中的应用:专业术语解释与投资建议生成案例

intv_ai_mk11在金融投教中的应用&#xff1a;专业术语解释与投资建议生成案例 1. 金融投教场景的痛点分析 在金融投资教育领域&#xff0c;普通投资者常常面临两大核心挑战&#xff1a; 专业术语理解障碍&#xff1a;金融领域充斥着大量专业词汇和复杂概念&#xff0c;如&quo…...

充电桩怎么选?内行人才知道的选购逻辑,一次讲透

很多车主装充电桩时都踩过坑&#xff1a;买了装不了、功率不匹配、信号不好用、安全不放心…… 其实充电桩怎么选有非常清晰的专业逻辑&#xff0c;只要掌握正确思路&#xff0c;就能一步选对&#xff0c;不花冤枉钱。今天从实用角度&#xff0c;把家用充电桩的选购要点讲透彻。…...

别再只盯着代码覆盖率了!VCS功能覆盖率实战:从covergroup定义到交叉覆盖率的避坑指南

别再只盯着代码覆盖率了&#xff01;VCS功能覆盖率实战&#xff1a;从covergroup定义到交叉覆盖率的避坑指南 在芯片验证领域&#xff0c;我们常常陷入一个误区&#xff1a;将代码覆盖率视为验证完备性的唯一标准。然而&#xff0c;一个残酷的事实是——即使代码覆盖率高达100%…...

Visio中高效导出无白边SVG矢量图的完整指南

1. 为什么需要无白边SVG矢量图&#xff1f; 写论文或者做演示文稿时&#xff0c;经常需要在文档中插入各种图表。Visio作为一款专业的绘图工具&#xff0c;能够帮助我们快速创建流程图、架构图等专业图形。但直接将Visio图形导出为SVG格式时&#xff0c;往往会发现图片周围有大…...

UL4200A是美国针对纽扣电池安全标准

UL 4200A-2023 是美国针对含纽扣 / 硬币电池消费品的强制性安全标准&#xff08;16 CFR 1263&#xff09;&#xff0c;核心是防儿童开启 防误吞&#xff0c;2024 年 3 月 19 日起美国市场强制合规。一、标准核心信息全称&#xff1a;ANSI/UL 4200A-2023《含纽扣 / 硬币电池消费…...

【AI原生研发协作黄金法则】:20年架构师亲授跨团队对齐的7大断点与3步闭环落地法

第一章&#xff1a;AI原生研发协作范式的本质跃迁 2026奇点智能技术大会(https://ml-summit.org) 传统软件工程依赖人工编写、评审与测试的线性协作链&#xff0c;而AI原生研发将模型能力深度嵌入研发全生命周期——从需求理解、代码生成、单元测试到部署验证&#xff0c;均由…...