趋势洞察|AI 能否带动裸金属 K8s 强势崛起?
随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架构与优劣势、适用场景和实际性能表现。而随着 AI 等高性能计算场景的兴起,基于物理机的容器平台逐渐成为这些场景下更具性能优势的选择。未来基于物理机的 Kubernetes 环境是否会成为主流?企业用户需要从虚拟化环境过渡到物理机环境吗?如何确定新 Kubernetes 集群的部署环境?......以下,我们将结合分析机构报告,简要分析企业用户的容器使用与部署趋势,解读“物理机跑容器”在 AI 应用、VMware 替代等背景下具备的优势及其面临的挑战,为用户的容器平台建设提供更多参考思路。
* 往期“虚拟化 vs. 裸金属”系列文章中,“裸金属”主要表示基于物理机构建 Kubernetes 集群的方式。下文中提到的“裸金属”同理。
现状:在虚拟机中部署 Kubernetes 集群仍是主流选择
目前,在私有云中使用 Kubernetes,大部分用户还是倾向于选择虚拟机作为主要部署环境。根据 Spectro Cloud《2024 State of Production Kubernetes》报告,近一半受访用户的 Kubernetes 集群部署在超过 4 种环境里,其中构建私有云数据中心的用户,85% 都将 Kubernetes 部署在虚拟化环境,采用物理机的仅有 31%。这一选择主要有两个方面的原因。
1.技术层面
虚拟化技术发展成熟,在资源效率、弹性扩展和安全隔离方面能更好地支持容器化应用系统,非常适合需要快速部署和灵活伸缩 Kubernetes 集群(如开发测试)、需要为“多租户”提供各自的 Kubernetes 运行环境、以及需要在有限资源内同时支持虚拟化和容器化应用的场景。欲深入了解,请阅读:适合在虚拟化环境中部署 Kubernetes 的三个场景。
另外,一些基于虚拟化的容器管理产品,如 SMTX Kubernetes 服务(SKS),也针对虚拟化层性能开销进行了优化,使得虚拟化环境中的 Kubernetes 集群在支持无状态应用和有状态应用时,性能能够达到物理机环境中的 80%- 90%,满足大部分常规业务场景对于性能方面的需求(见下图)。欲深入了解测试情况,请阅读:性能评测|虚拟化和裸金属 K8s 哪个性能更好?
2.环境层面
根据 Gartner《如何采用云原生技术加速数字化转型》报告,2022 年仅有不到 30% 的中国大型企业建立了云原生平台,这一比例预计在 2027 年达到 70%。目前大部分国内用户的应用容器化改造还没有步入“深水区”,容器平台以支持开发测试环境和生产环境的一般应用系统为主(如管理类业务系统、互联网类应用系统、办公类应用系统)。这些场景对于 IT 基础设施的性能要求不是很高,更关注资源与应用的敏捷交付能力,因此更适合在虚拟化环境中运行。
未来:AI、VMware 替代、降本增效等趋势或加速物理机 Kubernetes 的采用
虽然现阶段 Kubernetes 的部署环境以虚拟化为主,不少分析机构和用户还是很看好物理机 Kubernetes 的发展前景。上文提到的 Spectro Cloud 报告指出,物理机 Kubernetes 集群在受访用户中的采用率已从 2023 年的 25% 增长至 2024 年的 31%。这一增长趋势主要归功于 AI、边缘计算等新兴技术的迅猛发展,以及 VMware 被收购后越来越多用户产生的“成本焦虑”。
AI 应用场景更适合以物理机作为 Kubernetes 部署环境
国内 TWT 平台发起的“容器+裸金属物理机是未来大模型基础架构的应用趋势吗?”投票中,有 83% 的参与者认同“(容器+裸金属物理机)是未来的大模型基础架构的应用趋势”。我们在《虚拟化 vs. 裸金属:K8s 部署环境架构与特性对比》和《适合在虚拟化环境中部署 Kubernetes 的三个场景》文章中也提到,基于物理机部署 Kubernetes 不存在虚拟化层的性能开销,对 GPU 的支持能力也在一定程度上优于虚拟化,还能避免虚拟化、环境带来的”noisy neighbors“的问题,满足更严格的数据合规要求,因此更适合支持高性能计算 (HPC)、大数据处理和分析、AI/ML、实时流处理、在线游戏/VR 等消耗大量资源的应用场景。
一些边缘应用需要在数据源头进行实时处理和分析(如智能监控、自动驾驶、工业物联网等),或者对 I/O 延迟极为敏感,也适合采用物理机作为 Kubernetes 的部署环境。Gartner 在《Hype Cycle for Container Technology, 2024》报告中建议:“在最初尝试边缘计算时,可以将容器部署在超融合架构(HCI)上,这样容器能够与 VM 一起运行和管理,发挥各自的优势。不过在一些边缘站点的场景下,去掉虚拟化层(如将容器直接部署在物理机上)可能会更加简单、资源使用更高效。”
VMware 使用成本增加,“回归物理机”能够降本增效?
另外,VMware 替代、“降本增效”等外部因素,也让一些用户考虑回归“物理机环境“。VMware 被博通收购后全面转向订阅制并精简产品线,Gartner 在《The CIO’s Guide to Broadcom’s Acquisition of VMware》的调研显示,不少用户都对 VMware 转型后的订阅成本、品牌声誉和产品质量表达了担忧,因此寻求 VMware 的替代方案。其中,以“容器平台”作为转型方案,不仅能实现 VMware 替代,还可同时升级 IT 基础架构,满足未来敏捷交付的业务需求。而在构建容器平台时,对于一些已经完成应用容器化改造的用户来说,基于既有物理机直接部署 Kubernetes,可以免去虚拟化平台的采购成本,降低短期内建设成本和转型难度,因此成为一种可行的“去 VMware”技术方案。
不过,如果单纯想要“节约成本”而采用物理机作为 Kubernetes 的部署环境,这一思路还需要用户结合实际情况进一步考量——使用物理机 Kubernetes 集群虽然能够免除虚拟化授权的开销,但长期使用需要的资源投入可能会远多于虚拟化环境,包括硬件资源(机器、机房、机架)、软件资源(操作系统、自动化运维工具)、运维人力资源等。尤其是在满足安全合规要求的背景下,物理机节点需要定期进行操作系统和软件升级,随着集群和应用规模的增长,管理难度将呈指数级上升。
因此,如果没有 AI 等高性能应用场景的“刚需”,采用物理机部署 Kubernetes 并不一定能够通过“降本”体现“增效”。我们在下表也总结了各种需求下更适合 Kubernetes 的部署方式,可以看到,除了 AI、利旧既有物理机、业务合规等场景,基于物理机部署 Kubernetes 的优势并没有虚拟化明显,这也是为什么 Garner 在《Market Guide for Server Virtualization》报告里提到,物理机 Kubernetes 在未来可能得到更为广泛的采用,但现阶段实际落地的增速较为缓慢。

挑战:多种容器基础设施的混合使用与统一管理
除了物理机 Kubernetes 集群自身的管理难题,多种容器基础设施的混合使用也将为 IT 运维人员的日常工作带来新的挑战——由于虚拟化和物理机适用的容器应用场景有所不同,用户可能需要同时管理基于虚拟机和物理机部署的 Kubernetes 集群以满足不同的应用需求;这两类集群往往部署在不同的硬件产品上(包含不同型号、不同代或不同性能的 CPU/GPU 服务器),使用各自的管理运维管理工具,要求运维人员掌握两套环境的运维技能,问题定位、故障排查也会更为复杂,大大增加了运维负担。此外,基于虚拟机和物理机的 Kubernetes 集群也很难实现资源的统一调度,资源利用率低,很多容器厂商也未对虚拟机及其使用的分布式存储进行合理配置和优化,影响 Kubernetes 集群性能和稳定性。
除了容器环境,由于很多传统应用系统依旧需要在虚拟化或传统物理机环境中运行,未来企业数据中心可能需要运维人员同时管理传统物理机、虚拟化/超融合、基于虚拟化部署的容器集群、物理机容器集群等多种 IT 基础设施。例如,目前一些大型金融机构,倾向于将对于性能、延迟和稳定性要求严格的关键业务系统部署在虚拟化/超融合架构上,数据库部署在性能更高的专业超融合/物理机环境,开发测试和部分周边应用系统部署在虚拟机容器平台上,而 AI 探索类应用系统(如保险行业的保单文字识别)则部署在物理机容器上。

多种 IT 基础架构不仅需要多套底层硬件设备,还难以实现数据的互联互通与资源的统一调度,对部署、运维以及业务的快速发展都有较大的挑战。根据 Portworx《The Voice of Kubernetes Experts Report 2024》的调研,超过 70% 的用户都希望能够使用一款统一管理虚拟机和容器,甚至是能够统一管理所有数据服务的 IT 基础设施平台,来降低运维负担并提升应用开发效率。
SKS 1.3:统一管理虚拟机和物理机 Kubernetes 集群,构建虚拟化容器融合基础设施
为了帮助用户应对多种 IT 基础架构带来的管理与业务挑战,志凌海纳 SmartX 近期发布了生产级容器管理与服务产品 SMTX Kubernetes 服务(简称 SKS)1.3 版本,新增了物理机 Kubernetes 集群支持能力,用户可基于一套超融合基础设施实现虚拟机集群、虚拟机 Kubernetes 集群与物理机 Kubernetes 集群的统一管理,满足多种应用系统对于基础设施资源(包括虚拟化、存储、网络等)的不同需求。

在容器部署方面,用户可按需选择部署虚拟机集群和物理机集群,并通过 CloudTower 平台统一管理。例如,以虚拟化 Kubernetes 集群支持周边生产、管理类应用系统,对于 AI 探索类应用系统则以物理机 Kubernetes 集群提供更强的算力。SKS 也支持在不同的底层硬件架构上构建 Kubernetes 集群,支持服务器利旧与硬件资源的整合,帮助用户提高容器环境的资源利用率、降低整体建设与运维成本。
此外,搭配 SmartX 软件定义的网络与安全软件 Everoute,用户可以一套融合架构为虚拟机和容器环境提供统一的支持,实现基础设施资源整合与统一管理、虚拟化容器网络互联互通、应用资源高效统一交付。欲深入了解,请阅读:如何轻松统管虚拟化和容器环境?一文了解 SmartX 虚拟化容器融合基础设施。
整套方案优势
- 简化架构:一套超融合基础设施即可满足多种应用系统的运行环境需求,支持按需扩容,灵活应对未来创新业务场景与部署运维挑战。
- 降低运维难度:使用简单易懂的图形化界面统一管理虚拟机集群、虚拟机 Kubernetes 集群和物理机 Kubernetes 集群。
- 提升资源利用率:计算与存储资源可统一调度,同时为应用提供企业级分布式块存储与文件存储服务。
- 节约成本:支持利旧既有物理机,支持异构集群统一管理,减少硬件部署数量,降低建设与扩展成本。
更多容器技术趋势与管理建议,欢迎点击下方链接,下载《IT 基础架构团队的 Kubernetes 管理:从入门到评估》电子书。
《IT 基础架构团队的 Kubernetes 管理:从入门到评估》
https://mobile.smartx.com/p/bc688
相关文章:
趋势洞察|AI 能否带动裸金属 K8s 强势崛起?
随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架…...
idea初始化设置
下载idea: https://www.jetbrains.com/idea/ 安装idea 安装插件: Rainbow BracketsLombokMybatisXSonarLintMaven HelperCodeGeeX(国内AI插件可用) 设置idea注释模板: 设置代码注释模板: https://blo…...
LINUX系统编程之——环境变量
目录 环境变量 1、基本概念 2、查看环境变量的方法 三、查看PATH环境变量的內容 1)不带路径也能运行的自己的程序 a、将自己的程序直接添加到PATH指定的路径下 b、将程序所在的路径添加到PATH环境中 四、环境变量与本地变量 1、本地变量创建 2、环境变量创…...
健康老龄化:适合老年人的播客
什么是播客 什么是播客?好问题。对于那些还不熟悉这个术语的人来说,播客有点像在线广播或电视节目。这是一个可下载、可流式传输的程序,定期发布剧集,时长从几分钟到一个多小时不等。您可以在计算机、智能手机或平板电脑上…...
家庭智慧工程师:如何通过科技提升家居生活质量
在今天的数字化时代,家居生活已经不再只是简单的“住”的地方。随着物联网(IoT)、人工智能(AI)以及自动化技术的快速发展,越来越多的家庭开始拥抱智慧家居技术,将他们的家变得更加智能化、便捷和…...
Milvus概念
非结构化数据、嵌入和 Milvus 非结构化数据(如文本、图像、音频)格式多样,蕴含丰富的语义信息,使其分析变得复杂。为了管理这种复杂性,嵌入技术被用来将非结构化数据转换为数值向量,这些向量能够捕捉数据的…...
为什么调用 setState 而不是直接改变 state
在React中,调用setState方法而不是直接改变state的原因涉及多个方面,包括性能优化、状态管理的可预测性、React的设计理念等。以下是对这些原因的详细解释: 1. 性能优化 异步更新与批量处理:setState是异步执行的,Rea…...
【Python爬虫五十个小案例】爬取豆瓣电影Top250
博客主页:小馒头学python 本文专栏: Python爬虫五十个小案例 专栏简介:分享五十个Python爬虫小案例 🪲前言 在这篇博客中,我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求,…...
cocos creator 3.8 物理碰撞器Collider+刚体RigidBody 8
遇到一个朋友,你来就行的朋友,我过去了,管吃管住,这样的朋友真的很难求。 最近离职了,很难想象,一份策划书一天能给你改n次,一周能郁闷,上一个功能没搞完,让你搞下一个功…...
Python爬取豆瓣电影全部分类数据并存入数据库
在当今数字化的时代,网络上丰富的影视资源信息吸引着众多开发者去挖掘和利用。今天,我就来和大家分享一段有趣的代码,它能够从豆瓣电影平台获取相关数据并存储到数据库中哦。 结果展示(文末附完整代码): 目…...
算法模板1:排序+二分+高精度+前缀+差分
文章目录 1.1 排序STL sort函数快速排序算法模板归并排序算法模板 1.2 二分整数二分算法模板浮点数二分算法模板 1.3 高精度高精度加法高精度减法高精度乘低精度高精度除以低精度 1.4 前缀和与差分**一维前缀和****二维前缀和****一维差分****二维差分** 之前整理了好多算法模板…...
SpringBoot实现单文件上传
一、在springBoot项目中的pom.xml添加依赖。 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency> 二、在资源目录下的static目录下中创建一个upload.html的表单文件…...
rust中解决DPI-1047: Cannot locate a 64-bit Oracle Client library问题
我们在使用rust-oracle crate连接oracle进行测试的过程中,会发现无法连接oracle,测试运行过程中抛出“DPI-1047: Cannot locate a 64-bit Oracle Client library”错误。该问题是由于rust-oracle需要用到oracle的动态连接库,我们通过安装orac…...
YOLOv11(Ultralytics)视频选定区域目标统计计数及跟踪
在计算机视觉的众多应用场景中,对特定区域的目标进行检测、跟踪与计数是一个常见且重要的需求。无论是在智慧交通中统计通过特定路口的车辆数量,还是在零售分析中追踪进入特定区域的顾客行为,这一功能都发挥着不可或缺的作用。 随着深度学习…...
24小时自动监控,自动录制直播蓝光视频!支持抖音等热门直播软件
文章目录 📖 介绍 📖🏡 演示环境 🏡📒 工具特点📒📝 使用🎈 获取方式 🎈⚓️ 相关链接 ⚓️📖 介绍 📖 对于许多直播爱好者和内容创作者而言,错过心爱的直播或难以搜集视频素材始终是一个难题。今天,给大家分享的这款工具可以轻松解决这个问题,它拥有…...
InfiniBand(IB)快速上手
什么是IB: InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,它具有极高的吞吐量和极低的延迟,用于计算机与计算机之间的数据互连。InfiniBand也用作服务器与存储系…...
D74【 python 接口自动化学习】- python 基础之HTTP
day74 http基础定义 学习日期:20241120 学习目标:http定义及实战 -- http基础介绍 学习笔记: HTTP定义 HTTP 是一个协议(服务器传输超文本到浏览器的传送协议),是基于 TCP/IP 通信协议来传递数据&…...
移动光猫[HS8545M5-10]获取超密
移动光猫[HS8545M5-10]获取超级密码 1、缘由2、前期准备2.1、确保本地开通telnet客户端功能2.2、准备好相关软件 3、开始查找超密 1、缘由 最近想折腾一下ipv6ddns打通内外网,查询资料说是需要将光猫桥接到外网;但是使用光猫后边的用户名密码根本就找不到…...
原生JS和CSS,HTML实现开屏弹窗
开屏弹窗常应用于打开游戏,或者打开网站的时候,跳出来在正中间,来显示一些信息,并可以设置今日不再显示 CSS代码如下 <style>#box {width: 100vw;height: 100vh;background-color: rgba(0, 0, 0, 0.2);position: relative…...
vue--制作购物车
🤔如何制作出下列效果呢?👇 😶🌫️首先: 设置css样式: <style>body {font-family: Arial, sans-serif;}.cart-item {width: 50%;margin-bottom: 15px;padding: 10px;border: 2px solid gray;borde…...
Prompt Tuning、P-Tuning、Prefix Tuning的区别
一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...
三维GIS开发cesium智慧地铁教程(5)Cesium相机控制
一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点: 路径验证:确保相对路径.…...
java 实现excel文件转pdf | 无水印 | 无限制
文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...
九天毕昇深度学习平台 | 如何安装库?
pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子: 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...
Spring是如何解决Bean的循环依赖:三级缓存机制
1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间互相持有对方引用,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...
sshd代码修改banner
sshd服务连接之后会收到字符串: SSH-2.0-OpenSSH_9.5 容易被hacker识别此服务为sshd服务。 是否可以通过修改此banner达到让人无法识别此服务的目的呢? 不能。因为这是写的SSH的协议中的。 也就是协议规定了banner必须这么写。 SSH- 开头,…...
02.运算符
目录 什么是运算符 算术运算符 1.基本四则运算符 2.增量运算符 3.自增/自减运算符 关系运算符 逻辑运算符 &&:逻辑与 ||:逻辑或 !:逻辑非 短路求值 位运算符 按位与&: 按位或 | 按位取反~ …...
CppCon 2015 学习:Time Programming Fundamentals
Civil Time 公历时间 特点: 共 6 个字段: Year(年)Month(月)Day(日)Hour(小时)Minute(分钟)Second(秒) 表示…...
iOS 项目怎么构建稳定性保障机制?一次系统性防错经验分享(含 KeyMob 工具应用)
崩溃、内存飙升、后台任务未释放、页面卡顿、日志丢失——稳定性问题,不一定会立刻崩,但一旦积累,就是“上线后救不回来的代价”。 稳定性保障不是某个工具的功能,而是一套贯穿开发、测试、上线全流程的“观测分析防范”机制。 …...
VASP软件在第一性原理计算中的应用-测试GO
VASP软件在第一性原理计算中的应用 VASP是由维也纳大学Hafner小组开发的一款功能强大的第一性原理计算软件,广泛应用于材料科学、凝聚态物理、化学和纳米技术等领域。 VASP的核心功能与应用 1. 电子结构计算 VASP最突出的功能是进行高精度的电子结构计算ÿ…...
