趋势洞察|AI 能否带动裸金属 K8s 强势崛起?
随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架构与优劣势、适用场景和实际性能表现。而随着 AI 等高性能计算场景的兴起,基于物理机的容器平台逐渐成为这些场景下更具性能优势的选择。未来基于物理机的 Kubernetes 环境是否会成为主流?企业用户需要从虚拟化环境过渡到物理机环境吗?如何确定新 Kubernetes 集群的部署环境?......以下,我们将结合分析机构报告,简要分析企业用户的容器使用与部署趋势,解读“物理机跑容器”在 AI 应用、VMware 替代等背景下具备的优势及其面临的挑战,为用户的容器平台建设提供更多参考思路。
* 往期“虚拟化 vs. 裸金属”系列文章中,“裸金属”主要表示基于物理机构建 Kubernetes 集群的方式。下文中提到的“裸金属”同理。
现状:在虚拟机中部署 Kubernetes 集群仍是主流选择
目前,在私有云中使用 Kubernetes,大部分用户还是倾向于选择虚拟机作为主要部署环境。根据 Spectro Cloud《2024 State of Production Kubernetes》报告,近一半受访用户的 Kubernetes 集群部署在超过 4 种环境里,其中构建私有云数据中心的用户,85% 都将 Kubernetes 部署在虚拟化环境,采用物理机的仅有 31%。这一选择主要有两个方面的原因。
1.技术层面
虚拟化技术发展成熟,在资源效率、弹性扩展和安全隔离方面能更好地支持容器化应用系统,非常适合需要快速部署和灵活伸缩 Kubernetes 集群(如开发测试)、需要为“多租户”提供各自的 Kubernetes 运行环境、以及需要在有限资源内同时支持虚拟化和容器化应用的场景。欲深入了解,请阅读:适合在虚拟化环境中部署 Kubernetes 的三个场景。
另外,一些基于虚拟化的容器管理产品,如 SMTX Kubernetes 服务(SKS),也针对虚拟化层性能开销进行了优化,使得虚拟化环境中的 Kubernetes 集群在支持无状态应用和有状态应用时,性能能够达到物理机环境中的 80%- 90%,满足大部分常规业务场景对于性能方面的需求(见下图)。欲深入了解测试情况,请阅读:性能评测|虚拟化和裸金属 K8s 哪个性能更好?
2.环境层面
根据 Gartner《如何采用云原生技术加速数字化转型》报告,2022 年仅有不到 30% 的中国大型企业建立了云原生平台,这一比例预计在 2027 年达到 70%。目前大部分国内用户的应用容器化改造还没有步入“深水区”,容器平台以支持开发测试环境和生产环境的一般应用系统为主(如管理类业务系统、互联网类应用系统、办公类应用系统)。这些场景对于 IT 基础设施的性能要求不是很高,更关注资源与应用的敏捷交付能力,因此更适合在虚拟化环境中运行。
未来:AI、VMware 替代、降本增效等趋势或加速物理机 Kubernetes 的采用
虽然现阶段 Kubernetes 的部署环境以虚拟化为主,不少分析机构和用户还是很看好物理机 Kubernetes 的发展前景。上文提到的 Spectro Cloud 报告指出,物理机 Kubernetes 集群在受访用户中的采用率已从 2023 年的 25% 增长至 2024 年的 31%。这一增长趋势主要归功于 AI、边缘计算等新兴技术的迅猛发展,以及 VMware 被收购后越来越多用户产生的“成本焦虑”。
AI 应用场景更适合以物理机作为 Kubernetes 部署环境
国内 TWT 平台发起的“容器+裸金属物理机是未来大模型基础架构的应用趋势吗?”投票中,有 83% 的参与者认同“(容器+裸金属物理机)是未来的大模型基础架构的应用趋势”。我们在《虚拟化 vs. 裸金属:K8s 部署环境架构与特性对比》和《适合在虚拟化环境中部署 Kubernetes 的三个场景》文章中也提到,基于物理机部署 Kubernetes 不存在虚拟化层的性能开销,对 GPU 的支持能力也在一定程度上优于虚拟化,还能避免虚拟化、环境带来的”noisy neighbors“的问题,满足更严格的数据合规要求,因此更适合支持高性能计算 (HPC)、大数据处理和分析、AI/ML、实时流处理、在线游戏/VR 等消耗大量资源的应用场景。
一些边缘应用需要在数据源头进行实时处理和分析(如智能监控、自动驾驶、工业物联网等),或者对 I/O 延迟极为敏感,也适合采用物理机作为 Kubernetes 的部署环境。Gartner 在《Hype Cycle for Container Technology, 2024》报告中建议:“在最初尝试边缘计算时,可以将容器部署在超融合架构(HCI)上,这样容器能够与 VM 一起运行和管理,发挥各自的优势。不过在一些边缘站点的场景下,去掉虚拟化层(如将容器直接部署在物理机上)可能会更加简单、资源使用更高效。”
VMware 使用成本增加,“回归物理机”能够降本增效?
另外,VMware 替代、“降本增效”等外部因素,也让一些用户考虑回归“物理机环境“。VMware 被博通收购后全面转向订阅制并精简产品线,Gartner 在《The CIO’s Guide to Broadcom’s Acquisition of VMware》的调研显示,不少用户都对 VMware 转型后的订阅成本、品牌声誉和产品质量表达了担忧,因此寻求 VMware 的替代方案。其中,以“容器平台”作为转型方案,不仅能实现 VMware 替代,还可同时升级 IT 基础架构,满足未来敏捷交付的业务需求。而在构建容器平台时,对于一些已经完成应用容器化改造的用户来说,基于既有物理机直接部署 Kubernetes,可以免去虚拟化平台的采购成本,降低短期内建设成本和转型难度,因此成为一种可行的“去 VMware”技术方案。
不过,如果单纯想要“节约成本”而采用物理机作为 Kubernetes 的部署环境,这一思路还需要用户结合实际情况进一步考量——使用物理机 Kubernetes 集群虽然能够免除虚拟化授权的开销,但长期使用需要的资源投入可能会远多于虚拟化环境,包括硬件资源(机器、机房、机架)、软件资源(操作系统、自动化运维工具)、运维人力资源等。尤其是在满足安全合规要求的背景下,物理机节点需要定期进行操作系统和软件升级,随着集群和应用规模的增长,管理难度将呈指数级上升。
因此,如果没有 AI 等高性能应用场景的“刚需”,采用物理机部署 Kubernetes 并不一定能够通过“降本”体现“增效”。我们在下表也总结了各种需求下更适合 Kubernetes 的部署方式,可以看到,除了 AI、利旧既有物理机、业务合规等场景,基于物理机部署 Kubernetes 的优势并没有虚拟化明显,这也是为什么 Garner 在《Market Guide for Server Virtualization》报告里提到,物理机 Kubernetes 在未来可能得到更为广泛的采用,但现阶段实际落地的增速较为缓慢。

挑战:多种容器基础设施的混合使用与统一管理
除了物理机 Kubernetes 集群自身的管理难题,多种容器基础设施的混合使用也将为 IT 运维人员的日常工作带来新的挑战——由于虚拟化和物理机适用的容器应用场景有所不同,用户可能需要同时管理基于虚拟机和物理机部署的 Kubernetes 集群以满足不同的应用需求;这两类集群往往部署在不同的硬件产品上(包含不同型号、不同代或不同性能的 CPU/GPU 服务器),使用各自的管理运维管理工具,要求运维人员掌握两套环境的运维技能,问题定位、故障排查也会更为复杂,大大增加了运维负担。此外,基于虚拟机和物理机的 Kubernetes 集群也很难实现资源的统一调度,资源利用率低,很多容器厂商也未对虚拟机及其使用的分布式存储进行合理配置和优化,影响 Kubernetes 集群性能和稳定性。
除了容器环境,由于很多传统应用系统依旧需要在虚拟化或传统物理机环境中运行,未来企业数据中心可能需要运维人员同时管理传统物理机、虚拟化/超融合、基于虚拟化部署的容器集群、物理机容器集群等多种 IT 基础设施。例如,目前一些大型金融机构,倾向于将对于性能、延迟和稳定性要求严格的关键业务系统部署在虚拟化/超融合架构上,数据库部署在性能更高的专业超融合/物理机环境,开发测试和部分周边应用系统部署在虚拟机容器平台上,而 AI 探索类应用系统(如保险行业的保单文字识别)则部署在物理机容器上。

多种 IT 基础架构不仅需要多套底层硬件设备,还难以实现数据的互联互通与资源的统一调度,对部署、运维以及业务的快速发展都有较大的挑战。根据 Portworx《The Voice of Kubernetes Experts Report 2024》的调研,超过 70% 的用户都希望能够使用一款统一管理虚拟机和容器,甚至是能够统一管理所有数据服务的 IT 基础设施平台,来降低运维负担并提升应用开发效率。
SKS 1.3:统一管理虚拟机和物理机 Kubernetes 集群,构建虚拟化容器融合基础设施
为了帮助用户应对多种 IT 基础架构带来的管理与业务挑战,志凌海纳 SmartX 近期发布了生产级容器管理与服务产品 SMTX Kubernetes 服务(简称 SKS)1.3 版本,新增了物理机 Kubernetes 集群支持能力,用户可基于一套超融合基础设施实现虚拟机集群、虚拟机 Kubernetes 集群与物理机 Kubernetes 集群的统一管理,满足多种应用系统对于基础设施资源(包括虚拟化、存储、网络等)的不同需求。

在容器部署方面,用户可按需选择部署虚拟机集群和物理机集群,并通过 CloudTower 平台统一管理。例如,以虚拟化 Kubernetes 集群支持周边生产、管理类应用系统,对于 AI 探索类应用系统则以物理机 Kubernetes 集群提供更强的算力。SKS 也支持在不同的底层硬件架构上构建 Kubernetes 集群,支持服务器利旧与硬件资源的整合,帮助用户提高容器环境的资源利用率、降低整体建设与运维成本。
此外,搭配 SmartX 软件定义的网络与安全软件 Everoute,用户可以一套融合架构为虚拟机和容器环境提供统一的支持,实现基础设施资源整合与统一管理、虚拟化容器网络互联互通、应用资源高效统一交付。欲深入了解,请阅读:如何轻松统管虚拟化和容器环境?一文了解 SmartX 虚拟化容器融合基础设施。
整套方案优势
- 简化架构:一套超融合基础设施即可满足多种应用系统的运行环境需求,支持按需扩容,灵活应对未来创新业务场景与部署运维挑战。
- 降低运维难度:使用简单易懂的图形化界面统一管理虚拟机集群、虚拟机 Kubernetes 集群和物理机 Kubernetes 集群。
- 提升资源利用率:计算与存储资源可统一调度,同时为应用提供企业级分布式块存储与文件存储服务。
- 节约成本:支持利旧既有物理机,支持异构集群统一管理,减少硬件部署数量,降低建设与扩展成本。
更多容器技术趋势与管理建议,欢迎点击下方链接,下载《IT 基础架构团队的 Kubernetes 管理:从入门到评估》电子书。
《IT 基础架构团队的 Kubernetes 管理:从入门到评估》
https://mobile.smartx.com/p/bc688
相关文章:
趋势洞察|AI 能否带动裸金属 K8s 强势崛起?
随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架…...
idea初始化设置
下载idea: https://www.jetbrains.com/idea/ 安装idea 安装插件: Rainbow BracketsLombokMybatisXSonarLintMaven HelperCodeGeeX(国内AI插件可用) 设置idea注释模板: 设置代码注释模板: https://blo…...
LINUX系统编程之——环境变量
目录 环境变量 1、基本概念 2、查看环境变量的方法 三、查看PATH环境变量的內容 1)不带路径也能运行的自己的程序 a、将自己的程序直接添加到PATH指定的路径下 b、将程序所在的路径添加到PATH环境中 四、环境变量与本地变量 1、本地变量创建 2、环境变量创…...
健康老龄化:适合老年人的播客
什么是播客 什么是播客?好问题。对于那些还不熟悉这个术语的人来说,播客有点像在线广播或电视节目。这是一个可下载、可流式传输的程序,定期发布剧集,时长从几分钟到一个多小时不等。您可以在计算机、智能手机或平板电脑上…...
家庭智慧工程师:如何通过科技提升家居生活质量
在今天的数字化时代,家居生活已经不再只是简单的“住”的地方。随着物联网(IoT)、人工智能(AI)以及自动化技术的快速发展,越来越多的家庭开始拥抱智慧家居技术,将他们的家变得更加智能化、便捷和…...
Milvus概念
非结构化数据、嵌入和 Milvus 非结构化数据(如文本、图像、音频)格式多样,蕴含丰富的语义信息,使其分析变得复杂。为了管理这种复杂性,嵌入技术被用来将非结构化数据转换为数值向量,这些向量能够捕捉数据的…...
为什么调用 setState 而不是直接改变 state
在React中,调用setState方法而不是直接改变state的原因涉及多个方面,包括性能优化、状态管理的可预测性、React的设计理念等。以下是对这些原因的详细解释: 1. 性能优化 异步更新与批量处理:setState是异步执行的,Rea…...
【Python爬虫五十个小案例】爬取豆瓣电影Top250
博客主页:小馒头学python 本文专栏: Python爬虫五十个小案例 专栏简介:分享五十个Python爬虫小案例 🪲前言 在这篇博客中,我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求,…...
cocos creator 3.8 物理碰撞器Collider+刚体RigidBody 8
遇到一个朋友,你来就行的朋友,我过去了,管吃管住,这样的朋友真的很难求。 最近离职了,很难想象,一份策划书一天能给你改n次,一周能郁闷,上一个功能没搞完,让你搞下一个功…...
Python爬取豆瓣电影全部分类数据并存入数据库
在当今数字化的时代,网络上丰富的影视资源信息吸引着众多开发者去挖掘和利用。今天,我就来和大家分享一段有趣的代码,它能够从豆瓣电影平台获取相关数据并存储到数据库中哦。 结果展示(文末附完整代码): 目…...
算法模板1:排序+二分+高精度+前缀+差分
文章目录 1.1 排序STL sort函数快速排序算法模板归并排序算法模板 1.2 二分整数二分算法模板浮点数二分算法模板 1.3 高精度高精度加法高精度减法高精度乘低精度高精度除以低精度 1.4 前缀和与差分**一维前缀和****二维前缀和****一维差分****二维差分** 之前整理了好多算法模板…...
SpringBoot实现单文件上传
一、在springBoot项目中的pom.xml添加依赖。 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency> 二、在资源目录下的static目录下中创建一个upload.html的表单文件…...
rust中解决DPI-1047: Cannot locate a 64-bit Oracle Client library问题
我们在使用rust-oracle crate连接oracle进行测试的过程中,会发现无法连接oracle,测试运行过程中抛出“DPI-1047: Cannot locate a 64-bit Oracle Client library”错误。该问题是由于rust-oracle需要用到oracle的动态连接库,我们通过安装orac…...
YOLOv11(Ultralytics)视频选定区域目标统计计数及跟踪
在计算机视觉的众多应用场景中,对特定区域的目标进行检测、跟踪与计数是一个常见且重要的需求。无论是在智慧交通中统计通过特定路口的车辆数量,还是在零售分析中追踪进入特定区域的顾客行为,这一功能都发挥着不可或缺的作用。 随着深度学习…...
24小时自动监控,自动录制直播蓝光视频!支持抖音等热门直播软件
文章目录 📖 介绍 📖🏡 演示环境 🏡📒 工具特点📒📝 使用🎈 获取方式 🎈⚓️ 相关链接 ⚓️📖 介绍 📖 对于许多直播爱好者和内容创作者而言,错过心爱的直播或难以搜集视频素材始终是一个难题。今天,给大家分享的这款工具可以轻松解决这个问题,它拥有…...
InfiniBand(IB)快速上手
什么是IB: InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,它具有极高的吞吐量和极低的延迟,用于计算机与计算机之间的数据互连。InfiniBand也用作服务器与存储系…...
D74【 python 接口自动化学习】- python 基础之HTTP
day74 http基础定义 学习日期:20241120 学习目标:http定义及实战 -- http基础介绍 学习笔记: HTTP定义 HTTP 是一个协议(服务器传输超文本到浏览器的传送协议),是基于 TCP/IP 通信协议来传递数据&…...
移动光猫[HS8545M5-10]获取超密
移动光猫[HS8545M5-10]获取超级密码 1、缘由2、前期准备2.1、确保本地开通telnet客户端功能2.2、准备好相关软件 3、开始查找超密 1、缘由 最近想折腾一下ipv6ddns打通内外网,查询资料说是需要将光猫桥接到外网;但是使用光猫后边的用户名密码根本就找不到…...
原生JS和CSS,HTML实现开屏弹窗
开屏弹窗常应用于打开游戏,或者打开网站的时候,跳出来在正中间,来显示一些信息,并可以设置今日不再显示 CSS代码如下 <style>#box {width: 100vw;height: 100vh;background-color: rgba(0, 0, 0, 0.2);position: relative…...
vue--制作购物车
🤔如何制作出下列效果呢?👇 😶🌫️首先: 设置css样式: <style>body {font-family: Arial, sans-serif;}.cart-item {width: 50%;margin-bottom: 15px;padding: 10px;border: 2px solid gray;borde…...
量子机器学习单次分类:深度、噪声与电路设计的权衡
1. 量子机器学习单次分类:从理论到噪声现实的深度剖析量子机器学习(QML)这几年挺火的,但真把它从论文里的公式搬到实际的量子芯片上跑,你会发现理想和现实的差距比量子比特的相干时间衰减得还快。其中一个核心痛点&…...
2026告别水印烦恼!免费图片去水印保姆级教程,从微信小程序到手机App一看就会
你是不是也遇到过这种抓狂的时刻?好不容易在小红书、抖音上看到一张绝美的壁纸、一个笑到岔气的表情包,兴致勃勃地保存下来,结果发现画面正中间或角落上,总趴着一个破坏美感的水印。想用来做PPT配图,水印太显眼&#x…...
3个步骤解锁《塞尔达传说:旷野之息》终极存档编辑器
3个步骤解锁《塞尔达传说:旷野之息》终极存档编辑器 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想象一下,当你在海拉鲁大陆冒险时&…...
机器学习势函数评估新范式:从力误差到分子动力学模拟的物理性质验证
1. 项目概述与核心挑战在计算材料科学和凝聚态物理领域,分子动力学模拟是我们理解原子尺度下物质行为不可或缺的“显微镜”。它的核心在于求解牛顿运动方程,而驱动原子运动的力,则完全依赖于描述原子间相互作用的势能面。长久以来,…...
Windows 10/11 上从零搞定 OpenCDA 自动驾驶仿真环境:CARLA 0.9.14 + PyTorch + SUMO 保姆级配置流程
Windows 10/11 上从零搞定 OpenCDA 自动驾驶仿真环境:CARLA 0.9.14 PyTorch SUMO 保姆级配置流程自动驾驶仿真技术正在成为行业研究和开发的重要工具。对于刚接触这一领域的开发者来说,搭建一个完整的仿真环境往往是第一个挑战。本文将带你一步步在Win…...
【Gemini代码生成能力权威评测】:基于2000+真实编码场景的7大维度深度拆解
更多请点击: https://codechina.net 第一章:Gemini代码生成能力评测总览 Google Gemini 系列模型(尤其是 Gemini 1.5 Pro)在多模态理解与代码生成任务中展现出显著的上下文建模能力。本章聚焦其在真实编程场景中的代码生成质量、…...
搭建你的第一个AIGC工作流:基于LangChain实现多步链式调用与条件分支
系列导读 你现在看到的是《从0到1构建AIGC工作流自动化平台:架构、实践与运维全指南》的第 2/10 篇,当前这篇会重点解决:通过一个可运行的最小示例,让读者快速体会工作流的本质,并掌握LangChain基础用法。 上一篇回顾:第 1 篇《AIGC工作流自动化平台技术选型与架构设计…...
AI时代公众号生存指南(ChatGPT自动化运营全链路拆解)
更多请点击: https://codechina.net 第一章:AI时代公众号的生存逻辑与定位重构 在生成式AI深度渗透内容生态的当下,公众号已从“流量分发管道”蜕变为“人机协同的认知接口”。其生存逻辑不再依赖单一的推送频次或标题党技巧,而取…...
【行业首发】DeepSeek V3 MoE稀疏激活机制详解:如何用1/3显存跑满128K上下文?
更多请点击: https://intelliparadigm.com 第一章:DeepSeek V3 MoE稀疏激活机制的行业意义与定位 DeepSeek V3 采用混合专家(Mixture of Experts, MoE)架构,其核心突破在于实现了动态、细粒度的稀疏激活——每次前向传…...
Betaflight 2025.12:从飞行控制器到飞行艺术家——开源飞控系统的架构演进与实践
Betaflight 2025.12:从飞行控制器到飞行艺术家——开源飞控系统的架构演进与实践 【免费下载链接】betaflight Open Source Flight Controller Firmware 项目地址: https://gitcode.com/gh_mirrors/be/betaflight 在无人机技术快速发展的今天,飞行…...
