当前位置: 首页 > news >正文

趋势洞察|AI 能否带动裸金属 K8s 强势崛起?

随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架构与优劣势、适用场景和实际性能表现。而随着 AI 等高性能计算场景的兴起,基于物理机的容器平台逐渐成为这些场景下更具性能优势的选择。未来基于物理机的 Kubernetes 环境是否会成为主流?企业用户需要从虚拟化环境过渡到物理机环境吗?如何确定新 Kubernetes 集群的部署环境?......以下,我们将结合分析机构报告,简要分析企业用户的容器使用与部署趋势,解读“物理机跑容器”在 AI 应用、VMware 替代等背景下具备的优势及其面临的挑战,为用户的容器平台建设提供更多参考思路。

* 往期“虚拟化 vs. 裸金属”系列文章中,“裸金属”主要表示基于物理机构建 Kubernetes 集群的方式。下文中提到的“裸金属”同理。

现状:在虚拟机中部署 Kubernetes 集群仍是主流选择 

目前,在私有云中使用 Kubernetes,大部分用户还是倾向于选择虚拟机作为主要部署环境。根据 Spectro Cloud《2024 State of Production Kubernetes》报告,近一半受访用户的 Kubernetes 集群部署在超过 4 种环境里,其中构建私有云数据中心的用户,85% 都将 Kubernetes 部署在虚拟化环境,采用物理机的仅有 31%。这一选择主要有两个方面的原因。

图源:2024 State of Production Kubernetes,Spectro Cloud

1.技术层面 

虚拟化技术发展成熟,在资源效率、弹性扩展和安全隔离方面能更好地支持容器化应用系统,非常适合需要快速部署和灵活伸缩 Kubernetes 集群(如开发测试)、需要为“多租户”提供各自的 Kubernetes 运行环境、以及需要在有限资源内同时支持虚拟化和容器化应用的场景。欲深入了解,请阅读:适合在虚拟化环境中部署 Kubernetes 的三个场景。

另外,一些基于虚拟化的容器管理产品,如 SMTX Kubernetes 服务(SKS),也针对虚拟化层性能开销进行了优化,使得虚拟化环境中的 Kubernetes 集群在支持无状态应用和有状态应用时,性能能够达到物理机环境中的 80%- 90%,满足大部分常规业务场景对于性能方面的需求(见下图)。欲深入了解测试情况,请阅读:性能评测|虚拟化和裸金属 K8s 哪个性能更好?

 

2.环境层面

根据 Gartner《如何采用云原生技术加速数字化转型》报告,2022 年仅有不到 30% 的中国大型企业建立了云原生平台,这一比例预计在 2027 年达到 70%。目前大部分国内用户的应用容器化改造还没有步入“深水区”,容器平台以支持开发测试环境和生产环境的一般应用系统为主(如管理类业务系统、互联网类应用系统、办公类应用系统)。这些场景对于 IT 基础设施的性能要求不是很高,更关注资源与应用的敏捷交付能力,因此更适合在虚拟化环境中运行。

未来:AI、VMware 替代、降本增效等趋势或加速物理机 Kubernetes 的采用

虽然现阶段 Kubernetes 的部署环境以虚拟化为主,不少分析机构和用户还是很看好物理机 Kubernetes 的发展前景。上文提到的 Spectro Cloud 报告指出,物理机 Kubernetes 集群在受访用户中的采用率已从 2023 年的 25% 增长至 2024 年的 31%。这一增长趋势主要归功于 AI、边缘计算等新兴技术的迅猛发展,以及 VMware 被收购后越来越多用户产生的“成本焦虑”。

AI 应用场景更适合以物理机作为 Kubernetes 部署环境

国内 TWT 平台发起的“容器+裸金属物理机是未来大模型基础架构的应用趋势吗?”投票中,有 83% 的参与者认同“(容器+裸金属物理机)是未来的大模型基础架构的应用趋势”。我们在《虚拟化 vs. 裸金属:K8s 部署环境架构与特性对比》和《适合在虚拟化环境中部署 Kubernetes 的三个场景》文章中也提到,基于物理机部署 Kubernetes 不存在虚拟化层的性能开销,对 GPU 的支持能力也在一定程度上优于虚拟化,还能避免虚拟化、环境带来的”noisy neighbors“的问题,满足更严格的数据合规要求,因此更适合支持高性能计算 (HPC)、大数据处理和分析、AI/ML、实时流处理、在线游戏/VR 等消耗大量资源的应用场景。

一些边缘应用需要在数据源头进行实时处理和分析(如智能监控、自动驾驶、工业物联网等),或者对 I/O 延迟极为敏感,也适合采用物理机作为 Kubernetes 的部署环境。Gartner 在《Hype Cycle for Container Technology, 2024》报告中建议:“在最初尝试边缘计算时,可以将容器部署在超融合架构(HCI)上,这样容器能够与 VM 一起运行和管理,发挥各自的优势。不过在一些边缘站点的场景下,去掉虚拟化层(如将容器直接部署在物理机上)可能会更加简单、资源使用更高效。”

VMware 使用成本增加,“回归物理机”能够降本增效?

另外,VMware 替代、“降本增效”等外部因素,也让一些用户考虑回归“物理机环境“。VMware 被博通收购后全面转向订阅制并精简产品线,Gartner 在《The CIO’s Guide to Broadcom’s Acquisition of VMware》的调研显示,不少用户都对 VMware 转型后的订阅成本、品牌声誉和产品质量表达了担忧,因此寻求 VMware 的替代方案。其中,以“容器平台”作为转型方案,不仅能实现 VMware 替代,还可同时升级 IT 基础架构,满足未来敏捷交付的业务需求。而在构建容器平台时,对于一些已经完成应用容器化改造的用户来说,基于既有物理机直接部署 Kubernetes,可以免去虚拟化平台的采购成本,降低短期内建设成本和转型难度,因此成为一种可行的“去 VMware”技术方案。

不过,如果单纯想要“节约成本”而采用物理机作为 Kubernetes 的部署环境,这一思路还需要用户结合实际情况进一步考量——使用物理机 Kubernetes 集群虽然能够免除虚拟化授权的开销,但长期使用需要的资源投入可能会远多于虚拟化环境,包括硬件资源(机器、机房、机架)、软件资源(操作系统、自动化运维工具)、运维人力资源等。尤其是在满足安全合规要求的背景下,物理机节点需要定期进行操作系统和软件升级,随着集群和应用规模的增长,管理难度将呈指数级上升。

因此,如果没有 AI 等高性能应用场景的“刚需”,采用物理机部署 Kubernetes 并不一定能够通过“降本”体现“增效”。我们在下表也总结了各种需求下更适合 Kubernetes 的部署方式,可以看到,除了 AI、利旧既有物理机、业务合规等场景,基于物理机部署 Kubernetes 的优势并没有虚拟化明显,这也是为什么 Garner 在《Market Guide for Server Virtualization》报告里提到,物理机 Kubernetes 在未来可能得到更为广泛的采用,但现阶段实际落地的增速较为缓慢。

挑战:多种容器基础设施的混合使用与统一管理

除了物理机 Kubernetes 集群自身的管理难题,多种容器基础设施的混合使用也将为 IT 运维人员的日常工作带来新的挑战——由于虚拟化和物理机适用的容器应用场景有所不同,用户可能需要同时管理基于虚拟机和物理机部署的 Kubernetes 集群以满足不同的应用需求;这两类集群往往部署在不同的硬件产品上(包含不同型号、不同代或不同性能的 CPU/GPU 服务器),使用各自的管理运维管理工具,要求运维人员掌握两套环境的运维技能,问题定位、故障排查也会更为复杂,大大增加了运维负担。此外,基于虚拟机和物理机的 Kubernetes 集群也很难实现资源的统一调度,资源利用率低,很多容器厂商也未对虚拟机及其使用的分布式存储进行合理配置和优化,影响 Kubernetes 集群性能和稳定性。

除了容器环境,由于很多传统应用系统依旧需要在虚拟化或传统物理机环境中运行,未来企业数据中心可能需要运维人员同时管理传统物理机、虚拟化/超融合、基于虚拟化部署的容器集群、物理机容器集群等多种 IT 基础设施。例如,目前一些大型金融机构,倾向于将对于性能、延迟和稳定性要求严格的关键业务系统部署在虚拟化/超融合架构上,数据库部署在性能更高的专业超融合/物理机环境,开发测试和部分周边应用系统部署在虚拟机容器平台上,而 AI 探索类应用系统(如保险行业的保单文字识别)则部署在物理机容器上。

多种 IT 基础架构不仅需要多套底层硬件设备,还难以实现数据的互联互通与资源的统一调度,对部署、运维以及业务的快速发展都有较大的挑战。根据 Portworx《The Voice of Kubernetes Experts Report 2024》的调研,超过 70% 的用户都希望能够使用一款统一管理虚拟机和容器,甚至是能够统一管理所有数据服务的 IT 基础设施平台,来降低运维负担并提升应用开发效率。

SKS 1.3:统一管理虚拟机和物理机 Kubernetes 集群,构建虚拟化容器融合基础设施

为了帮助用户应对多种 IT 基础架构带来的管理与业务挑战,志凌海纳 SmartX 近期发布了生产级容器管理与服务产品 SMTX Kubernetes 服务(简称 SKS)1.3 版本,新增了物理机 Kubernetes 集群支持能力,用户可基于一套超融合基础设施实现虚拟机集群、虚拟机 Kubernetes 集群与物理机 Kubernetes 集群的统一管理,满足多种应用系统对于基础设施资源(包括虚拟化、存储、网络等)的不同需求。

在容器部署方面,用户可按需选择部署虚拟机集群和物理机集群,并通过 CloudTower 平台统一管理。例如,以虚拟化 Kubernetes 集群支持周边生产、管理类应用系统,对于 AI 探索类应用系统则以物理机 Kubernetes 集群提供更强的算力。SKS 也支持在不同的底层硬件架构上构建 Kubernetes 集群,支持服务器利旧与硬件资源的整合,帮助用户提高容器环境的资源利用率、降低整体建设与运维成本。

此外,搭配 SmartX 软件定义的网络与安全软件 Everoute,用户可以一套融合架构为虚拟机和容器环境提供统一的支持,实现基础设施资源整合与统一管理、虚拟化容器网络互联互通、应用资源高效统一交付。欲深入了解,请阅读:如何轻松统管虚拟化和容器环境?一文了解 SmartX 虚拟化容器融合基础设施。

整套方案优势

  • 简化架构:一套超融合基础设施即可满足多种应用系统的运行环境需求,支持按需扩容,灵活应对未来创新业务场景与部署运维挑战。
  • 降低运维难度:使用简单易懂的图形化界面统一管理虚拟机集群、虚拟机 Kubernetes 集群和物理机 Kubernetes 集群。
  • 提升资源利用率:计算与存储资源可统一调度,同时为应用提供企业级分布式块存储与文件存储服务。
  • 节约成本:支持利旧既有物理机,支持异构集群统一管理,减少硬件部署数量,降低建设与扩展成本。

更多容器技术趋势与管理建议,欢迎点击下方链接,下载《IT 基础架构团队的 Kubernetes 管理:从入门到评估》电子书。

《IT 基础架构团队的 Kubernetes 管理:从入门到评估》icon-default.png?t=O83Ahttps://mobile.smartx.com/p/bc688

相关文章:

趋势洞察|AI 能否带动裸金属 K8s 强势崛起?

随着容器技术的不断成熟,不少企业在开展私有化容器平台建设时,首要考虑的问题就是容器的部署环境——是采用虚拟机还是物理机运行容器?在往期“虚拟化 vs. 裸金属*”系列文章中,我们分别对比了容器部署在虚拟化平台和物理机上的架…...

idea初始化设置

下载idea: https://www.jetbrains.com/idea/ 安装idea 安装插件: Rainbow BracketsLombokMybatisXSonarLintMaven HelperCodeGeeX(国内AI插件可用) 设置idea注释模板: 设置代码注释模板: https://blo…...

LINUX系统编程之——环境变量

目录 环境变量 1、基本概念 2、查看环境变量的方法 三、查看PATH环境变量的內容 1)不带路径也能运行的自己的程序 a、将自己的程序直接添加到PATH指定的路径下 b、将程序所在的路径添加到PATH环境中 四、环境变量与本地变量 1、本地变量创建 2、环境变量创…...

健康老龄化:适合老年人的播客

什么是播客 什么是播客?好问题。对于那些还不熟悉这个术语的人来说,播客有点像在线广播或电视节目。这是一个可下载、可流式传输的程序,定期发布剧集,时长从几分钟到一个多小时不等。您可以在计算机、智能手机或平板电脑上…...

家庭智慧工程师:如何通过科技提升家居生活质量

在今天的数字化时代,家居生活已经不再只是简单的“住”的地方。随着物联网(IoT)、人工智能(AI)以及自动化技术的快速发展,越来越多的家庭开始拥抱智慧家居技术,将他们的家变得更加智能化、便捷和…...

Milvus概念

非结构化数据、嵌入和 Milvus 非结构化数据(如文本、图像、音频)格式多样,蕴含丰富的语义信息,使其分析变得复杂。为了管理这种复杂性,嵌入技术被用来将非结构化数据转换为数值向量,这些向量能够捕捉数据的…...

为什么调用 setState 而不是直接改变 state

在React中,调用setState方法而不是直接改变state的原因涉及多个方面,包括性能优化、状态管理的可预测性、React的设计理念等。以下是对这些原因的详细解释: 1. 性能优化 异步更新与批量处理:setState是异步执行的,Rea…...

【Python爬虫五十个小案例】爬取豆瓣电影Top250

博客主页:小馒头学python 本文专栏: Python爬虫五十个小案例 专栏简介:分享五十个Python爬虫小案例 🪲前言 在这篇博客中,我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求,…...

cocos creator 3.8 物理碰撞器Collider+刚体RigidBody 8

遇到一个朋友,你来就行的朋友,我过去了,管吃管住,这样的朋友真的很难求。 最近离职了,很难想象,一份策划书一天能给你改n次,一周能郁闷,上一个功能没搞完,让你搞下一个功…...

Python爬取豆瓣电影全部分类数据并存入数据库

在当今数字化的时代,网络上丰富的影视资源信息吸引着众多开发者去挖掘和利用。今天,我就来和大家分享一段有趣的代码,它能够从豆瓣电影平台获取相关数据并存储到数据库中哦。 结果展示(文末附完整代码): 目…...

算法模板1:排序+二分+高精度+前缀+差分

文章目录 1.1 排序STL sort函数快速排序算法模板归并排序算法模板 1.2 二分整数二分算法模板浮点数二分算法模板 1.3 高精度高精度加法高精度减法高精度乘低精度高精度除以低精度 1.4 前缀和与差分**一维前缀和****二维前缀和****一维差分****二维差分** 之前整理了好多算法模板…...

SpringBoot实现单文件上传

一、在springBoot项目中的pom.xml添加依赖。 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency> 二、在资源目录下的static目录下中创建一个upload.html的表单文件…...

rust中解决DPI-1047: Cannot locate a 64-bit Oracle Client library问题

我们在使用rust-oracle crate连接oracle进行测试的过程中&#xff0c;会发现无法连接oracle&#xff0c;测试运行过程中抛出“DPI-1047: Cannot locate a 64-bit Oracle Client library”错误。该问题是由于rust-oracle需要用到oracle的动态连接库&#xff0c;我们通过安装orac…...

YOLOv11(Ultralytics)视频选定区域目标统计计数及跟踪

在计算机视觉的众多应用场景中&#xff0c;对特定区域的目标进行检测、跟踪与计数是一个常见且重要的需求。无论是在智慧交通中统计通过特定路口的车辆数量&#xff0c;还是在零售分析中追踪进入特定区域的顾客行为&#xff0c;这一功能都发挥着不可或缺的作用。 随着深度学习…...

24小时自动监控,自动录制直播蓝光视频!支持抖音等热门直播软件

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 工具特点📒📝 使用🎈 获取方式 🎈⚓️ 相关链接 ⚓️📖 介绍 📖 对于许多直播爱好者和内容创作者而言,错过心爱的直播或难以搜集视频素材始终是一个难题。今天,给大家分享的这款工具可以轻松解决这个问题,它拥有…...

InfiniBand(IB)快速上手

什么是IB&#xff1a; InfiniBand&#xff08;直译为“无限带宽”技术&#xff0c;缩写为IB&#xff09;是一个用于高性能计算的计算机网络通信标准&#xff0c;它具有极高的吞吐量和极低的延迟&#xff0c;用于计算机与计算机之间的数据互连。InfiniBand也用作服务器与存储系…...

D74【 python 接口自动化学习】- python 基础之HTTP

day74 http基础定义 学习日期&#xff1a;20241120 学习目标&#xff1a;http定义及实战 -- http基础介绍 学习笔记&#xff1a; HTTP定义 HTTP 是一个协议&#xff08;服务器传输超文本到浏览器的传送协议&#xff09;&#xff0c;是基于 TCP/IP 通信协议来传递数据&…...

移动光猫[HS8545M5-10]获取超密

移动光猫[HS8545M5-10]获取超级密码 1、缘由2、前期准备2.1、确保本地开通telnet客户端功能2.2、准备好相关软件 3、开始查找超密 1、缘由 最近想折腾一下ipv6ddns打通内外网&#xff0c;查询资料说是需要将光猫桥接到外网&#xff1b;但是使用光猫后边的用户名密码根本就找不到…...

原生JS和CSS,HTML实现开屏弹窗

开屏弹窗常应用于打开游戏&#xff0c;或者打开网站的时候&#xff0c;跳出来在正中间&#xff0c;来显示一些信息&#xff0c;并可以设置今日不再显示 CSS代码如下 <style>#box {width: 100vw;height: 100vh;background-color: rgba(0, 0, 0, 0.2);position: relative…...

vue--制作购物车

&#x1f914;如何制作出下列效果呢&#xff1f;&#x1f447; &#x1f636;‍&#x1f32b;️首先: 设置css样式&#xff1a; <style>body {font-family: Arial, sans-serif;}.cart-item {width: 50%;margin-bottom: 15px;padding: 10px;border: 2px solid gray;borde…...

大话软工笔记—需求分析概述

需求分析&#xff0c;就是要对需求调研收集到的资料信息逐个地进行拆分、研究&#xff0c;从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。 需求分析的作用非常重要&#xff0c;后续设计的依据主要来自于需求分析的成果&#xff0c;包括: 项目的目的…...

镜像里切换为普通用户

如果你登录远程虚拟机默认就是 root 用户&#xff0c;但你不希望用 root 权限运行 ns-3&#xff08;这是对的&#xff0c;ns3 工具会拒绝 root&#xff09;&#xff0c;你可以按以下方法创建一个 非 root 用户账号 并切换到它运行 ns-3。 一次性解决方案&#xff1a;创建非 roo…...

PL0语法,分析器实现!

简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...

相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)

【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库&#xff0c;专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性&#xff0c;并提供了一个通用的框架&…...

LeetCode - 199. 二叉树的右视图

题目 199. 二叉树的右视图 - 力扣&#xff08;LeetCode&#xff09; 思路 右视图是指从树的右侧看&#xff0c;对于每一层&#xff0c;只能看到该层最右边的节点。实现思路是&#xff1a; 使用深度优先搜索(DFS)按照"根-右-左"的顺序遍历树记录每个节点的深度对于…...

基于Springboot+Vue的办公管理系统

角色&#xff1a; 管理员、员工 技术&#xff1a; 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能&#xff1a; 该办公管理系统是一个综合性的企业内部管理平台&#xff0c;旨在提升企业运营效率和员工管理水…...

Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)

引言 在人工智能飞速发展的今天&#xff0c;大语言模型&#xff08;Large Language Models, LLMs&#xff09;已成为技术领域的焦点。从智能写作到代码生成&#xff0c;LLM 的应用场景不断扩展&#xff0c;深刻改变了我们的工作和生活方式。然而&#xff0c;理解这些模型的内部…...

Spring AI Chat Memory 实战指南:Local 与 JDBC 存储集成

一个面向 Java 开发者的 Sring-Ai 示例工程项目&#xff0c;该项目是一个 Spring AI 快速入门的样例工程项目&#xff0c;旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。 项目采用模块化设计&#xff0c;每个模块都专注于特定的功能领域&#xff0c;便于学习和…...

Python网页自动化Selenium中文文档

1. 安装 1.1. 安装 Selenium Python bindings 提供了一个简单的API&#xff0c;让你使用Selenium WebDriver来编写功能/校验测试。 通过Selenium Python的API&#xff0c;你可以非常直观的使用Selenium WebDriver的所有功能。 Selenium Python bindings 使用非常简洁方便的A…...