公共云遣返的经济性

在过去的几年里,显而易见的是,尽管公有云具有所有优势,但它并不能大规模地节省成本。它在一定程度上提高了生产力,但不会降低您的成本。公有云的好处在于,它提供了一个非常强大的价值主张,即基础设施可以立即使用,而且规模恰到好处,从而提高了运营和经济效率。云还有助于培养创新,因为公司资源被释放出来,可以专注于新产品和增长。但是,仅仅与数据交互的行为就会产生出口成本,这已被证明是极其掠夺性的。当应用程序和工作负载是持久的、一致的和数据密集型的(高容量/速度/各种读写调用)或涉及高性能分析时尤其如此 - 随着它们的增长,它们在公共云中是不可持续的。
“…随着云计算行业经验的成熟,我们看到了云生命周期对公司经济状况的更全面了解,越来越明显的是,虽然云计算在公司发展的早期就明确兑现了承诺,但随着公司规模的扩大和增长的放缓,它对利润率的压力可能会开始超过收益。 安德森-霍洛维茨,2021 年这一观点虽然非常有先见之明,但却是在 2021 年拍摄的。到 2024 年,数据有所增长(根据 2022 年的 IDC 研究,平均每年 ~20%),工作负载变得更大,规模已成为问题。不是扩展技术,而是在公共云中扩展的成本。根据 David Linthicum 的说法,公共云被“踢到路边”的主要原因有 3 个:
成本 - 对于某些工作负载,在云中运行它们的成本太高。在过去的几年里,商品硬件价格已经下跌,硬件不再像以前那样巨大的资本支出。
失败的迁移 - 未以最佳方式重构或调整为云原生的工作负载最终成本是最初预计成本的 ~2.5 倍。事实证明,本地低效的应用程序在云中效率低下。让它们更有效率的成本太高,最终不值得。
需求减少 - 最初需要快速高效启动并能够扩展的应用程序已经在云中扩展,但现在只是一台重复性任务和数据存储的机器。这些应用程序不再受益于云可以提供的快速可扩展性,现在只是使用大量昂贵的存储。不再需要灵活、快速扩展的模型。硬件的商品化为运行这些工作负载提供了一种新的、经济高效的方式。根据巴克莱最近对首席信息官的调查,许多首席信息官都同意这一点。
来自同一篇 a2z 文章——
“2017年,Dropbox在其S-1中详细说明了在IPO前两年的累计节省,这要归功于其基础设施优化大修,其中大部分需要从公共云中转移工作负载。
当您的云成本开始徘徊在收入成本的 50% 或更多(如 Asana、Datadog、Prerender.io 等)左右时,是时候开始查看您的工作负载在公有云中执行了哪些操作。组织和业务领导层需要意识到这一点,以便他们能够进行调整。某些工作负载(例如运行数据分析多维数据集、内存中数据库或数据分析群集)更适合本地基础结构。但这些只是几个例子。
为了关注将受到此规模问题影响的特定趋势,让我们看一下 AI/ML,特别是 LLMs (大型语言模型)。如果您当前的 AI 计划需要构建自己的LLM模型或基础模型,请考虑在公有云中执行此操作的缺点:
1 . 规模成本高 - 大规模培训和运行LLMs成本高昂,而且随着LLM规模越来越大,公有云的成本也在增加
2 . 失去控制 - 您对实施、基础架构和性能的控制和可见性较低
3 . 供应商锁定 - 如果您在一个云平台上接受过培训LLMs,则很难移植到其他平台。此外,仅依赖单一云提供商会带来固有风险,尤其是在政策和价格波动方面。
4 . 数据隐私和安全 - 我还要在这里提到数据主权。最重要的是,您将数据信任给服务器遍布全球的提供商。
如果您的企业正在处理 PB 级或趋向于这种规模,那么私有云的经济优势更大。是的,这意味着建设基础设施(或从像 Equinix 这样的公司租赁),包括房地产、硬件、电力/冷却,但经济效益仍然非常有利。公有云是学习云原生方式和访问云原生应用程序组合的绝佳场所,但它并不是一个扩展的绝佳场所。
经济学的一个例子
那么,什么是经济学呢?为了说明这一点,让我们以一个 10PB 的现代数据湖为例,该数据湖使用 Kubernetes 来管理 Apache Spark 和 Dremio,以实现持久且一致的分析工作负载。这些类型的工作负载需要频繁地从对象存储读取和写入数据,以进行分析、更新和刷新以及显示。从成本结构的角度来看,我们将对主要成本动因使用一些假设:
-
如果我们不能使用数据,这些数据湖和工作负载的效用就会受到限制。这些数据提供见解,为其他应用程序提供服务,并且可能需要在存储环境之外进行处理。这需要将数据从存储中传输出来。如果我们假设每月访问500TB,则仅占每月访问数据的5%。
-
对于数据/对象请求(PUT、GET、HEAD 等),我们与具有类似一致和持久性工作负载的客户合作,这些客户每月看到超过 10b 个对象请求。因此,我们可以使用 10b 作为此类工作负载的保守假设。
-
同样,这些客户看到这些对象的加密请求数量大致相同,因此在我们的示例中再次使用 10b 作为保守假设。
有了这些假设,公有云的成本可能如下所示:
| COST DRIVER | ANNUAL COST |
|---|---|
| STORAGE (STANDARD, NO TIERING, NO DISCOUNT) | $2.6M ($0.022/GB/MO) |
| Data Transfer/Egress | $354k |
| Object Requests | $648k |
| Object Encryption | $3.6m |
| Support (5%) | $130k |
10PB 的年度公有云成本 = $7.3m 或 $0.061/GB/月
上面的假设就是这样,有这么多的事实告诉你,根据特定的使用情况和工作负载因素,成本的可变性有多大。这给尝试预算带来了重大挑战。此外,没有分层或任何数据生命周期活动的情况也很少见,因为如果数据变得不那么“活跃”,组织通常会将数据移动到较冷的层。但所有这些都只会增加成本,因为不同的层每月每 GB 的价格不同,以及自动将对象移动到这些层的成本。
MinIO 允许您使用与公有云相同的技术在私有云(colo 或数据中心)上进行扩展:S3 API 兼容对象存储、密集计算、高速网络、Kubernetes、容器和微服务。一个主要区别是对象请求(GET、PUT等)没有成本,只要基础设施支持,请求数量也没有任何限制。此外,MinIO Enterprise 和 Community 版本中包含加密功能,并且对请求的加密对象数量没有限制。
这种可选性提供了运营成本、灵活性和控制的理想组合。诚然,您将承担硬件的资本支出,但通过从小处着手并利用关键的云经验教训(弹性、按组件扩展、将计算与存储分离),企业可以最大限度地减少初始支出并最大限度地节省运营成本。
当与商用硬件配对并在 colo 或专有数据中心运行时,MinIO 可以将这些公共云成本(以及与管理这些云成本相关的成本)降低 50% - 70%,在某些情况下甚至更高。
| Cost Driver | Public Cloud Annual Cost | MinIO Annual Cost |
|---|---|---|
| Storage | $2.6m (Standard, No Tiering, No Discount) | $1.3M MinIO Enterprise License(10PB Usable Capacity) |
| Data Transfer/Egress | $354k | $0 |
| Object Requests | $648k | $0 |
| Object Encryption | $3.6m | $0 |
| Support (5%) | $130k | $0 |
| Commodity Hardware | n/a | $200k (All NVMe storage, 10PB @$0.10/GB)$1.0M amortized over 5 years |
| Colo Costs | n/a | $200k (interconnect, rack, power, maint.,etc.) |
10PB 的年度 Colo/MinIO 成本 = 每年 1.7 美元,或每 GB/月 0.014 美元
与公有云相比,这相当于 10PB 存储的存储成本降低了 ~77%。即使对于较小的存储容量需求(200TB - 2PB),节省的成本也值得探索。更不用说您可以获得业界最佳的存储性能、用于存储桶级安全性的内置防火墙、专为对象存储设计的可观测性,以及许多其他增值功能,这些功能在公有云中会花费您额外的费用。

资源因素
另一个值得快速分析的因素是资源(人类)。我们从客户那里听说,管理公有云基础设施所需的资源数量可能在 5-10 个 FTE 之间,具体取决于云基础设施的规模。这包括云工程师、云团队负责人、DevOps 工程师和云项目经理。 使用 Glassdoor 的工资范围和中位数,这些 FTE 成本的范围从每年 70 万美元到 1.5 美元不等,满载而归。
我们还从我们的客户那里(在最近的一项调查中,76%)那里了解到,MinIO的关键价值驱动因素之一是其易用性和可管理性。同一项调查发现,其中 60% 的人提到了 MinIO 提高运营效率的能力。
在内部,我们将 MinIO 用于许多不同的工作负载、存储需求、测试等,我们估计 MinIO 可以由 1 个 FTE - 3 个 FTE 管理 PB+ 基础设施。这允许以最少的资源大规模构建大规模基础设施。
开始
既然您已经了解了私有云的经济效益如何以及为什么起作用,我相信您想知道沿着这条道路开始的步骤是什么。我的同事们已经在这里和这里写过关于这个问题的文章,我建议你的云团队和DevOps团队查看这些博客,了解从公共云迁移的细节。
我们已经看到数十家客户使用商用硬件和他们自己的数据中心或 colo 遣返他们的数据,并从 MinIO 的高性能、简单的对象存储解决方案中实现了一些真正的节省和收益。
如上所述,通过将数据遣返到数据中心或托管服务中自己的硬件中,企业可以实现显著的成本节约,超过其现有隐含年度公有云 S3 账单的 50%。在上述情况下,只需 10PB,您的企业可以在未来五年内节省约 650 万美元。
事情的真相是,公共云在规模上成本过高。公有云固有的弹性使得在那里扩展看起来很有吸引力,但从经济角度来看,这几乎总是错误的选择。对于像 AI/ML 这样的数据密集型任务尤其如此,在这些任务中,公有云的成本和失控可能非常可观。随着数据规模的扩大,采用 MinIO 的私有云解决方案在经济上变得更胜一筹,以更低的成本提供同等(可以说是更好)的技术。通过利用商用硬件和私有云基础设施,与公有云相比,公司可以显著节省成本并实现性能优势,有时高达 70%。我们建议您探索从公有云迁移到您的工作负载,并使用 MinIO 实现关键业务应用程序的现代化和扩展。
相关文章:
公共云遣返的经济性
在过去的几年里,显而易见的是,尽管公有云具有所有优势,但它并不能大规模地节省成本。它在一定程度上提高了生产力,但不会降低您的成本。公有云的好处在于,它提供了一个非常强大的价值主张,即基础设施可以立…...
夏季河湖防溺水新举措:EasyCVR+AI视频智能监控系统保障水域安全
近日一则新闻引起大众关注,有网友发布视频称,假期在逛西湖时,发现水面上“平躺”漂浮着一名游客在等待救援。在事发3分钟内,沿湖救生员成功将落水游客救到了岸边。 随着夏季的到来,雨水增多,各危险水域水位…...
2024年最新【交安】公路水运安全员备考题库。
46.( )负责建筑施工企业安全生产许可证的颁发和管理,并接受国务院建设主管部门的指导和监督。 A.国务院建设主管部门 B.国务院安全生产监督管理部门 C.省、自治区、直辖市人民政府建设主管部门 D.省、自治区、直辖市人民政府安全生产监督管理部门 答案&…...
Excel 宏录制与VBA编程 —— 16、InputBox函数的使用方式
Input函数基本操作 InputBox函数的Type参数使用技巧(输入类型限制,若输入类型不符系统提示) 关注 笔者 - jxd...
【ai】tx2 nx : yolov4加入initLibNvInferPlugins构建
先说结果:make 成功 插件头文件 复制一份: /** Copyright 1993-2021 NVIDIA Corporation. All rights reserved.** NOTICE TO LICENSEE:** This source code and/or documentation ("Licensed Deliverables") are* subject to NVIDIA intellectual property right…...
【Proteus仿真】【Arduino单片机】基于物联网新能源电动车检测系统设计
文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器,使用LCD1602液晶显示模块、WIFI模块、蜂鸣器、LED按键、ADC、DS18B20温度传感器等。 主要功能: 系统运行后,LCD1602显示温…...
MobaXterm破解专业版方法
MobaXterm专业版(含授权)-CSDN博客 1.安装python3环境,使用vscode打开文件夹,新建终端,在终端中执行命令 python MobaXterm-Keygen.py "DoubleSine" 20.2 (20.2为MobaXterm版本号,…...
0基础学JMeter:如何开始简单的WEB压力测试(一)
背景 最近工作上被安排针对Web网站进行性能压测,以评估特定的硬件配置下Web网站可支持的并发用户数。考虑到JMeter是流行的Web性能压测工具,因此趁着这次机会上网查阅了很多关于JMeter的资料,也自己动手进行软件的配置和调测,从最…...
ArcGIS数据处理与制图
在数字化和智能化的浪潮中,GIS(地理信息系统)和GPT(生成式预训练模型)的结合正日益成为推动科研、城市规划、环境监测等领域发展的关键技术。GIS以其强大的空间数据处理、先进的空间分析工具、灵活的地图制作与可视化能…...
基于Java微信小程序校园订餐系统设计和实现(源码+LW+调试文档+讲解等)
💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来,还…...
基于文件的本地数据库组件 DuckDB, ChDB, SQLite, LevelDB, RocksDB
OLTP 与 OLAP 的区别: OLTP(on-line transaction processing) 联机事务处理,主要就是一些传统的数据库,比如 Mysql。OLAP(On-Line Analytical Processing) 联机分析处理,主要应用在大数据分析处理领域,比如 Clickhous…...
日志记录功能
需求描述: 1,可记录页面操作模块、按钮的日志记录 2,记录详细的指定操作数据日志 3,记录的数据可能需要查询表 4,需要考虑到扩展性及个性化定制 表结构设计: CREATE TABLE YES_DEV.T_COMM_OPERATION_LOG (ID BINARY_BIGINT NOT NULL,OPERATOR VARCHAR(128),OPERATION_MO…...
Android中的多线程与线程池详解
Android中的多线程与线程池详解 一、技术难点 在Android开发中,多线程和线程池是处理复杂任务、提高应用性能和响应性的关键技术。然而,这些技术也带来了一些技术难点。 1. 多线程技术难点 线程同步:多线程环境下,数据访问的同…...
使用LangChain+Ollama自己做的一个和大语言模型聊天的网站支持上下文对话,学习记录。
0.引言 在自己学习的过程中可以自己做一个和聊天大模型对话的一个小网站,成就感不亚于人生第一次跑完10km。 1.项目介绍 前端代码:Vue3, MarkDownIT. 后端代码:Python3, Fernet库, OpenAPI, LangChain, Ollama. Ollama 本地模型的部署和管理…...
excel数据透视
Excel中,数据透视图(PivotChart)和数据透视表(PivotTable)是两个紧密相关的工具,用于分析数据。数据透视表是数据透视图的数据源,也就是说,数据透视图是基于数据透视表中的数据创建的…...
七、(正点原子)Linux并发与竞争
Linux是多任务操作系统,肯定会存在多个任务共同操作同一段内存或者设备的情况,多个任务甚至中断都能访问的资源叫做共享资源。在驱动开发中要注意对共享资源的保护,也就是要处理对共享资源的并发访问。 一、并发与竞争 1、简介 并发就是多个…...
vue2+TS,el-table表格单选的写法
1.打开表格 //父组件引入 <customerChoose ref"customerChooseRef" onSure"setOrderInfoFn"></customerChoose>//子传父,接收值,操作private async setOrderInfoFn(data) {this.form.customerId data.idthis.form.cu…...
北邮《计算机网络》蒋老师思考题及答案-传输层
蒋yj老师yyds! 答案自制,仅供参考,欢迎质疑讨论 问题一览 传输层思考题P2P和E2E的区别使用socket的c/s模式通信,流控如何反映到编程模型三次握手解决什么问题举一个两次握手失败的例子为什么链路层是两次握手而非三次?…...
学懂C#编程:常用高级技术【元组的详细使用】——利用元组获取多个返回值
C#常用高级技术——利用元组获取多个返回值 在C# 7.0及更高版本中,您可以使用元组(Tuples)来实现这种返回多个值的方法。您提供的代码片段是正确的,它定义了一个名为Calculate的方法,该方法接受两个整数参数a和b&#…...
解决IDEA使用卡顿的问题,设置JVM内存大小和清理缓存
解决IntelliJ IDEA中卡顿问题,可以尝试以下几个常见且有效的步骤: 1 增加IDEA的JVM内存分配: 位于IDEA安装目录的bin文件夹下,找到对应的操作系统配置文件(idea64.exe.vmoptions(Windows)或id…...
调用支付宝接口响应40004 SYSTEM_ERROR问题排查
在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...
Xshell远程连接Kali(默认 | 私钥)Note版
前言:xshell远程连接,私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...
C++ Visual Studio 2017厂商给的源码没有.sln文件 易兆微芯片下载工具加开机动画下载。
1.先用Visual Studio 2017打开Yichip YC31xx loader.vcxproj,再用Visual Studio 2022打开。再保侟就有.sln文件了。 易兆微芯片下载工具加开机动画下载 ExtraDownloadFile1Info.\logo.bin|0|0|10D2000|0 MFC应用兼容CMD 在BOOL CYichipYC31xxloaderDlg::OnIni…...
Spring是如何解决Bean的循环依赖:三级缓存机制
1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间互相持有对方引用,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...
LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》
这段 Python 代码是一个完整的 知识库数据库操作模块,用于对本地知识库系统中的知识库进行增删改查(CRUD)操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述 该模块…...
嵌入式学习之系统编程(九)OSI模型、TCP/IP模型、UDP协议网络相关编程(6.3)
目录 一、网络编程--OSI模型 二、网络编程--TCP/IP模型 三、网络接口 四、UDP网络相关编程及主要函数 编辑编辑 UDP的特征 socke函数 bind函数 recvfrom函数(接收函数) sendto函数(发送函数) 五、网络编程之 UDP 用…...
使用SSE解决获取状态不一致问题
使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述 目前做的一个功能是上传多个文件,这个上传文件是整体功能的一部分,文件在上传的过程中…...
EasyRTC音视频实时通话功能在WebRTC与智能硬件整合中的应用与优势
一、WebRTC与智能硬件整合趋势 随着物联网和实时通信需求的爆发式增长,WebRTC作为开源实时通信技术,为浏览器与移动应用提供免插件的音视频通信能力,在智能硬件领域的融合应用已成必然趋势。智能硬件不再局限于单一功能,对实时…...
Python 解释器安装全攻略(适用于 Linux / Windows / macOS)
目录 一、Windows安装Python解释器1.1 下载并安装Python解释1.2 测试安装是否成功1.3 设置pip的国内镜像------永久配置 二、macOS安装Python解释器三、Linux下安装Python解释器3.1 Rocky8.10/Rocky9.5安装Python解释器3.2 Ubuntu2204/Ubuntu2404安装Python解释器3.3 设置pip的…...
n8n:解锁自动化工作流的无限可能
在当今快节奏的数字时代,无论是企业还是个人,都渴望提高工作效率,减少重复性任务的繁琐操作。而 n8n,这个强大的开源自动化工具,就像一位智能的数字助手,悄然走进了许多人的工作和生活,成为提升…...
