当前位置: 首页 > article >正文

AI重塑云基础设施,亚马逊云科技打造AI定制版IaaS“样板房”

AI正在彻底重塑云基础设施。

IDC最新《2025年IDC MarketScape:全球公有云基础设施即服务(IaaS)报告》显示,AI正在通过多种方式重塑云基础设施,公有云IaaS有望继续保持快速增长,预计2025年全球IaaS的整体规模将达到1880亿美元。

那么,为什么这一轮的AI浪潮对于云基础设施变革有如此大的影响力?从全球云计算领导者亚马逊云科技的转变便能一窥究竟。IDC认为,亚马逊云科技在可扩展性方面的卓越表现、成熟的开发者社区以及对AI基础设施的积极投入,使其成为需要先进云能力的企业的首选。

AI从四个方面重塑云基础设施

传统云计算以CPU通用计算为核心,满足于各种应用的存储与计算需求。然而,随着AI大模型近年来的迅速崛起,以及智能体(AI Agent)大量涌现,AI对于AI对GPU、NPU等异构算力的依赖远超预期,并且直接驱动着云基础设施走向变革。

IDC在该报告中指出,AI正通过多种方式重塑云基础设施,主要包括四个方面:

其一、AI带来大量的异构算力需求,直接驱动着亚马逊云科技等所有云服务商对GPU、TPU和FPGA等专用硬件进行大量投资;

其二、AI相关技术正在迅速融入云基础设施日常的管理运维之中,由于云服务商的基础设施规模庞大,借助AI技术能够有效改善基础设施的运营效率和成本;

其三、AI正在推动云安全体系的升级,企业需要以AI驱动型安全工具来响应日益复杂的威胁;

其四、云服务商需要利用AI技术来对需求预测,并优化资源分配,推动开发AI驱动的服务与应用等。

与过去相比,云基础设施的确正在产生一系列的变化,AI对于云基础设施的运维、安全等影响尤为重要。那么,在生成式AI带动的这一轮AI浪潮中,AI的训练、推理乃至应用都需要庞大的算力支撑,企业在未来的数字化转型中,应该如何合理的选择基础设施?又应该如何选择合理的云服务商?

对此,IDC在报告中也给出具体建议。IDC认为,重点需要考虑部署决策的原则、AI功能的集成度以及系统可观测性相关的安全性:工作负载部署决策不能仅局限于成本考量,服务集成度、供应商服务的广度,以及对互操作性和开放标准的支持力度,均至关重要;将AI功能集成到云基础设施中也越来越成为一个关键的差异化因素;建议优先选择具备强大开箱即用安全功能,且对系统可观测性有全面方案的供应商。

亚马逊云科技领跑全球IaaS市场

回顾云计算将近二十年的发展历史,基础设施乃云服务商最为核心的竞争力之一,基础设施的覆盖范围与规模、运维管理能力、资源调度分配能力以及对于现代化应用的支持能力直接决定着云服务商提供各类云服务的质量。

作为云计算一哥,亚马逊云科技自成立以来,就极为重视基础设施的建设、迭代和演进,在基础设施覆盖的范围、以及IaaS领域涵盖的核心服务如计算、网络、安全等多个方面进行持续扩展及创新。

进入到AI时代,亚马逊云科技继续引领云基础设施的变革。今年2月份财报会议,亚马逊宣布将在2025年资本投资投入1000亿美元,其中大部分将用于亚马逊云科技AI基础设施的建设等,其金额大幅领先其他竞争对手,足以表明亚马逊云科技对于AI和云基础设施的重视。

在本次IDC报告中,亚马逊云科技也被评为“领导者”,并且在能力和战略的双维度上均为“领导者”。亚马逊云科技在服务范围方面无可匹敌,丰富的服务种类使亚马逊云科技对需要专业能力、混合基础设施或高度可扩展应用程序的企业具有吸引力。当需要最广泛的云服务组合以及经过验证的可扩展性和创新能力时,可以考虑亚马逊云科技。

仔细分析,亚马逊云科技之所以能够领跑全球IaaS市场,关键在于其基础设施的覆盖度、强大的自研芯片能力、领先的网络架构以及高标准的安全体系,从多个方面建立起业界领先的云基础设施。

首先,亚马逊云科技已经建成全球覆盖规模的基础设施遍及36个地理区域的114个可用区,后续还计划在新西兰和沙特阿拉伯等新建4个区域、12个可用区。为支持AI应用对于基础设施带来的种种挑战,亚马逊云科技持续推动数据中心创新,包括简化电气和机械设计,在冷却、机架设计和控制系统进行创新。简化的电力分配和机械系统能够实现高达99.9999%的基础设施可用性,并将可能受到电气问题影响的机架数量减少89%;更新后的冷却系统将无缝集成空气和液体冷却功能,用于支持AI超级计算解决方案,以最低的成本为客户提供最佳性能和效率。由数据和生成式AI驱动的软件能够精确预测服务器最佳部署方式,以最大化电力使用效率等。

其次,亚马逊云科技一直砸加速“自研芯片”的创新。众所周知,随着AI大模型开始进入到各行各业之中,越来越多用户需要包括推理等各类算力。如何高效、便捷、合理成本地为用户提供各种AI算力需求,就成为云服务商接下来重点角逐的领域。

亚马逊云科技的法宝是坚持“自研芯片”,推出多个系列的自研芯片,包括Amazon Nitro系统、通用处理器芯片Amazon Graviton、机器学习训练芯片Amazon Trainium和推理芯片Amazon Inferentia等一系列自研芯片。在训练方面,Amazon EC2 Trn2实例与当前基于GPU的EC2 P5e和P5en实例相比,性价比提升30-40%;单实例配备16个Trainium2芯片,可提供高达20.8 Petaflops浮点算力的性能,非常适合训练和推理高达数十亿参数的大型语言模型。

第三,AI对于计算带来变革,也驱动着网络不断突破。AI 算力如何更加高效地发挥生产价值,仅仅依靠AI芯片的简单堆砌是万万行不通,AI 计算网的重要性也与日俱增,直接决定着整个AI集群的效率。亚马逊云科技在网络集群的创新也堪称业界典范。

亚马逊云科技第二代UltraCluster网络架构,也称为"10p10u"网络,支持超过20,000个GPU协同工作,带宽达10Pb/s,延迟低于10μs(微秒),这一突破性的性能跃迁将模型训练时间缩短至少15%。同时还推出了兼具中央控制和优化及分布式的速度和弹性的SIDR(Scalable,Intent Driven Routing)全新网络路由协议。相比传统的BGP、OSPF等协议,SIDR在亚马逊云科技的10p10u网络中能在不到1秒内恢复网络,速度比传统方法快10倍,显著提升了分布式AI训练中的可靠性和实时性,确保网络在故障发生时也能保持高效运行。10p10u是亚马逊云科技有史以来扩展最快的网络,在2024年,安装了超过300万条链路。

第四,随着生成式AI崛起,安全态势也在发生深刻变化,攻击侧、防守侧乃至监管侧都在积极探索AI在安全领域的应用,甚至衍生出数据、模型和应用等一系列安全挑战。亚马逊云科技认为“安全是设计出来的”,无论是基础设施还是服务,从设计之初就应该将安全作为首要任务,并嵌入到从架构到操作的各个环节,从而为客户提供灵活、安全的云计算环境。

为此,亚马逊云科技采取的思路是在每个区域的基础设施采用同样最高安全标准进行构建和运营,所有用户均可基于同样安全的基础设施进行创新。此外,亚马逊云科技还不断使用创新技术提升基础设施的安全性,例如亚马逊云科技通过自动推理技术实现以可验证的方式提升系统的可观测性,为关键系统按预期运行提供了严格的数学保证。这些经过自动推理验证的基础设施和云服务,不仅能够提高客户云上构建的安全性,还能更快提供更高性能的代码,并最终节约成本。

综合观察,几年前有人认为云计算正在走向同质化,随着AI的崛起,AI算力需求的持续涌现,云基础设施也迎来了巨大的发展空间,这无疑为亚马逊云科技这样的厂商带来了极大的创新舞台。面向未来,随着千亿美元投资的落地,亚马逊云科技有望成为AI时代的创新高地,帮助各行各业催生新一轮创新浪潮。

相关文章:

AI重塑云基础设施,亚马逊云科技打造AI定制版IaaS“样板房”

AI正在彻底重塑云基础设施。 IDC最新《2025年IDC MarketScape:全球公有云基础设施即服务(IaaS)报告》显示,AI正在通过多种方式重塑云基础设施,公有云IaaS有望继续保持快速增长,预计2025年全球IaaS的整体规…...

Linux系统之systemctl管理服务及编译安装配置文件安装实现systemctl管理服务

目录 一.systemctl 管理服务 1.systemctl管理 2.设置服务卡机自启动或开机不启动 二.编译安装配置文件编写使得可以使用systemctl管理 1、编写配置文件原因 2、添加配置文件实现systemctl管理服务 一.systemctl 管理服务 1.systemctl管理 基本格式: systemc…...

【NLP 52、多模态相关知识】

生活应该是美好而温柔的,你也是 —— 25.4.1 一、模态 modalities 常见: 文本、图像、音频、视频、表格数据等 罕见: 3D模型、图数据、气味、神经信号等 二、多模态 1、Input and output are of different modalities (eg: tex…...

【树莓派Pico FreeRTOS】-软件定时器(Software Timers)

软件定时器(Software Timers) 文章目录 软件定时器(Software Timers)1、硬件准备2、软件准备3、FreeRTOS的软件定时器介绍3.1 触发一次定时器(Oneshort Timer)3.2 重复定时器RP2040 由 Raspberry Pi 设计,具有双核 Arm Cortex-M0+ 处理器和 264KB 内部 RAM,并支持高达 16MB 的…...

My first day in QT programming

My first QT code this->setWindowTitle("HelloWorld"); //设置窗口名称 this->resize(400, 300); //设置窗口大小 QPushButton* btn new QPushButton; //新建按钮组件 btn->setParent(this); //为按钮指定父对象 …...

MySQL分组的时候遇到ONLY_FULL_GROUP_BY报错和解决

一、ONLY_FULL_GROUP_BY 错误的根本原因 MySQL 5.7 及以上版本默认启用了 sql_modeonly_full_group_by 严格模式。该模式强制要求: SELECT 中的非聚合字段必须出现在 GROUP BY 子句中;所有非聚合字段需通过聚合函数(如 MAX、MIN、SUM&#…...

Element Plus 常用组件

2025/4/1 向全栈工程师迈进!!! 常见Element Plus组件的使用,其文章中“本次我使用到的按钮如下”是我自己做项目时候用到的,记录以加强记忆。阅读时可以跳过。 一、Button按钮 1.1基础按钮 在element plus中提供的按…...

2025年优化算法:真菌生长优化算法(Fungal Growth Optimizer,FGO)

真菌生长优化算法(Fungal Growth Optimizer,FGO) 是发表在中科院一区期刊“ARTIFICIAL INTELLIGENCE REVIEW”(IF:6.7)的2025年3月智能优化算法 01.引言 Fungal Growth Optimizer (FGO) 是一种基于真菌生长行为的元启发式优化算法…...

人工智能之数学基础:矩阵分解之LU分解

本文重点 LU分解是线性代数中一种重要的矩阵分解方法,它将一个方阵分解为一个下三角矩阵(L)和一个上三角矩阵(U)的乘积。这种分解方法在数值线性代数中有着广泛的应用,特别是在求解线性方程组、计算矩阵的行列式、求逆矩阵等方面。 LU分解的基本概念 设A是一个nn的方阵…...

阿里通义千问发布全模态开源大模型Qwen2.5-Omni-7B

Qwen2.5-Omni 是一个端到端的多模态模型,旨在感知多种模态,包括文本、图像、音频和视频,同时以流式方式生成文本和自然语音响应。汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。https:/…...

23 种设计模式中的解释器模式

给定一个语言,定义它的文法的一种表示,并定义一个解释器,这个解释器使用该表示来解释语言中的句子。 这种模式通常用于需要解释执行某种语言的场景,如正则表达式、SQL解析等。 解释器模式的核心组件。 抽象表达式(Ab…...

AquaMoon and Chess_CodeForces - 1545B

由110变成011,由011变成110,“11”的组合和0可以交换位置 如果是1110 或者是 1110 的情况,红色的“11”与0换位置,变成1011,可以看成蓝色的“11”到了0的后面,蓝色“11”和0的相对位置改变了,而…...

软考-数据库系统工程师第四版pdf

软考-数据库系统工程师第四版pdf git中的文件相对没有那么清楚,网盘的有高清版 github下载 这里我给出仓库地址 链接: https://github.com/yaodada123/ruankao-pdf https://github.com/yaodada123/ruankao-pdf gitee下载 https://gitee.com/yao-hengchao/ruank…...

淘天集团Java开放岗暑期实习笔试(2025年4月2日)

摘要: 除3道笔试题外,还有10道单选、5道不定项、2道Java单选、1道Java不定项选择题,笔试时长100分组,整体难度很大。三道算法题本人全部没有AC(惭愧),事后总结至此。 第一道算法题&#xff0c…...

关于 数据库 UNION 和 UNION ALL 的使用,以及 分库分表环境下多表数据组合后的排序和分页问题的解决方案 的详细说明,并以表格总结关键内容

以下是关于 数据库 UNION 和 UNION ALL 的使用,以及 分库分表环境下多表数据组合后的排序和分页问题的解决方案 的详细说明,并以表格总结关键内容: 1. UNION 和 UNION ALL 的核心区别 1.1 定义与语法 UNION 功能:合并两个或多个 …...

【接口重复请求】axios通过AbortController解决页面切换过快,接口重复请求问题

处理网络请求时,我们经常会遇到需要中途取消请求的情况,比如用户在两个tab之间反复横跳的场景,如果每个接口都从头请求到结束,那必然会造成很大的服务压力。 AbortController是一个Web API,它提供了一个信号对象&…...

论文阅读:基于增强通用深度图像水印的混合篡改定位技术 OmniGuard

一、论文信息 论文名称:OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking作者团队:北京大学发表会议:CVPR2025论文链接:https://arxiv.org/pdf/2412.01615二、动机与贡献 动机: 随着生成式 AI 的快速发展,其在图像编辑领…...

Flutter极速接入IM聊天功能并支持鸿蒙

Flutter极速接入IM聊天功能并支持鸿蒙 如果你们也是Flutter项目,想快速接入聊天,包括聊天的UI界面,强烈推荐这一家。因为我们已经完成了集成,使用非常稳定,集成也非常快捷方便。 而且,就在今天&#xff0c…...

深挖 DeepSeek 隐藏玩法·智能炼金术2.0版本

前引:屏幕前的你还在AI智能搜索框这样搜索吗?“这道题怎么写”“苹果为什么红”“怎么不被发现翘课” ,。看到此篇文章的小伙伴们!请准备好你的思维魔杖,开启【霍格沃茨模式】,看我如何更新秘密的【知识炼金…...

C语言数组知识点

一、数组的基本概念 1.定义 数组是相同数据类型元素的集合,通过连续内存存储,支持高效访问。 核心特点: 元素类型相同 内存连续分配 通过下标访问(从 0 开始) 2.分类 一维数组:线性结构(如…...

【新手初学】SQL注入getshell

一、引入 木马介绍: 木马其实就是一段程序,这个程序运行到目标主机上时,主要可以对目标进行远程控制、盗取信息等功能,一般不会破坏目标主机,当然,这也看黑客是否想要搞破坏。 木马类型: 按照功…...

DAY 34 leetcode 349--哈希表.两个数组的交集

题号349 我尝试硬解失败 /*class Solution {public int[] intersection(int[] nums1, int[] nums2) {int n1nums1.length;int n2nums2.length;int sizeMath.min(n1,n2);int []arrnew int[size];int count0;for(int i0;i<n1;i){outerloop:for(int j0;j<n2;j){if(nums1[i…...

Qt常用宏定义判断大全

Qt 提供了一系列预定义宏用于判断 Qt 版本、操作系统平台、编译器特性等。这些宏在跨平台开发中非常有用。 1. Qt 版本判断宏 // 检查Qt版本 #if QT_VERSION > QT_VERSION_CHECK(5, 15, 0)// Qt 5.15.0及以上版本特有代码 #endif// 常用版本判断 #if QT_VERSION > QT_V…...

tsconfig.json:error TS6306: Referenced project ‘/tsconfig.node.json‘

这是TypeScript配置文件中的错误。具体有两个问题&#xff1a; 错误TS6306&#xff1a;引用的项目/tsconfig.node.json必须设置"composite": true错误TS6310&#xff1a;引用的项目tsconfig.node.json不能禁用emit 要解决这些问题&#xff0c;需要修改tsconfig.nod…...

14-SpringBoot3入门-MyBatis-Plus之CRUD

1、整合 13-SpringBoot3入门-整合MyBatis-Plus-CSDN博客 2、表 3、crud package com.sgu;import com.sgu.mapper.UserMapper; import com.sgu.pojo.User; import org.junit.jupiter.api.Test; import org.springframework.beans.factory.annotation.Autowired; import org.spri…...

前端面试常考算法题目详解

根据2025年最新前端面试趋势&#xff0c;结合腾讯、阿里等大厂真题&#xff0c;我为你整理了以下高频算法题型及JS实现方案&#xff1a; 一、数组/字符串处理 1. 两数之和&#xff08;哈希表法&#xff09; 问题&#xff1a;找出数组中两数之和等于目标值的索引 const twoSu…...

三轴云台之相机技术篇

一、结构设计 三轴云台通常由空间上三个互相垂直的框架构成&#xff0c;包括内框&#xff08;俯仰框&#xff09;、中框&#xff08;方位框&#xff09;和外框&#xff08;横滚框&#xff09;。这些框架分别负责控制相机的俯仰运动、方位运动和横滚运动&#xff0c;从而实现对目…...

质量和工艺之间的区别与联系?

我们生活中常常会遇到这些现象:冰箱漏水,修手机,电脑死机卡死,空调不制冷等等一些现象,我相信99%用户的第一反应是产品的质量不太行对吧! 其实不然,站在专业分析角度,难道冰箱漏水就一定是质量的问题吗? 不一定,小编认为要根本原因出发考虑,冰箱漏水了,可能和工艺…...

Bugku-再也没有纯白的灵魂

下载文件发现是兽音先用https://roar.iiilab.com/加密flag 得到“~呜嗷嗷嗷嗷呜啊嗷啊呜呜嗷呜呜~嗷嗷~啊嗷啊呜嗷嗷~嗷~嗷~呜呜嗷呜啊啊”&#xff0c;与密文对比对比发现字段少个啊&#xff0c;并且B对应嗷&#xff0c;U对应呜&#xff0c;G对应啊&#xff0c;K对应~补充啊后…...

推导Bias² + Variance + σ²_ε

问题的背景 我们有一个真实函数 f ( x ) f(x) f(x) 和基于训练数据 D D D 训练得到的模型 f ^ ( x ; D ) \hat{f}(x;D) f^​(x;D)。对于任意输入 x x x&#xff1a; y y y 是真实的观测值&#xff0c;定义为 y f ( x ) ϵ y f(x) \epsilon yf(x)ϵ&#xff0c;其中 …...