科技云报道:AI+云计算共生共长,能否解锁下一个高增长空间?
科技云报道原创。
在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。
然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。
大模型技术的安全性、解释性、易用性等综合指标正在成为此轮AI竞赛的关键,部分企业不再执着于大模型的开发,而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多种商业模式。
AI与云计算迎来大融合时代
从诞生起,云计算一直被认为是未来的发展方向、互联网企业们的“第二增长曲线”。
但是,受互联网增长红利见顶以及政策监管趋严的影响。从2021年开始,原本处在高速增长阶段的云服务商们纷纷陷入了增速放缓的阶段。从高峰时的超过50%的增速,一路跌至2022年的20%,甚至更低。
全球产业需求的消退,导致云计算行业增速失调。根据研究机构TrendForce今年2月的预警,Meta、微软、谷歌、亚马逊这四家云厂商的服务器采购量可能从年增6.9%放缓至4.4%。
不过,拐点很快到来。在ChatGPT出现后,即使行业需求放缓,国内外云服务商们也在积极将业务重心转移至AI领域。
可见云服务商们逐渐从上半场的“求速度”转变为落地于产业深处,去寻求更高的价值增量。
随着第一波上云的完成,企业正在进入深度用云阶段。AI与云的结合不仅能够进一步降低企业上云的门槛,还能为企业实现业务深度的智能化。
根据Gartner《2022年人工智能技术成熟度曲线》报告,尽早采用复合型人工智能(AI)、决策智能等AI技术将给企业机构带来明显的竞争优势,缓解AI模型脆弱性引发的问题,有助于捕捉业务背景信息,推动价值实现。
今年4月中旬,阿里云智能首席商业官蔡英华对外表示,算力的飞速发展使数字化成为确定,使智能化成为可能。
未来阿里云将以云计算为基石,以AI为引擎,参与到从数字化迈向智能化的划时代变革中。
AI走向普惠的一大步
英伟达第二财季的业绩惊艳众人,其背后是生成式AI革命中,行业对高性能算力的迫切需求,然而现在,昂贵的算力成本下,AI大模型似乎仍是个“富人游戏”。
面对GPU价格的暴涨与未来可能到来的“算力荒”,大公司砸钱囤卡,尚可悠然步入AI竞技场,而中小企业没有“钞能力”,在发展AI模型、应用过程中,更容易受算力制约。
拿什么来拯救AI算力资源极度不均衡的现状?如何让更多创业者参与到大模型的市场竞争中?
作为全球GPU龙头供应商、此轮AI热潮最大的受益者,英伟达给出了破局之道——算力租赁。
今年3月,英伟达正式推出算力租赁服务方案“DGX云”,该方案由英伟达与微软云、谷歌云、甲骨文等全球top10的云服务商共同打造,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机,不需要采购与拥有服务器设备。
事实上,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点,该服务推出标志着AI云算力进入新阶段。云算力采用“化整为零”的方式赋能产业链各方,具备可持续性。
算力租赁,即对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。算力生产商与云平台的合作由来已久,用户可以通过阿里云、腾讯云等平台租用英伟达的显卡与AI处理器。
对于英伟达与云服务商来说,算力租赁是实现双赢的策略。
全球第七大云服务商甲骨文是最先响应英伟达DGX云计划的大厂,该公司于2022年10月将英伟达加速计算堆栈工具(包括GPU 、系统、软件)迁移到其IaaS业务的旗舰产品——云服务平台OCI(Oracle Cloud infrastructure)上。
从最新的季报数据来看,这对甲骨文的业绩有非常显著的拉动作用。
2023年第四财季(自然年3月1日-5月31日),其云业务(IaaS+SaaS)营收达44亿美元,同比增加54%;其中,IaaS业务营收14亿美元,同比大增76%,云厂商中单季度云业务增收增速第一。
于英伟达而言,这亦是一笔回本周期短且毛利率可观的生意。
以A100(80G)租赁服务为例,A100(80G)显卡单价成本取10万元,现假设每张卡都得到充分租用,则按照2023年8月19日国内云算力平台租用A100(80G)服务器的均价15.1元/小时,考虑到各大平台竞争客户,经常性推出优惠活动,则假设平均实际租金为7.6元/小时,投入10亿元资金的实际回本周期为1.5-2年,按照平台最低定价计算,毛利率至少为46.3%。
目前,英伟达正积极拓展“朋友圈”,与领先的云服务商联合托管DGX云基础设施,甲骨文之外,微软Azure也已开始托管DGX云,这项服务还将在不久之后扩展到谷歌云。
基于算力租赁,用户只要按需付费,不用承担硬件设备的采购、维护、升级等费用,也不用担心设备闲置或者过时造成浪费;用户可随时随地通过云端访问所需的算力资源,快速开始训练和应用;用户可根据需求选择不同算力平台和机型,也可以不受地域或者时间的限制模型、工具等资源,进行更多的尝试和探索。
当多云遇到生成式AI
为了向大模型客户提供高稳定性和高性价比的AI基础设施,生成式AI+多云的模式成为科技厂商们新的角力点。云被看作是AI的承载,而AI也是云的核心抓手,开展大模型所需要的算法、算力和数据等能力,以及覆盖IaaS、PaaS、MaaS的解决方案。
近期,VMware 推出Intelligent Assist、Private AI架构方案。在此之前,阿里云提出了“Model as a service”的概念,亚马逊云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。
VMware CEO Raghu表示:“生成式AI与多云可谓珠联璧合。客户的数据无处不在,遍布其数据中心、边缘、云等多处。
我们将与NVIDIA一同助力企业放心地在数据附近运行生成式AI工作负载,并解决其在企业数据隐私、安全和控制方面的问题。”
NVIDIA创始人兼首席执行官黄仁勋表示:“我们能够训练AI模型,微调AI模型,为了跨多个GPU部署AI模型和大语言模型,特别是大语言模型,一台计算机运行不了,必须将其分配到多机多卡上,并对其进行推理、生成token,实现交互,其速度可媲美人类日常交互。”
同时他表示,通过与VMware扩大合作,我们将能够为金融服务、医疗、制造等领域的成千上万家客户提供其所需的全栈式软件和计算,使其能够使用基于自身数据定制的应用,充分挖掘生成式AI的潜力。
Private AI由一套集成式AI工具组成,能够使企业自定义模型并运行各种生成式AI应用,如智能聊天机器人、助手、搜索和摘要等。
该平台将作为全集成式解决方案,采用NVIDIA提供的生成式AI软件和加速计算,基于VMware Cloud Foundation构建,并针对AI进行了优化。
VMware AI Labs副总裁Chris Wolf表示:“最开始,AI是由一部分数据科学家为方便其他的数据科学家而构建和设计的。
随着全新VMware Private AI产品的推出,VMware正在让计算和AI模型的选择更加贴近数据,从而使未来的AI服务于企业中的每一个人。”
AI能拉动云服务增长吗?
行业研究机构IDC日前发布的2022年全球云计算追踪数据显示,全球云计算IaaS市场规模增长至1154.96亿美元,同比去年上涨26.2%。
全球前三名云厂商依次为亚马逊、微软、阿里云,所占份额分别为48.9%、14.4%、6.2%,谷歌和IBM紧随其后,所占份额分别为5.6%和2.9%。华为云、中国电信、腾讯云、中国移动和百度云位列六至十名。
与2021年相比,阿里云市场份额在减少,而亚马逊和谷歌所占市场份额在增加。
移动互联网发展见顶之后,全球云服务商收入增长都在放缓,AWS增速从40%下降到12%,微软Azure增速从31%下降到15%,但显然阿里云面临的挑战更大一些,增速已降至不足10%,上个季度首次出现负增长。
反观紧随其后的谷歌云仍保持近30%的增长,极有可能取代阿里云占据全球云厂商第三的位置。
2023年第二季度,阿里云的收入同比增长了4%。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。
从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。
AI热潮带来的算力和模型服务需求,正在推动云计算巨头重回增长,那么这种增长能否长期持续?
IDC统计了全球主要云计算厂商的收入拆分,阿里云、AWS的收入结构基本接近, 均主要以IaaS业务为主,辅以一部分PaaS业务,而微软Azure的PaaS和SaaS的收入占比超过60%。
实际上,云计算产业链中,从底层的IaaS,到中间层的PaaS,再到上层的SaaS,越往上产品差异化越大,毛利率越高。
微软Azure正是将自身的Windows、Office、SQL Server等软件与云服务打通,获得了更高的毛利率。
IDC在7月6日发布的《全球公共云服务半年度跟踪报告》显示:2022年全球公共云服务市场收入总计为5458亿美元,其中,SaaS(软件即服务)是公共云服务收入的最主要来源,占2022年总收入的45%以上。
面对全球市场以及国内市场激烈的IaaS竞争,阿里云发力PaaS和MaaS,微软Aure是可以参考比较的对象。
作为OpenAI的投资方,微软显然更受益于生成式AI的发展。今年初,微软宣布Azure OpenAI服务在全球Azure平台发布,该服务旨在为开发人员提供对大型语言模型的便捷访问,这些模型可以跨其他Azure产品无缝集成,以协助企业开发和部署对话式AI服务和解决方案。
此外,微软在其全球合作伙伴大会上宣布了Microsoft 365 Copilot定价、推出Bing Chat Enterprise AI聊天机器人、和Meta联合宣布将Llama 2开源大模型引入Azure云和Windows。
微软2023年第四财季电话会议上,微软首席财务官Amy Hood则表示,尽管目前对Azure AI服务的需求强劲,但目前AI服务对Azure的收入贡献仅有约1个百分点,随着微软加速投资云基础设施,AI对微软收入带来的影响将集中在2024财年的下半年。
张勇在财报会议上也说:“人工智能AI革命是一个增量机会,各行各业,所有公司他们都会希望利用人工智能来提升他们的服务。
但是这个是离不开要利用大量高性能的算力,不仅是用于现阶段模型的训练,还要用于支撑以后他们提供各种的服务。因此我们认为这是非常重要的、长期的一个带动增长的引擎。”
企业数字化、产业智能化是一条漫长的路,但云计算大厂们则通过不断的技术革新、开放赋能,正助力更多企业大步快跑进产业智能化的升级浪潮中,大大缩短了这一升级路径所需时间。
在人工智能技术融入万物,技术、需求与产业进化永不停歇、奔涌向前的现实下,未来的技术框架又会进步到何种程度,让我们拭目以待。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:

科技云报道:AI+云计算共生共长,能否解锁下一个高增长空间?
科技云报道原创。 在过去近一年的时间里,AI大模型从最初的框架构建,逐步走到落地阶段。 然而,随着AI大模型深入到千行百业中,市场开始意识到通用大模型虽然功能强大,但似乎并不能完全满足不同企业的个性化需求。 大…...

ReactPy:使用 Python 构建动态前端应用程序
在 Web 开发领域,ReactJS 已成为主导者,为开发人员提供了用于创建动态和交互式用户界面的强大工具集。但是,如果您更喜欢 Python 的多功能性和简单性作为后端,并且希望在前端也利用它的功能,该怎么办?ReactPy 是一个 Python 库,它将熟悉的 ReactJS 语法和灵活性带入了 P…...

安全攻防基础以及各种漏洞库
安全攻防基础以及各种漏洞库 信息搜集企业信息搜集1. 企业架构2. ICP备案查询,确定目标子域名3. 员工信息(搜集账号信息、钓鱼攻击)4. 社交渠道 域名信息搜集IP搜集信息泄露移动端搜集打点进内网命令和控制(持续控制)穿…...

护眼灯值不值得买?开学给孩子买什么样的护眼台灯
如果不想家里的孩子年纪小小的就戴着眼镜,从小就容易近视,那么护眼灯的选择就非常重要了,但是市场上那么多品类,价格也参差不齐,到底怎么选呢?大家一定要看完本期内容。为大家推荐五款热门的护眼台灯 一、…...

windows安装Scala
Windows安装Scala 下载地址:https://downloads.lightbend.com/scala/2.11.11/scala-2.11.11.zip 解压完成之后 配置环境变量...

API类型和集成规范指南
在我们的常见应用中,往往包含着大量服务于各种数据交换的API类型、以及各种常见的API架构与协议。下面,我将从集成的角度和您讨论,在准备将多个服务相互集成时,使用不同类型、架构和协议的API意味着什么?我们可以使用哪些工具&am…...

[ES]mac安装es、kibana、ik分词器
一、安装es和kibana 1、创建一个网络,网络内的框架(eskibana)互联 docker network create es-net 2、下载es和kibana docker pull elasticsearch:7.12.1 docker pull kibana:7.12.1 3、运行docker命令部署单点eskibana(用来操作es) doc…...

YOLO目标检测——视觉显著性检测MSRA1000数据集下载分享
MSRA1000数据集是一个常用的视觉显著性检测数据集,它包含了1000张图像和对应的显著性标注。在以下几个应用场景中,MSRA1000数据集可以发挥重要作用:图像编辑和后期处理、图像检索和分类、视觉注意力模型、自动驾驶和智能交通等等 数据集点击下…...

【基于空间纹理的残差网络无监督Pansharpening】
Unsupervised Pansharpening method Using Residual Network with Spatial Texture Attention (基于空间纹理的残差网络无监督泛锐化方法) 近年来,深度学习已经成为最受欢迎的泛锐化工具之一,许多相关方法已经被研究并反映出良好…...

2023年信息安全管理与评估(赛项)评分标准第三阶段夺旗挑战CTF(网络安全渗透)
全国职业院校技能大赛 高职组 信息安全管理与评估 (赛项) 评分标准 第三阶段 夺旗挑战CTF(网络安全渗透) 竞赛项目赛题 本文件为信息安全管理与评估项目竞赛-第三阶段赛题,内容包括:夺旗挑战CTF(…...

开启智能时代:深度解析智能文档分析技术的前沿与应用
开启智能时代:深度解析智能文档分析技术的前沿与应用 本章主要介绍文档分析技术的理论知识,包括背景介绍、算法分类和对应思路。通过本文学习,你可以掌握:1. 版面分析的分类和典型思想 2. 表格识别的分类和典型思想 3. 信息提取的…...

高级时钟项目
高级时钟项目 笔者来介绍一下一个简单的时钟项目,主要功能就是显示时间 1、背景 2、数码管版本(第一版) 3、OLED屏幕版本(第二版) 3.1、Boot 3.2、app 3.3、上位机 界面一:时间天气显示 界面二 &…...

跨境海淘攻略:如何实现自己批量养买家账号海淘
近年来,随着互联网的发展,网购已经成为人们日常生活中不可或缺的一部分。不仅在国内购买商品,在跨境电商行业越来越成熟,很多的消费者开始选择购买国外平台商品,价格相比国内专柜来说会更为优惠。因此,海淘…...

【lua】在微软 windows 系统上安装 lua
https://sourceforge.net/projects/luabinaries...

系统学习Linux-PXE无人值守装机(附改密)
目录 pxe实现系统自动安装pxe工作原理 大致的工作过程如下: PXE的组件: 一、配置vsftpd 二、配置tftp 三、准备pxelinx.0文件、引导文件、内核文件 四、配置dhcp 配置ip 配置dhcp 五、创建default文件 六、新建测试主机用来测试装机效果 七、…...

关于web3.0平台的详细说明
Web3.0是指下一代互联网的发展阶段,它以区块链技术为基础,具有去中心化、安全性强、用户数据私密性保护等特点。在Web3.0的社交平台中,人们可以更好地掌控自己的数据,并获得更加开放和透明的社交体验。 以下是一些关于Web3.0社交…...

Git命令简单使用
1、上传仓库到 git 上传仓库到 git 上之前需要配置用户名和邮箱 git config --global user.name "user_name" git config --global user.email "email_id"在本地仓库中使用名称初始化 git init使用下面的命令将文件添加到仓库 # 添加一个或多个文件到暂…...

Flutter(十)网络请求和文件
目录 文件操作网络请求1.Dio库2.websocket3.JSON转Dart Model 文件操作 APP目录 Android 和 iOS 的应用存储目录不同,PathProvider (opens new window)插件提供了一种平台透明的方式来访问设备文件系统上的常用位置。该类当前支持访问两个文件系统位置:…...

Unity RenderStreaming 云渲染-黑屏
🥪云渲染-黑屏 网页加载出来了,点击播放黑屏 ,关闭防火墙即可!!!!...

Java设计模式:四、行为型模式-04:中介者模式
文章目录 一、定义:中介者模式二、模拟场景:中介者模式三、违背方案:中介者模式3.1 工程结构3.2 创建数据库3.3 JDBC工具类3.4 单元测试 四、改善代码:中介者模式4.1 工程结构4.2 中介者工程结构图4.3 资源和配置类4.3.1 XML配置对…...

【GO】LGTM_Grafana_Tempo(1)_架构
最近在尝试用 LGTM 来实现 Go 微服务的可观测性,就顺便整理一下文档。 Tempo 会分为 4 篇文章: Tempo 的架构官网测试实操跑通gin 框架发送 trace 数据到 tempogo-zero 微服务框架使用发送数据到 tempo 第一篇是关于,tempo 的架构ÿ…...

MFC 与 QT“常用控件”对比
1、 常用控件 MFC QT 1.静态文本框/标签 CStatic QLabel 按钮 CButton包含了3种样式的按钮,Push Button,Check Box,Radio Box 4种不同的类 2.按钮:推动按钮 Push Button(同一个类CButton) QPushButton 3.按钮…...

linux 下安装chrome 和 go
1. 安装google-chrome 1.1 首先下载google-chrome.deb安装包 之后 安装 gdebi包 sudo apt install gdebi 1.2 安装所要安装的软件 sudo gdebi code_1.81.1-1691620686_amd64.deb 1.3 解决Chrome无法启动问题 rootubuntu:~/Downloads# whereis google-chrome google-chrome…...

OpenCV: cv2.findContours - ValueError: too many values to unpack
OpenCV找轮廓findContours报错 ValueError: not enough values to unpack (expected 3,got 2) 问题指向这行代码👇 binary, cnts, hierarchy cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE ) 报错的意思是需要3个返回值但只给了两…...

Vue框架--Vue概述
1.vue概述 Vue是一个渐进式JavaScript 框架,用于动态构建用户界面。 2.vue的特点 (1).遵循MVVM模式 MVVM是Model-View-ViewModel的简写。它本质上就是MVC的改进版 (2).采用组件化模式,提高代码的复用率,且让代码更好的维护。 组件化:简单的说就是使用xxx.vue模式包含一个页面…...

Fiddler安装与使用教程(1) —— 软测大玩家
😏作者简介:博主是一位测试管理者,同时也是一名对外企业兼职讲师。 📡主页地址:【Austin_zhai】 🙆目的与景愿:旨在于能帮助更多的测试行业人员提升软硬技能,分享行业相关最新信息。…...

Ubuntu 22.04安装 —— Win11 22H2
目录 Ubuntu使用下载UbuntuVmware 安装图示安装步骤图示 Ubuntu使用 系统环境: Windows 11 22H2Vmware 17 ProUbutun 22.04.3 Server Ubuntu Server documentation | Ubuntu 下载 Ubuntu 官网下载 建议安装长期支持版本 ——> 可以选择桌面版或服务器版(仅包…...

【STM32】IIC的初步使用
IIC简介 物理层 连接多个devices 它是一个支持设备的总线。“总线”指多个设备共用的信号线。在一个 I2C 通讯总线中,可连接多个 I2C 通讯设备,支持多个通讯主机及多个通讯从机。 两根线 一个 I2C 总线只使用两条总线线路,一条双向串行数…...

音视频 ffmpeg命令参数说明
主要参数: -i 设定输入流 -f 设定输出格式(format) -ss 开始时间 -t 时间长度 音频参数: -aframes 设置要输出的音频帧数 -b:a 音频码率 -ar 设定采样率 -ac 设定声音的Channel数 -acodec 设定声音编解码器,如果用copy表示原始编解码数据必须…...

Go学习第十天
打印报错堆栈信息 安装errors包 go get github.com/pkg/errors 具体使用 // 新生成一个错误, 带堆栈信息 func New(message string) error//只附加新的信息 func WithMessage(err error, message string) error//只附加调用堆栈信息 func WithStack(err error) error//同时附…...