科技云报道:青云科技打出“AI算力牌”,抢跑“云+AI”新增市场
科技云报道原创。
近三年,中国云计算市场在多个维度同时发生着剧烈变化——疫情极大加速了全社会对于数字化的认知和接受程度;一系列云原生技术依托着开源和蓬勃的市场而迅速发展演变,更多产品和技术名词同时涌向市场;国际关系复杂化下的信创云浪潮扑面而来…
在这样一个技术和需求都在快速演变的供需环境中,云计算市场竞争走向存量市场的较量,留给所有玩家的空间都更加逼仄。
对于已经穿越过十余年风浪的青云科技而言,如何在这些剧烈的变化中寻找新航道,再一次对其战略眼光提出了考验。
在9月19日的“AI算力发布会”上,青云科技宣布了全新的战略方向——发力AI算力,与生态圈共建,以满足企业复杂的AI需求。
令人好奇的是,打出的“AI算力牌”,能否成为青云科技备战下一个10年的重要支撑?
AI是云计算竞争的新机会
当下最火热的技术莫过于AI,随着ChatGPT成功带来的新一代AI浪潮,引发了全球科技巨头在AI大模型层面的“军备竞赛”。
作为AI大模型的发展基石,AI算力的需求也得到大幅提升——无论是基于通用大模型微调的行业应用,还是垂直行业的大模型训练,都需要大量的AI算力进行支撑,其规模还在随着大模型的成熟落地而不断攀升。
而在AI大模型热潮涌现之前,AI作为一种新的生产力工具已经在各行业场景中发挥作用。伴随AI技术的迅速发展,算力基础设施由通用算力为主,向通算、智算、超算一体化演进,市场对AI算力乃至多元算力的需求愈加强烈。
一个明显的变化是,在国家政策的大力倡导下,全国各地都在积极打造大型智算中心,以推动国家新一代人工智能公共算力开放创新平台的建设。
同时,“东数西算”工程也推动着各地包括智算中心、超算中心在内的算力中心建设,以提升国家整体算力水平。
中国信通院《中国综合算力指数(2023年)》显示,近5年我国人工智能算力在整个算力结构中的占比已经超过25%,同比增加60%。未来算力仍会保持高速发展,尤其是智能算力将成为未来算力增长的主要动力。
毫无疑问,云计算作为AI算力不可或缺的基础设施,AI算力需求的爆发正在为云计算市场带来更多增量。有业内人士认为,随着企业对AI投入占比的持续增加,对于底层算力的需求,会带来10倍乃至100倍的市场规模增长。
在青云科技总裁林源看来,AI为云计算打开了全新的增量市场,并且会带来一波长达10年以上的市场需求,这正是青云新一轮竞争的机会。
但机会总是伴随着挑战,AI技术催生的新市场,从客户需求到对算力、应用、底层架构的要求,都发生了巨大的变化:
过去数字化转型,企业应用以传统应用为主,如今以云原生和AI应用为主;过去企业对于底层算力以CPU为主,如今变成了CPU、GPU异构多元算力;过去互联网业务主要是延迟敏感型应用,但如今企业会兼顾成本型应用,业态变得更加丰富。
这些变化对技术和平台挑战越来越多,也让几乎所有的云服务商重新回到同一起跑线,争夺AI算力这一新增市场。
那么对于青云科技来说,发力AI算力,到底有多少胜算?
“AI算力调度平台” 抢跑AI算力赛道
自2022年国务院发布《“十四五”数字经济发展规划》以来,重点提到要推进云网协同和算网融合发展,促进智能计算中心构建,目前智算中心已成为各地政府的重点项目。据不完全统计,全国至少有30座城市已经建成或正在建设智算中心,这还不包括企业自主建设的智算中心。
可以说现阶段是一个算力集中建设的时期,但无论是地方政府、国央企,还是地方AI集成商,想要建设好一个智算中心都面临着巨大的挑战。
一方面,智算中心投资巨大,能否盈利取决于运营效率和平台能力;另一方面,相比于建设,中后期的运营则更为复杂,要面对更为现实的技术和应用落地问题,比如:云计算、超算、智算等多元算力如何统一调度?
传统应用、云原生应用、AI应用如何同时兼顾?如何支持异构CPU/GPU、提供高效的网络与存储?大规模智算中心如何高效的运维和运营?
在智算中心高速扩张的早期阶段,由于缺少统筹规划和技术经验,项目失败不在少数。某大厂斥巨资建设的智算中心,由于只支持国产GPU,上线时发现很多应用根本无法支撑,导致整个智算中心无法投入运营。
与之类似的还有超算中心想要兼顾智算中心的功能,虽然超级计算机提供高精度算力,但却是为科学计算、超算等场景而生的,对于AI所需要的大规模、低精度算力并不适用,因此这一想法也并不现实。
不难发现,智算中心并不缺建设者,关键挑战反而是在建设后的运营阶段,谁能更好地解决这一难题,谁就能优先拿到AI算力的门票,而青云科技无疑是其中的佼佼者。
2019年,国家超级计算济南中心实施规划——打造全新的百亿亿次异构融合算力平台,以满足日益旺盛的“新基建”需求。
青云科技作为唯一的算力调度平台供应商,为国家超算济南中心提供了“一个平台纳管多种算力服务、一站式统一管理、跨平台便捷应用部署”的算力运营服务。
作为当时全亚洲最大的计算中心之一,国家超算济南中心拥有1000P的算力、超 300 PB的存储,打造的算力服务包括HPC超算、传统云计算(以CPU为主)、智算(兼顾国外及国产 GPU),是一个名副其实的多元且异构的算力中心。
这样一个庞大的复杂体系,必然对平台建设方和运营方提出了极高的要求。据林源回忆,当时从底层的芯片、服务器、存储、交换机、安全设备到上层的云平台,业内几乎所有顶尖的厂商都参与其中,但整个项目的算力调度运营平台是由青云独家供应的。
在算力调度上,青云科技屏蔽了超算服务器、AI服务器、通用服务器等多种异构基础设施的差异,向下接驳异构化的算力和硬件平台,实现对算力的统一纳管、调度、配给和全生命周期管理,进而向上支撑各种行业应用,为传统HPC科学计算、政务云、智慧城市等AI应用提供完整的算力服务。
如今,国家超算济南中心已稳定运营3年,且已经开始盈利,成为国内多元算力中心成功运营的典范。尽管这种成功看起来毫不费力,但背后其实凝结了青云科技长期以来的技术积累和运营经验。
作为中国最早一批推出公有云服务的云服务商,青云科技在算力的调度、运维、运营等方面,已历经了十多年的大规模市场验证。
2020年在洞察到国家“新基建”政策背后的算力中心和多元算力的需求后,青云科技提前三年就开始布局算力领域,从而具备了服务算力中心建设三要素(架构/能耗管理、多元算力操作系统以及多算力集群运营)的能力。
据青云科技产品经理苗慧介绍,青云AI算力调度平台具备九大关键能力——多区多业务资源整合、高速并行存储、混合组网、分布式调度与管理、灵活调度、容器推理服务平台、算法开发支持、模型仓库(MaaS)、AI训练平台。
例如,在资源调度上,青云科技在多个方面进行了优化:为了适应AI行业特点,实现了立即调度扩容数万卡资源;在通信链路上,所有的节点、服务器、存储都打上了路径标签,可计算调度最短链路,让数据不绕路;支持异构平台,加速国产GPU芯片替代;使用“K8s+Slurm”对作业感知的管理,实现最大系统利用率;广泛的调度选项、动态灵活的资源调度可配置,使得运营管理员可以通过排队、调度、手动调度等方式,解决AI系统中最具挑战性的优先事项。
在混合组网上,青云科技也基于传统的云计算领域,增加了高速网络,在多区域(AZ)构建了统一服务计算平台,能够支持跨区域高速网络互联、不同类型资源池互联、独立计算和存储IB网、专属访问存储高速网络、业务网络互连下发任务等。
用户在申请资源时,无论是按卡还是按节点申请,都能保证数据的安全隔离。
在AI训练平台上,青云科技集成了常用的训练模型框架,并提供GPU服务器在线申请、自动调度的集群,使得AI训练的所有网络和环境都可以一键生成。
整体而言,青云科技在AI算力领域的成功并非偶然,而是在AI算力调度和运营方面下了“狠功夫”的必然结果。
目前,除了国家超算济南中心,青云AI算力调度平台还应用在清华天津电子院智算科研教学平台、上海科发SciPlus科研云等算力融合创新场景中,成为各类算力中心运营者的关键工具,助力算力中心建立从建设到运营的闭环。
AI算力云服务走向AI共赢
事实上,不仅是智算中心的运营者需要面对AI算力的挑战,AI作为一个非常宽泛的领域,产业链各方对于AI算力都有着复杂且多样的需求。
从最终用户角度看,企业、科研机构在进行AI大模型训练和推理时需要巨大的计算量,他们渴望更低成本的AI算力资源。
同时,AI训练和推理的响应效率,会影响业务应用实时响应和决策的速度,他们渴望稳定的、优质的底层基础设施,提供更加高效便捷的AI算力资源;AI的高技术门槛,让很多企业对技术的使用产生了极大阻力,他们渴望AI算力服务能够进一步降低AI技术的使用门槛…
对此,青云科技依然发挥了自身在云服务上的优势,打造和持续升级了一系列高性能、弹性敏捷、安全可靠的算力产品及服务,以满足企业通算、超算、智算等多样化的算力需求。
目前,青云科技已基于完整的算力基础设施,能够为工业仿真、大气环境、医疗医药、教育科研、交通物流、自动驾驶、智慧政务等领域企业提供蓬勃算力,驱动业务创新。
青云科技2023年半年度报告显示,归属于云服务业务的AI算力云服务,上半年已经成为公司非常重要的新增长点,实现收入突破,收入规模为2651万元。
有别于互联网大厂在AI大模型和算力建设上的“高举高打”,青云科技反其道而行之,在AI算力云服务上走出了一条“轻资产”的道路。
众所周知,公有云服务一向是投入高、盈利难的业务,但青云科技在过去几年已确立了“精品化创新,高质量发展”的长期战略,更加注重盈利能力的建设。
因此,重金自建公有云不再是青云科技的选择,对于AI算力云服务的建设也同样遵循这一原则:一是不自建AI大模型;二是通过“生态同盟”的方式共同建设和运营AI算力云服务。
在青云科技总裁林源看来,“生态同盟”是AI时代的必然产物,企业一定是通过算力服务、算法和模型、高价值的数据来实现智能化,这也是AI生态体系的价值所在。
“最终用户要的是一个完整的解决方案,包括:机房、底层算力基础设施、算力调度平台、模型驱动、上层应用等等,每一层都需要专业的供应商投入大量的技术和时间才能建设好,所以我们认为AI领域会比以往更需要生态,而不是依靠一家独立的公司从下至上全部自建”,林源表示。
因此,在青云科技AI算力的生态同盟中,从底层算力基础设施方、中层大模型资源方、数据资源方,到上层算力运营方、行业应用方一应俱全,生态里的每位参与者都是专业且彼此需要的,大家以开放合作的心态一起实现整体能力的整合,从而走向AI共赢。
比如,青云科技会与专业的大模型厂商或AI团队联合,针对客户AI相关业务提供场景化方案,协助客户完成数据采集、算力平台建设、模型训练和推理、定制化模型、公私混合云部署等,最终构建或落地符合真实需求的AI应用。
AI算力“双轮驱动”备战下一个十年
整体来看,青云科技以AI算力调度平台和AI算力云服务为“双轮驱动”,共同支撑其“AI算力战略”的发展。
在AI算力运营方面,青云科技基于开放的、成熟的、可运营的AI算力调度平台,与大型政企、科研机构、运营商等智算中心建设方与运营方相互配合,扮演好算力运营技术服务商的角色。
在AI算力云服务方面,青云科技基于公有云能力打造了全面的算力基础设施,与生态同盟一起通力合作,为企业提供多样化的算力服务支撑,承担起AI算力云服务商的责任。
在青云科技总裁林源看来,AI算力未来一定会成为青云科技主营的业务模式,这是由市场决定的,“不管是互联网客户,还是传统行业客户,大家都在转向AI,所以我们的生意模式也是这么驱动的”。
而打造AI算力恰恰是青云科技最为擅长的。在过去云计算十余年的发展浪潮中,青云科技从公有云、私有云、混合云到云原生、信创云,一次次历练着自身云平台的能力。
随着AI时代来临,与青云云平台一脉相承的AI算力调度平台得以乘风而上,多年积累的技术实力让对手难以望其项背,很大程度上成为抢跑AI算力赛道的“杀手锏”。
同时,青云科技作为一个中立的服务商,既能满足客户不被绑定、赋能其独立运营的核心需求,也拥有大规模市场验证过的技术实力。
即便众多厂商都想进入AI算力运营这一赛道,但青云科技凭借自身清晰的定位和过硬的技术实力,在AI算力运营上拥有了无可比拟的差异化竞争优势。
如今,坚持“轻资产”路线、拥抱生态的青云科技,再次轻装上阵,全力奔向下一个十年。在走向AI星辰大海的路上,青云科技或将迎来自己新的黄金时代。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:

科技云报道:青云科技打出“AI算力牌”,抢跑“云+AI”新增市场
科技云报道原创。 近三年,中国云计算市场在多个维度同时发生着剧烈变化——疫情极大加速了全社会对于数字化的认知和接受程度;一系列云原生技术依托着开源和蓬勃的市场而迅速发展演变,更多产品和技术名词同时涌向市场;国际关系复…...

学习路之PHP--lumen安装配置
一、下载lumen源码 composer create-project --prefer-dist laravel/lumen blog 安装lumen-generator composer require flipbox/lumen-generator 二、配置 bootstrap\app.php 97行 $app->register(Flipbox\LumenGenerator\LumenGeneratorServiceProvider::class);三、生成…...

【C++】构造函数和析构函数第一部分(构造函数和析构函数的作用)--- 2023.9.25
目录 前言初始化和清理的概念构造函数和析构函数的作用构造函数的作用析构函数的作用 使用构造函数和析构函数的注意事项默认的构造函数和析构函数结束语 前言 在使用c语言开发的项目场景中,我们往往会遇到申请空间的需求,同时也肯定遇到过程序运行一段…...
CocosCreator3.8研究笔记(二十一)CocosCreator Tween系统理解
在 Cocos Creator 3.x 版本中, Tween系统代替了原来的Action系统。很多朋友不明白Tween到底是什么,Tween原理是什么?怎么使用Tween? 今天就来详细了解一下,希望能帮助到大家加深对Tween的了解,并快速掌握Tw…...
大数据学习-目录
学习内容持续更新ing 1.大数据学习1.0-Centos8虚拟机安装 大数据学习1.0-Centos8虚拟机安装_汉卿HanQ的博客-CSDN博客 2.大数据学习1.1-Centos8网络配置 大数据学习1.1-Centos8网络配置_汉卿HanQ的博客-CSDN博客 3.大数据学习1.2-yum配置 大数据学习1.2-yum配置_汉卿HanQ的…...

《动手学深度学习 Pytorch版》 7.5 批量规范化
7.5.1 训练深层网络 训练神经网络的实际问题: 数据预处理的方式会对最终结果产生巨大影响。 训练时,多层感知机的中间层变量可能具有更广的变化范围。 更深层的网络很复杂容易过拟合。 批量规范化对小批量的大小有要求,只有批量大小足够…...

Toaster - Android 吐司框架,专治 Toast 各种疑难杂症
官网 https://github.com/getActivity/Toaster 这可能是性能优、使用简单,支持自定义,不需要通知栏权限的吐司 想了解实现原理的可以点击此链接查看:Toaster 源码 集成步骤 如果你的项目 Gradle 配置是在 7.0 以下,需要在 bui…...

2023年9月26日,历史上的今天大事件早读
1620年9月26日大明皇帝朱常洛驾崩 1815年9月26日俄、普、奥三国在巴黎发表缔结“神圣同盟” 1841年9月26日清代思想家、诗人龚自珍逝世 1849年9月26日“生理学之父”巴甫洛夫诞生 1909年9月26日云南陆军讲武堂创办 1953年9月26日画家徐悲鸿逝世 1980年9月26日国际宇航联合…...
CListCtrl控件为只显示一列,持滚动显示其他,不用SetScrollFlags
CListCtrl控件为只显示一列,持滚动显示其他,不用SetScrollFlags 2023/9/5 下午4:52:58 如果您不希望使用 SetScrollFlags 函数来设置滚动条样式,可以使用以下代码将 CListCtrl 控件设置为只显示一列,并支持滚动显示其他内容: cpp // 设置控件样式和属性 m_listCtrl.Se…...
spring博客实现分页查询
1、首先创建dto下的分页类PageBean package com.zzz.blog.dto;import java.util.List;public class PageBean {private Integer pageSize; //页面大小private Integer currentPage; //当前页private Integer totalCount; //总条数private Integer totalPage; //总页数private …...

代码阅读分析神器-Scitools Understand
这里写目录标题 前言概要功能介绍1.代码统计2.图形化分析3.代码检查 使用方法下载及使用 前言 作为一名程序员,阅读代码是一个必须要拥有的能力,但无奈很多代码逻辑嵌套非常多,看起来非常吃力,看了那段逻辑就忘记了刚才的逻辑&am…...

学霸吐血整理‼《2023 年 IC 验证岗面试真题解析》宝藏干货!
Q1.定宽数组、动态数组、关联数组、队列各自的特点和使用方式。 Q2.fork…join/fork…join_any/fork…join_none 之间的异同 Q3.mailbox、event、semaphore 之间的异同 Q4.(event_handle)和 wait(event_handle.triggered)区别 Q5.task 和 function 异同区别 Q6.使用 clocking b…...
稳定性、可靠性、可用性、灵活性、解耦性
稳定性 平衡的能力 Linux系统的OOM机制、tcp的拥塞控制 可靠性 确定的能力 tcp的ACK、HA机制、加密 可用性 复原的能力 负债均衡、tcp的重传、冗余机制、故障域 灵活性 界限的能力 用户态、restful api、IP地址掩码 解耦性 不依赖的能力 分布式、SDN、容器、操作…...
docker搭建Redis三主三从
docker搭建Redis三主三从 首先启动6个redis进入容器构建主从关系连接进入6381作为切入点,查看集群状态 首先启动6个redis [rootdocker redis-node-1]# cat /etc/hosts 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 …...

亚马逊要求的UL报告的产品标准是什么?如何区分
亚马逊为什么要求电子产品有UL检测报告? 首先,美国是一个对安全要求非常严格的国家,美国本土的所有电子产品生产企业早在很多年前就要求有相关安规检测。 其次,随着亚马逊在全球商业的战略地位不断提高,境外的电子设…...

如何在linux定时备份opengauss数据库(linux核心至少在GLIBC_2.34及以上)
前提环境,linux的核心至少在GLIBC_2.34及以上才能使用。 查看linux的glibc版本的命令如下 strings /lib64/libc.so.6 | grep GLIBC 如下图 或者用ldd --version 如下图 在官网下载对应的依赖包, 只需要这个lib文件即可,将这个包放在lin…...
SkyWalking快速上手(七)——Skywalking UI 界面简介
文章目录 前言1. 仪表盘1.1 指标展示1.2 自定义仪表盘 2. 拓扑图2.1 节点展示2.2 连接展示 3. 追踪3.1 请求链路3.2 请求详情 4. 性能剖析4.1 方法级别性能分析4.2 代码级别性能分析 5. 告警5.1 告警规则设置5.2 告警通知 6. 日志记录6.1 日志展示6.2日志分析6.3代码示例 总结 …...

python+vue驾校驾驶理论考试模拟系统
管理员的主要功能有: 1.管理员输入账户登陆后台 2.个人中心:管理员修改密码和账户信息 3.用户管理:管理员可以对用户信息进行添加,修改,删除,查询 4.添加选择题:管理员可以添加选择题目…...

go-redis 框架基本使用
文章目录 redis使用场景下载框架和连接redis1. 安装go-redis2. 连接redis 字符串操作有序集合操作流水线事务1. 普通事务2. Watch redis使用场景 缓存系统,减轻主数据库(MySQL)的压力。计数场景,比如微博、抖音中的关注数和粉丝数…...

java内嵌浏览器CEF-JAVA、jcef、java chrome
java内嵌浏览器CEF-JAVA、jcef、java chrome jcef是老牌cef的chrome内嵌方案,可以进行java-chrome-h5-桌面开发,下面为最新版本(2023年9月22日10:33:07) JCEF(Java Chromium Embedded Framework)是一个基于…...

日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...

MFC内存泄露
1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...
Robots.txt 文件
什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…...

NFT模式:数字资产确权与链游经济系统构建
NFT模式:数字资产确权与链游经济系统构建 ——从技术架构到可持续生态的范式革命 一、确权技术革新:构建可信数字资产基石 1. 区块链底层架构的进化 跨链互操作协议:基于LayerZero协议实现以太坊、Solana等公链资产互通,通过零知…...

HarmonyOS运动开发:如何用mpchart绘制运动配速图表
##鸿蒙核心技术##运动开发##Sensor Service Kit(传感器服务)# 前言 在运动类应用中,运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据,如配速、距离、卡路里消耗等,用户可以更清晰…...

基于PHP的连锁酒店管理系统
有需要请加文章底部Q哦 可远程调试 基于PHP的连锁酒店管理系统 一 介绍 连锁酒店管理系统基于原生PHP开发,数据库mysql,前端bootstrap。系统角色分为用户和管理员。 技术栈 phpmysqlbootstrapphpstudyvscode 二 功能 用户 1 注册/登录/注销 2 个人中…...

[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG
TrustRAG: Enhancing Robustness and Trustworthiness in RAG [2501.00879] TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation 代码:HuichiZhou/TrustRAG: Code for "TrustRAG: Enhancing Robustness and Trustworthin…...
小木的算法日记-多叉树的递归/层序遍历
🌲 从二叉树到森林:一文彻底搞懂多叉树遍历的艺术 🚀 引言 你好,未来的算法大神! 在数据结构的世界里,“树”无疑是最核心、最迷人的概念之一。我们中的大多数人都是从 二叉树 开始入门的,它…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...
第22节 Node.js JXcore 打包
Node.js是一个开放源代码、跨平台的、用于服务器端和网络应用的运行环境。 JXcore是一个支持多线程的 Node.js 发行版本,基本不需要对你现有的代码做任何改动就可以直接线程安全地以多线程运行。 本文主要介绍JXcore的打包功能。 JXcore 安装 下载JXcore安装包&a…...