智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚至是遗留的虚拟机环境)协同去发挥和实现 AI 价值,这其中的异构算力、复杂的工程化工作,可能反而会造成新的烟囱式系统,以及 AI 算力资源的浪费。此外,运维团队面临“新旧相融”的难题,即新旧应用无法平滑衔接、统一管理,新旧IT资产无法无缝相容、统一调度。
更加灵活的智算时代,云基础设施需要可继承、可演进
当前很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,设备微调就必须从上至下重新适配,牵一发而动全身,无法快速响应新技术的演进升级。
针对时下 AI 大模型爆发,对基础设施算力性能、灵活性以及成本的需求,浪潮云海提出了“可继承、可演进”的私有云理念。其中可继承即私有云建设要能够继承过去的IT资产和运维能力,包括客户数据中心的硬件、软件等大量基础设施,长年累月的信息化和数字化投资等资产,还包括知识经验、人员组织和流程体系等IT运维能力。
而可演进即面向日趋增强的技术不确定性,私有云要具备持续进化的能力,以满足日益增长的创新应用需求。架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI 等);从最小 3 节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一 CPU 架构扩展到多 CPU 架构,从通用算力扩展到 AI 算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人肉运维,到半自动、全自动 AIops 运维;业务可靠性从单点单中心可靠,到多中心高可靠。

具体从存储、计算、服务、应用四层来说,具备可演进能力的私有云需要具备三大特征:分层解耦、开放标准和一云多芯,可以实现在异构算力需求下各层可形成共识标准,并独立演进迭代。具体来说:
一、在存储层,实现多协议融合,广泛兼容 ISCSI、iSER、NVME over RoCE、FC、FC-NVMe 等主流存储协议,实现各主流品牌存储的兼容利旧;业务创新,支持同品牌或不同品牌、集中式存储或分布式存储间的跨站点容灾。
二、在计算层的一云多芯,充分考虑底层算力设施框架的灵活性,同时支持多类型计算资源,不同的应用匹配不同的计算资源。另外跨算力共享的存储池和网络池,减少网络转发路径,降低建设成本与维护成本。
三、在服务层,浪潮数据云计算方案总监刘健表示,在实际数据中心部署中,行业云中 IaaS 层已分层解耦,但 PaaS 层仍有被云厂商或应用提供商锁定的情况。浪潮云海提出服务层分层共建,其中 PaaS 层通用能力下沉,以容器技术为核心构建敏捷的云原生 iPaaS 底座,满足服务标准化、多样性需求。另外联合共建个性化的能力,个性化能力可以上移,强行业属性的应用交给专业公司共建,实现一云多库、一云多服。
四、在应用层则是开放生态的技术框架和理念,从规划、到方案、集成、交付、售后,全面联合各类生态伙伴,实现行业数字化转型。
浪潮云海 InCloud OS V8 新一代架构平台,实现 IT 资源可继承、可演进
基于可继承可演进的核心理念,浪潮云海发布了新一代架构平台——InCloud OS V8,其产品能力与四层可参考架构一一对应,支撑可演进需求:
- 存储层:文件系统,存储多协议,支持 NVMe-OF,支持 ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储;
- 计算层:一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;
- 服务层:1、对底层资源的便捷供给,2、工具化能力,在云平台上基于标准模板发布 PaaS 服务,快速嵌入云平台,3、上层管理平台,对日志、监控、运维、用户统一管理;
- 应用层:则是以第三方伙伴服务为主。
浪潮云海根据服务客户的实践经验,总结形成了分布式云、容灾备份、安全云、云替换、智算中心、云原生六大场景解决方案,基本满足了各类应用场景对底层基础设施的需求。具体来看,
- 分布式云解决方案:面向多分支机构场景,满足多级云(省市多级云、集团分支多级云)、异构云、多厂商云、云边(中心云、边缘云)统一管理需求。
- 容灾备份解决方案:面向两地三中心场景,满足客户业务对高可靠的要求,可提供本地备份、同城双活、异地灾备等服务。
- 安全云解决方案:面向安全合规场景,提供满足各类安全测评标准的服务套餐。
- 云替换解决方案:为 VMware 替换、公有云下云等场景提供跨云迁移方案。
- 智算中心解决方案:面向智算中心场景,提供 GPU 整机租赁、AI 开发、AI 训练、大数据等服务,支撑智算中心算力运营。打造从基础设施、算法工具、智能平台到模型服务的 AI 赋能产业生态
- 云原生解决方案:面向以容器技术为支撑的云原生创新应用场景提供开发测试、微服务治理、DevOps 解决方案,方便业务云原生转型,是推动企业数字化转型的最佳工具。
从大模型落地带来实效,到多元算力需求下智算基础设施的发展,智算时代正在真实到来。灵活、高效的算力资源,将是一切智能化发展的基础,CSDN 将持续关注智算技术领域的最新资讯。
相关文章:
智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚…...
LDF、DBC、BIN、HEX、S19、BLF、ARXML、slx等
文章目录 如题 如题 LDF是LIN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 DBC是CAN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 BIN文件烧录在BOOT里面(stm32),…...
因为使用ArrayList.removeAll(List list)导致的机器重启
背景 先说一下背景,博主所在的业务组有一个核心系统,需要同步两个不同数据源给过来的数据到redis中,但是每次同步之前需要过滤掉一部分数据,只存储剩下的数据。每次同步的数据与需要过滤掉的数据量级大概在0-100w的数据不等。 由…...
Let‘s Encrypt
创建文件夹 mkdir /usr/local/develop/ 安装Certbot客户端 yum install certbot 首先确保example.com和www.example.com这两个域名通过DNS解析绑定了你的web 服务器的公网 IP 就是说先要完成域名解析到服务器 下面命令会验证 /var/www/example 他会将一些命令文件存在…...
C语言 | Leetcode C语言题解之第24题两两交换链表中的节点
题目: 题解: struct ListNode* swapPairs(struct ListNode* head) {struct ListNode dummyHead;dummyHead.next head;struct ListNode* temp &dummyHead;while (temp->next ! NULL && temp->next->next ! NULL) {struct ListNod…...
【LeetCode热题100】【回溯】电话号码的字母组合
题目链接:17. 电话号码的字母组合 - 力扣(LeetCode) 组合的过程是一个长树的过程,可以用深度遍历实现,每一个数字对应的字符串都是一层,一种字母组合就是一条路径,当递归的深度达到层数就找到了…...
解析mysql的DDL语句生成高斯内表及表字段主键配置
mysql的DDL语句如下: CREATE TABLE gg_zr (id bigint(20) NOT NULL COMMENT 责任信息表主键id,zrdm varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 责任代码,zrmc varchar(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAU…...
ANSYS Electromagnetics Suite 2023 R2 三维电磁(EM)仿真软件下载
Ansys家最新的三维电磁(EM)仿真软件ANSYS Electromagnetics Suite 2023 R2日前发布了,老wu这次分享得有点晚  ̄ω ̄,现在已经将资源上传到了网盘供大家免费下载,同时,为了让大家都能与…...
pbootcms百度推广链接打不开显示404错误页面
PbootCMS官方在2023年4月21日的版本更新中(对应V3.2.5版本),对URL参数添加了如下判断 if(stripos(URL,?) ! false && stripos(URL,/?tag) false && stripos(URL,/?page) false && stripos(URL,/?ext_) false…...
springboot 整合 swagger2
整合步骤 pom 添加依赖 <dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger2</artifactId><version>2.9.2</version></dependency><dependency><groupId>io.springfox</groupId>&…...
redis-缓存穿透与雪崩
一,缓存穿透(查不到) 在默认情况下,用户请求数据时,会先在缓存(Redis)中查找,若没找到即缓存未命中,再在数据库中进行查找,数量少可能问题不大,可是一旦大量的请求数据&a…...
K8S临时存储-本地存储-PV和PVC的使用-动态存储(StorageClass)
介绍 容器中的文件在磁盘上是临时存放的,当容器崩溃或停止时容器上面的数据未保存, 因此在容器生命周期内创建或修改的所有文件都将丢失。 在崩溃期间,kubelet 会以干净的状态重新启动容器。 当多个容器在一个 Pod 中运行并且需要共享文件时…...
jeecg-boot安装
我看大家都挺关注,所以集中上传了下代码和相关工具,方便大家快速完成 链接:https://pan.baidu.com/s/1-Y9yHVZ-4DQFDjPBWUk4-A 提取码:op1r 1. 下载代码 下载地址 : JEECG官方网站 - 基于BPM的低代码开发平台(低代码平台_零代…...
Unity面经(自整)——移动开发与Shader
Unity与Android混合开发 为什么使用Flutter构建 Flutter 是 Google 的开源工具包,用于从单个代码库为移动、Web、桌面和嵌入式设备构建应用程序(一套代码跨平台构建app是它最大的优点),并且可以构建高性能、稳定和丰富UI的应用程…...
Nginx实现反向代理、负载均衡、动静分离
1. 什么是Nginx的反向代理? Nginx的反向代理是指Nginx作为服务器的前端,接收客户端的请求,然后将请求转发给后端的真实服务器,并将真实服务器的响应返回给客户端。这种代理方式使得客户端并不知道真实服务器的存在,它…...
【Linux】网络基础(一)
文章目录 一、计算机网络背景1. 网络发展2. 认识“协议” 二、网络协议初识1. 协议分层2. OSI七层模型3. TCP/IP五层(或四层)模型 三、网络传输基本流程1. 同局域网的两台主机通信数据包封装和分用封装分用 2. 跨网络的两台主机通信 四、网络中的地址管理…...
前端小白学习Vue框架(二)
一.属性计算、属性监听、属性过滤 1.认识MVVM V (用户视图界面)通过VM (应用程序) 向Model(数据模型) 取值与赋值的过程! 数据双向绑定 视图改变更新数据,数据改变更新视图 2.属性计算 //在vue实例中通过computed去计算new …...
飞书api增加权限
1,进入飞书开发者后台:飞书开放平台 给应用增加权限 2,进入飞书管理后台 https://fw5slkpbyb3.feishu.cn/admin/appCenter/audit 审核最新发布的版本 如果还是不行,则需要修改数据权限,修改为全部成员可修改。 改完…...
CSS3 平面 2D 变换+CSS3 过渡
个人主页:学习前端的小z 个人专栏:HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 ✍一、CSS3 平面 2D 变换💎1 坐标轴💎2 transform 语法…...
【Jenkins】Jenkins自动化工具介绍
目录 技术背景常规的手动打包步骤 Jenkins简介起源与发展Jenkins的核心价值1.自动化1.1代码构建1.2测试自动化1.3自动部署 2.持续集成与持续部署CI/CD的概念如何减少集成问题更快速地发布软件版本 Jenkins优势Jenkins的主要竞争对手Travis CI:CircleCI:GitLab CI: Jenkins与其他…...
抖音增长新引擎:品融电商,一站式全案代运营领跑者
抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...
tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...
【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪 宝可梦GO游戏自组网系统
目录 游戏说明《宝可梦 Mesh GO》 —— 局域宝可梦探索Pokmon GO 类游戏核心理念应用场景Mesh 特性 宝可梦玩法融合设计游戏构想要素1. 地图探索(基于物理空间 广播范围)2. 野生宝可梦生成与广播3. 对战系统4. 道具与通信5. 延伸玩法 安全性设计 技术选…...
使用LangGraph和LangSmith构建多智能体人工智能系统
现在,通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战,比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。 在这篇博客〔原作者&a…...
区块链技术概述
区块链技术是一种去中心化、分布式账本技术,通过密码学、共识机制和智能合约等核心组件,实现数据不可篡改、透明可追溯的系统。 一、核心技术 1. 去中心化 特点:数据存储在网络中的多个节点(计算机),而非…...
6.9-QT模拟计算器
源码: 头文件: widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QMouseEvent>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);…...
【免费数据】2005-2019年我国272个地级市的旅游竞争力多指标数据(33个指标)
旅游业是一个城市的重要产业构成。旅游竞争力是一个城市竞争力的重要构成部分。一个城市的旅游竞争力反映了其在旅游市场竞争中的比较优势。 今日我们分享的是2005-2019年我国272个地级市的旅游竞争力多指标数据!该数据集源自2025年4月发表于《地理学报》的论文成果…...
Python环境安装与虚拟环境配置详解
本文档旨在为Python开发者提供一站式的环境安装与虚拟环境配置指南,适用于Windows、macOS和Linux系统。无论你是初学者还是有经验的开发者,都能在此找到适合自己的环境搭建方法和常见问题的解决方案。 快速开始 一分钟快速安装与虚拟环境配置 # macOS/…...
PydanticAI快速入门示例
参考链接:https://ai.pydantic.dev/#why-use-pydanticai 示例代码 from pydantic_ai import Agent from pydantic_ai.models.openai import OpenAIModel from pydantic_ai.providers.openai import OpenAIProvider# 配置使用阿里云通义千问模型 model OpenAIMode…...
Qt的学习(二)
1. 创建Hello Word 两种方式,实现helloworld: 1.通过图形化的方式,在界面上创建出一个控件,显示helloworld 2.通过纯代码的方式,通过编写代码,在界面上创建控件, 显示hello world; …...
