智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚至是遗留的虚拟机环境)协同去发挥和实现 AI 价值,这其中的异构算力、复杂的工程化工作,可能反而会造成新的烟囱式系统,以及 AI 算力资源的浪费。此外,运维团队面临“新旧相融”的难题,即新旧应用无法平滑衔接、统一管理,新旧IT资产无法无缝相容、统一调度。
更加灵活的智算时代,云基础设施需要可继承、可演进
当前很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,设备微调就必须从上至下重新适配,牵一发而动全身,无法快速响应新技术的演进升级。
针对时下 AI 大模型爆发,对基础设施算力性能、灵活性以及成本的需求,浪潮云海提出了“可继承、可演进”的私有云理念。其中可继承即私有云建设要能够继承过去的IT资产和运维能力,包括客户数据中心的硬件、软件等大量基础设施,长年累月的信息化和数字化投资等资产,还包括知识经验、人员组织和流程体系等IT运维能力。
而可演进即面向日趋增强的技术不确定性,私有云要具备持续进化的能力,以满足日益增长的创新应用需求。架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI 等);从最小 3 节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一 CPU 架构扩展到多 CPU 架构,从通用算力扩展到 AI 算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人肉运维,到半自动、全自动 AIops 运维;业务可靠性从单点单中心可靠,到多中心高可靠。
具体从存储、计算、服务、应用四层来说,具备可演进能力的私有云需要具备三大特征:分层解耦、开放标准和一云多芯,可以实现在异构算力需求下各层可形成共识标准,并独立演进迭代。具体来说:
一、在存储层,实现多协议融合,广泛兼容 ISCSI、iSER、NVME over RoCE、FC、FC-NVMe 等主流存储协议,实现各主流品牌存储的兼容利旧;业务创新,支持同品牌或不同品牌、集中式存储或分布式存储间的跨站点容灾。
二、在计算层的一云多芯,充分考虑底层算力设施框架的灵活性,同时支持多类型计算资源,不同的应用匹配不同的计算资源。另外跨算力共享的存储池和网络池,减少网络转发路径,降低建设成本与维护成本。
三、在服务层,浪潮数据云计算方案总监刘健表示,在实际数据中心部署中,行业云中 IaaS 层已分层解耦,但 PaaS 层仍有被云厂商或应用提供商锁定的情况。浪潮云海提出服务层分层共建,其中 PaaS 层通用能力下沉,以容器技术为核心构建敏捷的云原生 iPaaS 底座,满足服务标准化、多样性需求。另外联合共建个性化的能力,个性化能力可以上移,强行业属性的应用交给专业公司共建,实现一云多库、一云多服。
四、在应用层则是开放生态的技术框架和理念,从规划、到方案、集成、交付、售后,全面联合各类生态伙伴,实现行业数字化转型。
浪潮云海 InCloud OS V8 新一代架构平台,实现 IT 资源可继承、可演进
基于可继承可演进的核心理念,浪潮云海发布了新一代架构平台——InCloud OS V8,其产品能力与四层可参考架构一一对应,支撑可演进需求:
- 存储层:文件系统,存储多协议,支持 NVMe-OF,支持 ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储;
- 计算层:一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;
- 服务层:1、对底层资源的便捷供给,2、工具化能力,在云平台上基于标准模板发布 PaaS 服务,快速嵌入云平台,3、上层管理平台,对日志、监控、运维、用户统一管理;
- 应用层:则是以第三方伙伴服务为主。
浪潮云海根据服务客户的实践经验,总结形成了分布式云、容灾备份、安全云、云替换、智算中心、云原生六大场景解决方案,基本满足了各类应用场景对底层基础设施的需求。具体来看,
- 分布式云解决方案:面向多分支机构场景,满足多级云(省市多级云、集团分支多级云)、异构云、多厂商云、云边(中心云、边缘云)统一管理需求。
- 容灾备份解决方案:面向两地三中心场景,满足客户业务对高可靠的要求,可提供本地备份、同城双活、异地灾备等服务。
- 安全云解决方案:面向安全合规场景,提供满足各类安全测评标准的服务套餐。
- 云替换解决方案:为 VMware 替换、公有云下云等场景提供跨云迁移方案。
- 智算中心解决方案:面向智算中心场景,提供 GPU 整机租赁、AI 开发、AI 训练、大数据等服务,支撑智算中心算力运营。打造从基础设施、算法工具、智能平台到模型服务的 AI 赋能产业生态
- 云原生解决方案:面向以容器技术为支撑的云原生创新应用场景提供开发测试、微服务治理、DevOps 解决方案,方便业务云原生转型,是推动企业数字化转型的最佳工具。
从大模型落地带来实效,到多元算力需求下智算基础设施的发展,智算时代正在真实到来。灵活、高效的算力资源,将是一切智能化发展的基础,CSDN 将持续关注智算技术领域的最新资讯。
相关文章:

智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台
从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚…...

LDF、DBC、BIN、HEX、S19、BLF、ARXML、slx等
文章目录 如题 如题 LDF是LIN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 DBC是CAN报文格式文件,把这个直接拖到软件里面,可以发报文和接收报文 BIN文件烧录在BOOT里面(stm32),…...

因为使用ArrayList.removeAll(List list)导致的机器重启
背景 先说一下背景,博主所在的业务组有一个核心系统,需要同步两个不同数据源给过来的数据到redis中,但是每次同步之前需要过滤掉一部分数据,只存储剩下的数据。每次同步的数据与需要过滤掉的数据量级大概在0-100w的数据不等。 由…...

Let‘s Encrypt
创建文件夹 mkdir /usr/local/develop/ 安装Certbot客户端 yum install certbot 首先确保example.com和www.example.com这两个域名通过DNS解析绑定了你的web 服务器的公网 IP 就是说先要完成域名解析到服务器 下面命令会验证 /var/www/example 他会将一些命令文件存在…...

C语言 | Leetcode C语言题解之第24题两两交换链表中的节点
题目: 题解: struct ListNode* swapPairs(struct ListNode* head) {struct ListNode dummyHead;dummyHead.next head;struct ListNode* temp &dummyHead;while (temp->next ! NULL && temp->next->next ! NULL) {struct ListNod…...
【LeetCode热题100】【回溯】电话号码的字母组合
题目链接:17. 电话号码的字母组合 - 力扣(LeetCode) 组合的过程是一个长树的过程,可以用深度遍历实现,每一个数字对应的字符串都是一层,一种字母组合就是一条路径,当递归的深度达到层数就找到了…...
解析mysql的DDL语句生成高斯内表及表字段主键配置
mysql的DDL语句如下: CREATE TABLE gg_zr (id bigint(20) NOT NULL COMMENT 责任信息表主键id,zrdm varchar(32) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 责任代码,zrmc varchar(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAU…...

ANSYS Electromagnetics Suite 2023 R2 三维电磁(EM)仿真软件下载
Ansys家最新的三维电磁(EM)仿真软件ANSYS Electromagnetics Suite 2023 R2日前发布了,老wu这次分享得有点晚  ̄ω ̄,现在已经将资源上传到了网盘供大家免费下载,同时,为了让大家都能与…...

pbootcms百度推广链接打不开显示404错误页面
PbootCMS官方在2023年4月21日的版本更新中(对应V3.2.5版本),对URL参数添加了如下判断 if(stripos(URL,?) ! false && stripos(URL,/?tag) false && stripos(URL,/?page) false && stripos(URL,/?ext_) false…...

springboot 整合 swagger2
整合步骤 pom 添加依赖 <dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger2</artifactId><version>2.9.2</version></dependency><dependency><groupId>io.springfox</groupId>&…...

redis-缓存穿透与雪崩
一,缓存穿透(查不到) 在默认情况下,用户请求数据时,会先在缓存(Redis)中查找,若没找到即缓存未命中,再在数据库中进行查找,数量少可能问题不大,可是一旦大量的请求数据&a…...
K8S临时存储-本地存储-PV和PVC的使用-动态存储(StorageClass)
介绍 容器中的文件在磁盘上是临时存放的,当容器崩溃或停止时容器上面的数据未保存, 因此在容器生命周期内创建或修改的所有文件都将丢失。 在崩溃期间,kubelet 会以干净的状态重新启动容器。 当多个容器在一个 Pod 中运行并且需要共享文件时…...

jeecg-boot安装
我看大家都挺关注,所以集中上传了下代码和相关工具,方便大家快速完成 链接:https://pan.baidu.com/s/1-Y9yHVZ-4DQFDjPBWUk4-A 提取码:op1r 1. 下载代码 下载地址 : JEECG官方网站 - 基于BPM的低代码开发平台(低代码平台_零代…...

Unity面经(自整)——移动开发与Shader
Unity与Android混合开发 为什么使用Flutter构建 Flutter 是 Google 的开源工具包,用于从单个代码库为移动、Web、桌面和嵌入式设备构建应用程序(一套代码跨平台构建app是它最大的优点),并且可以构建高性能、稳定和丰富UI的应用程…...
Nginx实现反向代理、负载均衡、动静分离
1. 什么是Nginx的反向代理? Nginx的反向代理是指Nginx作为服务器的前端,接收客户端的请求,然后将请求转发给后端的真实服务器,并将真实服务器的响应返回给客户端。这种代理方式使得客户端并不知道真实服务器的存在,它…...

【Linux】网络基础(一)
文章目录 一、计算机网络背景1. 网络发展2. 认识“协议” 二、网络协议初识1. 协议分层2. OSI七层模型3. TCP/IP五层(或四层)模型 三、网络传输基本流程1. 同局域网的两台主机通信数据包封装和分用封装分用 2. 跨网络的两台主机通信 四、网络中的地址管理…...
前端小白学习Vue框架(二)
一.属性计算、属性监听、属性过滤 1.认识MVVM V (用户视图界面)通过VM (应用程序) 向Model(数据模型) 取值与赋值的过程! 数据双向绑定 视图改变更新数据,数据改变更新视图 2.属性计算 //在vue实例中通过computed去计算new …...

飞书api增加权限
1,进入飞书开发者后台:飞书开放平台 给应用增加权限 2,进入飞书管理后台 https://fw5slkpbyb3.feishu.cn/admin/appCenter/audit 审核最新发布的版本 如果还是不行,则需要修改数据权限,修改为全部成员可修改。 改完…...

CSS3 平面 2D 变换+CSS3 过渡
个人主页:学习前端的小z 个人专栏:HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 ✍一、CSS3 平面 2D 变换💎1 坐标轴💎2 transform 语法…...

【Jenkins】Jenkins自动化工具介绍
目录 技术背景常规的手动打包步骤 Jenkins简介起源与发展Jenkins的核心价值1.自动化1.1代码构建1.2测试自动化1.3自动部署 2.持续集成与持续部署CI/CD的概念如何减少集成问题更快速地发布软件版本 Jenkins优势Jenkins的主要竞争对手Travis CI:CircleCI:GitLab CI: Jenkins与其他…...

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)
说明: 想象一下,你正在用eNSP搭建一个虚拟的网络世界,里面有虚拟的路由器、交换机、电脑(PC)等等。这些设备都在你的电脑里面“运行”,它们之间可以互相通信,就像一个封闭的小王国。 但是&#…...
在软件开发中正确使用MySQL日期时间类型的深度解析
在日常软件开发场景中,时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志,到供应链系统的物流节点时间戳,时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库,其日期时间类型的…...

聊聊 Pulsar:Producer 源码解析
一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台,以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中,Producer(生产者) 是连接客户端应用与消息队列的第一步。生产者…...

2.Vue编写一个app
1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template> <!--html--> </template>…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...

selenium学习实战【Python爬虫】
selenium学习实战【Python爬虫】 文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装 四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码 五、报告文件爬取5.1 提…...

基于TurtleBot3在Gazebo地图实现机器人远程控制
1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

深度学习水论文:mamba+图像增强
🧀当前视觉领域对高效长序列建模需求激增,对Mamba图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。 🧀因此短时间内,就有不…...
【Android】Android 开发 ADB 常用指令
查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...
关于uniapp展示PDF的解决方案
在 UniApp 的 H5 环境中使用 pdf-vue3 组件可以实现完整的 PDF 预览功能。以下是详细实现步骤和注意事项: 一、安装依赖 安装 pdf-vue3 和 PDF.js 核心库: npm install pdf-vue3 pdfjs-dist二、基本使用示例 <template><view class"con…...