RAN-in-the-Cloud:为 5G RAN 提供云经济性
RAN-in-the-Cloud:为 5G RAN 提供云经济性
5G 部署在全球范围内一直在加速。 许多电信运营商已经推出了5G服务并正在快速扩张。 除了电信运营商之外,企业也对使用 5G 建立私有网络产生了浓厚的兴趣,这些私有网络利用了更高的带宽、更低的延迟、网络切片、毫米波和 CBRS 频谱。
5G 的出现恰逢其时。 在过去的二十年里,云计算已经成熟,成为开发人员构建应用程序的首选平台。 云提供了许多优势,包括成熟的软件工具、自动化和编排、业务敏捷性和较低的总拥有成本 (TCO)。
此外,每个细分市场(工业机器人、云游戏、智能城市、安全、零售、自动驾驶、智能农业)的应用都越来越多地使用人工智能 (AI) 来实现变革性体验。 5G、云计算和人工智能的融合将在未来十年推动许多创新。
NVIDIA Aerial SDK 是构建虚拟化无线电接入网络 (vRAN) 的关键技术基础。 它是一种软件定义的完整 5G Layer1 (L1) 卸载,在 NVIDIA GPU 中实现为内联加速。 它还实现了所有 3GPP 和 O-RAN 兼容接口。 包含复杂信号处理算法的 L1 软件在 CUDA C/C++ 中实现,可以轻松优化 L1 算法,实现新功能,并为 5G 演进和 6G 的 RAN 应用提供面向未来的验证。 NVIDIA Aerial SDK 作为具有 E2E 云原生架构的模块化微服务实施,并由 Kubernetes 使用标准的 ORAN SMO 兼容接口进行管理。
从 CloudRAN 到 RAN-in-the-Cloud
最近有很多关于 CloudRAN 的讨论。 作为加速计算平台和云计算领域的行业领导者,NVIDIA 一直走在 CloudRAN 创新的前沿。 许多行业领导者使用术语 CloudRAN 来表示无线电接入网络 (RAN) 的云原生实现。
虽然云原生技术是筹码,但重要的问题是 CloudRAN 是否等同于使用云原生技术。 我们认为事实并非如此。 我们相信真正的云 RAN 将所有计算元素(vDU、vCU 和 dUPF)都部署在云端。 因此,术语 RAN-in-the-Cloud:一个 5G 无线电接入网络作为服务完全托管在多租户云基础设施中。
为什么这种区别很重要,RAN-in-the-Cloud 的动机是什么? 首先,RAN 构成了电信运营商最大的资本支出和运营支出。 它也是最未充分利用的资源,大多数无线电基站的使用率通常低于 50%。 将 RAN 计算迁移到云中可以带来云计算的所有优势:共享云基础设施中的池化和更高利用率,从而最大程度地减少电信运营商的资本支出和运营支出。
具有 GPU 加速器的 COTS 平台不仅可以加速 5G RAN; 它还可以加速边缘人工智能应用程序。 电信运营商和企业越来越多地使用 NVIDIA GPU 服务器来加速边缘 AI 应用程序。 这提供了一种简单的途径,可以使用相同的 GPU 资源来加速 AI 应用程序之外的 5G RAN 连接。 这反过来又降低了 TCO,并为建立企业 5G 网络提供了最佳途径。
多年来,云软件、工具和技术已经成熟,除了可靠性、可观察性和服务保证之外,还带来了大规模自动化、降低能耗、弹性计算和按需自动缩放等优势。
值得注意的是,一些供应商正在为 RAN L1 卸载设计基于专用集成电路 (ASIC) 的固定功能加速器卡。 基于这些基于 ASIC 的加速器构建的 RAN 类似于固定功能设备。 它只能进行 RAN L1 处理,在不使用时是浪费资源。
具有通用 GPU 加速服务器的 NVIDIA Aerial SDK 提供了一个真正的多服务、多租户平台,可用于 5G RAN、企业 AI 和部署在云中的其他边缘应用程序,具有上述所有优势。
云原生作为 RAN-in-the-Cloud 的基础
随着行业加速 5G 部署,实现 5G 的全部商业价值需要可扩展且灵活的解决方案。 将 RAN 软件与硬件分离并使软件在云中可用和可部署有可能推动更快的创新和新的增值服务。
云原生 vDU/vCU RAN 软件套件旨在完全开放和自动化部署和整合操作,支持私有、公共或混合云基础设施上的 3GPP 和 O-RAN 接口。 它利用了云原生架构的优势,包括水平和垂直扩展、自动修复和冗余。 它还针对移动网络演进进行了优化设计,包括 6G 等下一代无线电技术。
NVIDIA Aerial SDK 云原生架构有助于将 RAN 功能实现为由 Kubernetes 编排和管理的容器中的微服务。 模块化软件支持:
- 改进了软件升级、发布和修补的粒度并提高了速度
- 遵循 DevOps 原则的独立生命周期管理,具有持续集成和持续交付 (CI/CD)
- 独立扩展不同的 RAN 微服务元素
- 应用程序级可靠性、可观察性和服务保证
- 通过网络自动化简化操作和维护
为了真正的云原生 RAN 体验,云、边缘平台和网络都需要发展。 在我们看来,许多要求对于云原生容器化 RAN 软件堆栈的商业部署至关重要,包括:
- 时间同步
- CPU 亲和性和隔离
- 拓扑管理和特征发现
- 多个网络接口
- 高性能数据平面和加速硬件
- 低延迟、QoS保证、高吞吐量
- 远程分布式部署
- 零接触配置
- 用于加速器设备的 Kubernetes 运算符框架和生产就绪运算符
NVIDIA GPU Operator 使用 Kubernetes 中的运算符框架来自动管理配置 GPU 所需的所有 NVIDIA 软件组件。 这些组件包括设备驱动程序(以启用 CUDA)、GPU 的 Kubernetes 设备插件、NVIDIA 容器运行时、自动节点标签、基于数据中心 GPU 管理器 (DCGM) 的监控等。
GPU Operator 使 Kubernetes 集群的管理员能够像管理集群中的 CPU 节点一样管理 GPU 节点。 管理员可以依赖 CPU 和 GPU 节点的标准操作系统映像,然后依靠 GPU 操作员为 GPU 提供所需的软件组件,而不是为 GPU 节点提供特殊的操作系统映像。
它利用 Kubernetes CRD 和操作员 SDK,管理与网络相关的组件,以实现与 RDMA 和 NVIDIA GPUDirect 的快速网络连接,以处理 Kubernetes 集群中的工作负载。 网络运营商与 GPU 运营商合作,在兼容系统上启用 GPU 直接 RDMA。 网络运营商的目标是管理网络相关组件,同时在 Kubernetes 集群中执行 RDMA 和 GPU 直接 RDMA 工作负载。
NVIDIA Aerial SDK 基于微服务和云原生架构构建,为构建和部署 5G RAN-in-the-Cloud 奠定了坚实的基础。
在云中构建、部署和管理
O-RAN 联盟计划将传统无线电基站分解为 RRU、vDU 和 vCU 实例,它们之间具有定义明确的接口,从而形成了一个更大的生态系统,提供了供应商选择。 此外,云原生容器化软件支持由 Kubernetes 和 SMO 管理的可组合和自动化 RAN。 云化和托管完整的 RAN 作为云中的服务需要什么?
部署 5G 的经济性一直具有挑战性。 与前几代无线技术相比,5G 正在推动 RAN 资本支出大幅增长。 预计在未来 5 年内,蜂窝基站的数量将增加近一倍。 因此,RAN 资本支出占总体 TCO 的份额从 45-50% 增加到 65%。 更多详情,请参见无线回传演进和5G时代移动网络成本演进。
此外,众所周知,RAN 传统上是针对峰值容量进行配置的,这导致宝贵的计算资源严重未得到充分利用。 突发和时间相关的流量意味着许多传统 RAN 站点的平均运行容量使用率低于 25%。 如果 RAN 可以托管在云中,池化的好处可以减少与节能相关的运营支出并提高使用率。 此外,可以为其他应用程序和工作负载以真正的类似云的方式重新配置未使用的资源。
仅在美国,将 420,000 个基站总数中的 50% 迁移到 GPU 加速云可能会为电信运营商带来重要的新收入机会。 当 RAN 利用率低且 GPU 闲置时,它们可用于多租户云环境中的企业 AI、视频服务和其他边缘应用程序。 这可能会在全球范围内带来数十亿美元的新收入机会。
上图显示了通过使用 NVIDIA GPU 的加速计算基础架构构建的数据中心如何加速许多应用程序,从而提供云经济性和最佳 TCO。
带有 NVIDIA Base Command Platform 和 NVIDIA Fleet Command 软件的 NVIDIA AI Enterprise 使企业能够在 NVIDIA GPU 云中运行 AI 应用程序,利用适用于各个垂直领域的所有预构建和强化软件。 5G 连接作为容器化解决方案与使用相同基础设施的其他 AI 应用程序一起运行对于企业来说将非常强大。 这将改变世界对无线连接的看法。 5G 将成为完全基于云的服务,可以按需部署。 这就是 RAN-in-the-Cloud 的本质。
使用 NVIDIA 构建您的 5G RAN-in-the-Cloud
全新 NVIDIA Spectrum SN3750-SX 开放式以太网交换机是 RAN-in-the-Cloud 解决方案的关键组件。 它基于 NVIDIA Spectrum-2 以太网 ASIC,是有史以来第一款软件定义的 xHaul 交换机,能够提供电信数据中心所需的前传、中传和回传网络。
该交换机的一个关键功能是它可以动态编程以将流量路由到部署在数据中心任何服务器上的任何 vDU,支持自动扩展和按需 RAN 部署。 它是第一个将在同一基础设施上运行电信和人工智能所需的所有功能结合在一起的交换机。 SN3750-SX 支持先进的定时协议,例如电信级精确时间协议 (PTP)、同步以太网 (SyncE) 和 PPS(每秒数据包数),以及动态 RU/DU 映射。
为了实现 AI 训练,该交换机支持低延迟 200G 带宽以实现最高吞吐量。 Spectrum ASIC 带来了创新功能,例如 RoCE(融合以太网上的 RDMA)和自适应路由,所有这些都处于最高网络规模。 需要注意的是,许多应用程序(例如虚拟世界和 AR/VR)都需要支持 PTP 的数据中心。 这将为 RAN-in-the-Cloud 用例铺平道路。 一些网络规模公司已经在他们的数据中心支持 PTP。
配备 NVIDIA A100 Tensor Core GPU 和 NVIDIA BlueField DPU 的 NVIDIA A100X 融合加速器支持完整的内联 5G RAN 卸载。 这为从 4T4R 到大规模 MIMO 32T32R 和 64T64R 的一系列配置提供了市场领先的性能(以每瓦单元密度和每瓦 MHz 层数衡量)。
NVIDIA 正在与各种生态系统合作伙伴合作,以确保其他 O-RAN 软件组件,如 SMO(服务管理和编排)、RIC(RAN 智能控制器)、xApps 和 rApps 针对 NVIDIA Aerial SDK 进行了优化,并为 RAN-in- 云部署。 这些组件仍处于早期开发阶段,但将成为关键的差异化因素,因为它们将 AI 用于 RAN 自动化和可编程性。 虽然 RAN-in-the-Cloud 需要一些时间才能成熟,但我们相信 NVIDIA 将以 NVIDIA GPU 加速平台为基础站在这一创新的前沿。
总结
RAN-in-the-Cloud 是未来。 这是无线市场的自然演变和下一步。 使用云原生技术构建的 vRAN 是必要的第一步。 实现 5G RAN 的云经济并推动 5G 与边缘 AI 应用的共同创新需要拥抱 RAN-in-the-Cloud。 NVIDIA Aerial SDK 提供可扩展的云原生软件架构,作为 RAN-in-the-Cloud 的基础技术。
最后,需要注意的是,RAN 转型才刚刚开始。 使用 AI 来优化复杂的信号处理算法将在未来几年释放出一系列全新的创新。 GPU 加速平台是让您的投资永不过时的最佳方法。 如果您想与我们合作构建创新的 RAN-in-the-Cloud 解决方案,请联系我们。 有关详细信息,请参阅 NVIDIA AI-on-5G 平台。
相关文章:

RAN-in-the-Cloud:为 5G RAN 提供云经济性
RAN-in-the-Cloud:为 5G RAN 提供云经济性 5G 部署在全球范围内一直在加速。 许多电信运营商已经推出了5G服务并正在快速扩张。 除了电信运营商之外,企业也对使用 5G 建立私有网络产生了浓厚的兴趣,这些私有网络利用了更高的带宽、更低的延迟…...
vector、list、queue
引用:windows程序员面试指南 vector vector 类似于C语言中的数组 vector 支持随机访问,访问某个元素的时间复杂度 O(1) vector 插入和删除元素效率较低,时间复杂度O(n) vector 是连续存储,没有内存碎片,空间利用率高…...
操作系统面经
进程与线程区别 1.进程是资源分配的最小单位,线程是程序执行的最小单位(资源调度的最小单位) 2.进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数…...

一天约了4个面试,复盘一下面试题和薪资福利
除了最新的面经分享,还有字节大佬的求职面试答疑,告诉你关键问题是什么?少走弯路。**另外本文也汇总了6份大厂面试题:字节、腾讯、小米、腾讯云、滴滴、小米游戏。**希望对大家有帮助。 前言 昨天我的交流群里,有位宝…...

详解单链表(内有精美图示哦)
全文目录引言链表链表的定义与结构链表的分类单链表的实现及对数据的操作单链表的创建与销毁创建销毁单链表的打印单链表的头插与头删头插头删单链表的尾插与尾删尾插尾删单链表的查找单链表在pos位置后插入/删除插入删除单链表在pos位置插入/删除插入删除总结引言 在上一篇文…...
csdn文章导航
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注…...

【Spring】掌握 Spring Validation 数据校验
个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ Spring Validation 数据校验一、什么是 Spring…...
定语 从句
回顾能作定语的成分 形容词:She is a responsible girl.她是一个负责任的姑娘。(前置定语) The girl responsible was expelled.对此负责的姑娘被开除了。(后置定语) 代词:Whose f…...

【数据可视化工具】浅谈 DataEase 和 FineBI 支持的数据源
前言最近对市面上比较火热的数据可视化工具 DataEase 和 FineBI 进行了调研,在支持的数据源方面感觉不太一样,所以就有了这篇文章,话不多说,我们一起来看一下吧!以下的内容,大多来自两个工具的官方文档&…...
100种思维模型之上帝视角思维模型-025
惊奇、愤怒、郁闷,我们觉得生活不精彩,事情乱作一团,但这仅仅是视角问题而已。 换个视角,可以看到不同的世界。 “上帝视角思维模型”,即以一个更高、更客观、更理性的角度来看问题,从而做出理性的决策。 …...
从这5个方面,总结我当PM的第一年
以下5个方面(学习、思考、沟通、执行、产品)的分享,都是我站在巨人的肩膀上,结合自己所学所做总结而来;同时,我也继续学习,不断完善这些知识。如有不当,欢迎大家指正~一、学习&#…...

ChatGPT可以作为一个翻译器吗?
论文地址:https://arxiv.org/abs/2301.08745.pdf 背景 自从OpenAI2022年11月30日发布ChatGPT以来,基本上把NLP所有任务大统一了,那么在机器翻译的表现到底如何呢?腾讯AI Lab在翻译Prompt、多语言翻译以及翻译鲁棒性三方面做了一…...

详述java的设计模式(三)
1.装饰者模式 装饰者模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其结构。这种类型的设计模式属于结构型模式,它是作为现有的类的一个包装。 使用场景: 在不影响其他对象的情况下ÿ…...
Linux命令·pwd
Linux中用 pwd 命令来查看”当前工作目录“的完整路径。 简单得说,每当你在终端进行操作时,你都会有一个当前工作目录。 在不太确定当前位置时,就会使用pwd来判定当前目录在文件系统内的确切位置。1.命令格式:pwd [选项…...

以图搜图服务快速搭建
以图搜图服务快速搭建 电商公司,管理的商品少则几千,多则上百万。如何帮助用户从多如牛毛的商品中找到类似的商品就成了问题。 以图搜图就可以很好的帮助解决这个问题,通过 Towhee(resnet50 模型) Milvus 如何实现本…...

【TensorFlow安装踩坑记录】
TensorFlow安装踩坑记录第一步,切换服务器cuda版本第二步,conda安装tensorflow记录一下最近安装Tensorflow v1时遇到的问题和解决办法第一步,切换服务器cuda版本 首先我想安装tensorflow 1.13.1,兼容的cuda版本是10.0,…...
03.03回溯法
class Solution { public:vector<int> temp;vector<vector<int>> ans;void dfs(int cur,int n,int k){//剪枝 temp 长度加上区间 [cur, n] 的长度小于 k,不可能构造出长度为 k 的 tempif(temp.size()(n-cur1)<k){return;}if(temp.size()k){ans…...

I.MX6ULL内核开发0:linux内核模块
目录 简要 一、内核模块的概念 二、内核模块加载、卸载过程 简要 1、内核模块的概念 2、内核模块的原理:内核模块在内核的加载、卸载过程。 一、内核模块的概念 内核,是一个操作系统的核心。是基于硬件的第一层软件扩充,提供操作系统的最…...

qsort快速排序的实现以及模拟实现qsort的功能(狠狠的拿捏)
当你为错过太阳而哭泣的时候,你也要再错过群星了。 --泰戈尔 目录 一.qsort快速排序的实现 二.模拟实现一个qsort功能的函数 一.qsort快速排序的实现 下面是 qsort() 函数的声明: void qsort(void *base, size_t nitems, size_t size, int (…...

[Java·算法·中等]LeetCode215. 数组中的第K个最大元素
每天一题,防止痴呆题目示例分析思路1题解1分析思路2题解2分析思路3题解3👉️ 力扣原文 题目 给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。 请注意,你需要找的是数组排序后的第 k 个最大的元素,而不…...

大型活动交通拥堵治理的视觉算法应用
大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动(如演唱会、马拉松赛事、高考中考等)期间,城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例,暖城商圈曾因观众集中离场导致周边…...

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)
服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
JVM垃圾回收机制全解析
Java虚拟机(JVM)中的垃圾收集器(Garbage Collector,简称GC)是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象,从而释放内存空间,避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...

Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
unix/linux,sudo,其发展历程详细时间线、由来、历史背景
sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...
Android第十三次面试总结(四大 组件基础)
Activity生命周期和四大启动模式详解 一、Activity 生命周期 Activity 的生命周期由一系列回调方法组成,用于管理其创建、可见性、焦点和销毁过程。以下是核心方法及其调用时机: onCreate() 调用时机:Activity 首次创建时调用。…...
C++.OpenGL (14/64)多光源(Multiple Lights)
多光源(Multiple Lights) 多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...

GO协程(Goroutine)问题总结
在使用Go语言来编写代码时,遇到的一些问题总结一下 [参考文档]:https://www.topgoer.com/%E5%B9%B6%E5%8F%91%E7%BC%96%E7%A8%8B/goroutine.html 1. main()函数默认的Goroutine 场景再现: 今天在看到这个教程的时候,在自己的电…...
MySQL 索引底层结构揭秘:B-Tree 与 B+Tree 的区别与应用
文章目录 一、背景知识:什么是 B-Tree 和 BTree? B-Tree(平衡多路查找树) BTree(B-Tree 的变种) 二、结构对比:一张图看懂 三、为什么 MySQL InnoDB 选择 BTree? 1. 范围查询更快 2…...