当前位置: 首页 > article >正文

CXL UIO Direct P2P学习

前言:

在CXL协议中,UIO(Unordered Input/Output) 是一种支持设备间直接通信(Peer-to-Peer, P2P)的机制,旨在绕过主机CPU或内存的干预,降低延迟并提升效率。以下是UIO的核心概念及UIO Direct P2P 的详细解析:

1. UIO(Unordered Input/Output)的核心定义

● 目标场景:允许CXL设备(如加速器、内存扩展设备)直接访问其他设备的HDM(Host-Managed Device Memory)或主机内存,无需通过主机CPU中转。
● 关键能力:
○ HDM访问:通过UIO路径直接读写远端设备的HDM。
○ 路由机制:依赖CXL交换机和主机桥(Host Bridge)的路由能力。
○ 交织(Interleave)支持:支持跨多个HDM设备的交织内存访问。

2. UIO Direct P2P的机制

(1) 硬件支持

● 设备能力声明:
○ CXL.mem设备通过HDM Decoder Capability寄存器的UIO Capable位声明支持UIO请求(见CXL规范8.2.4.20.1)如下图所示。
在这里插入图片描述


○ CXL交换机和主机桥需支持UIO路径的路由,并在其HDM解码器中声明该能力。
● 路由规则:
○ 同虚拟层级(VH):UIO请求可在同一虚拟层级(Virtual Hierarchy)内直接路由到目标HDM。
○ 跨层级/根端口:需通过主机桥路由到其他根端口下的HDM或主机内存。

(2) 交织集(Interleave Set)限制

● 合法交织方式:
○ UIO Direct P2P仅支持1/2/4/8/16路交织的HDM集。
○ 禁止的交织方式:3/6/12路交织的HDM集不能作为UIO目标。
● 地址分配约束:
○ HDM地址必须从CFMWS(CXL Fixed Memory Window Structure) 中分配,且使用标准模运算交织算法(Interleave Arithmetic = Standard Modulo)。

(3) 软件配置流程

1. 路径验证:

○ 软件需检查从UIO请求者到目标HDM路径上的所有设备(交换机、主机桥)是否支持UIO。

2. 解码器配置:

○ 在交换机和主机桥的HDM解码器中设置UIO Capable位。
○ 配置交织参数(UIG、UIW、ISP字段),确保交换机/主机桥能正确解析UIO目标地址。

3. 安全与隔离:

○ UIO路径不依赖Selective IDE Streams保护,需通过其他机制(如PID隔离)确保安全性。

3. UIO Direct P2P的示例(图9-25解析)

在这里插入图片描述

● 场景描述:
○ 4个CXL.mem设备组成3个独立的交织集。
○ UIO请求者(如GPU)直接访问不同交织集的HDM:
■ UIO Target 1 & 2:2路交织集,通过Switch直接路由。
■ UIO Target 3 & 4:需通过主机桥路由到主机内存或其他根端口下的HDM。
● 优势:
○ 绕过主机CPU,减少访问延迟。
○ 支持高效的交织内存访问(如大块数据并行读写)。

4. UIO Direct P2P的技术约束

● 地址映射限制:
○ 目标HDM地址必须在CFMWS窗口内,且使用标准模运算交织。
● 安全性缺失:
○ UIO流量不受Selective IDE Streams保护,需依赖其他机制(如访问权限控制)。
● 配置复杂性:
○ 软件需精确配置路径上的所有交换机和主机桥,确保交织参数一致性。

5. UIO vs 传统P2P(如PCIe)

在这里插入图片描述

6. 应用场景

● AI/GPU计算:GPU直接访问远端内存池(HDM),避免主机内存带宽瓶颈。
● 内存池化:多个主机通过UIO共享分布式HDM,实现低延迟内存扩展。
● 高性能存储:存储加速器直接访问其他设备的内存,加速数据预处理。

总结

CXL UIO Direct P2P通过硬件级路由和交织内存支持,为设备间直接通信提供了高效、低延迟的解决方案。其核心价值在于绕过主机干预,充分利用CXL协议的缓存一致性和内存语义,适用于算力密集型和数据密集型场景。

相关文章:

CXL UIO Direct P2P学习

前言: 在CXL协议中,UIO(Unordered Input/Output) 是一种支持设备间直接通信(Peer-to-Peer, P2P)的机制,旨在绕过主机CPU或内存的干预,降低延迟并提升效率。以下是UIO的核心概念及UI…...

leetcode138.随即链表的复制

思路源于 【力扣hot100】【LeetCode 138】随机链表的复制&#xff5c;哈希表 采用一个哈希表&#xff0c;键值对为<原链表的结点&#xff0c;新链表的结点>&#xff0c;第一次遍历原链表结点时只创建新链表的结点&#xff0c;第二次遍历原链表结点时&#xff0c;通过键拿…...

03_MySQL工具介绍

文章目录 一、Navicat for MySQL1.1、安装 二、SQLyog2.1、安装 多数时候使用SQL语句对数据库进行操作不是很方便&#xff0c;特别是在查询操作时&#xff0c;显示的内容不够直观&#xff0c;此时我们需要借助图形化工具对数据库进行操作。 操作MySQL常用的图形工具如下&#x…...

《网络管理》实践环节01:OpenEuler22.03sp4安装zabbix6.2

兰生幽谷&#xff0c;不为莫服而不芳&#xff1b; 君子行义&#xff0c;不为莫知而止休。 1 环境 openEuler 22.03 LTSsp4PHP 8.0Apache 2Mysql 8.0zabbix6.2.4 表1-1 Zabbix网络规划&#xff08;用你们自己的特征网段规划&#xff09; 主机名 IP 功能 备注 zbx6svr 19…...

Qt Creator 中文 “error: C2001: 常量中有换行符“ 问题解决方法

Qt Creator 编译时出现‌中文 error: C2001: 常量中有换行符‌的问题&#xff0c;通常由文件编码与编译器字符集不兼容导致。 一、修改文件编码格式 ‌添加 UTF-8 BOM 签名‌ 在 Qt Creator 中设置&#xff1a;工具 -> 选项 -> 文本编辑器 -> 行为 -> UTF-8 BOM&a…...

Charles 抓包配置保姆教程(PC、IOS、Android)

抓包工具基础配置与使用指南 大家好&#xff0c;我是十一&#xff01;今天给大家分享一篇关于抓包工具的基础配置与使用指南。无论是开发、测试还是安全分析&#xff0c;抓包工具都是不可或缺的利器。本文将详细介绍如何配置和使用抓包工具&#xff0c;并特别推荐一款功能强大…...

洛谷题单1-P1001 A+B Problem-python-流程图重构

题目描述 输入两个整数 a,b&#xff0c;输出它们的和&#xff08;∣a∣,∣b∣≤109&#xff09;。 输入格式 两个以空格分开的整数。 输出格式 一个整数。 输入输出样例 输入 20 30输出 50方式-print class Solution:staticmethoddef oi_input():"""从…...

el-table 动态给每行增加class属性

el-table 动态给每行增加class属性 html代码 row-class-name属性&#xff0c;绑定方法 :row-class-name“tableRowClassName”, <el-table :data"tableData" border :row-class-name"tableRowClassName"> </el-table>js代码 tableRowClassNam…...

Opencv计算机视觉编程攻略-第四节 图直方图统计像素

Opencv计算机视觉编程攻略-第四节 图直方图统计像素 1.计算图像直方图2.基于查找表修改图像3.直方图均衡化4.直方图反向投影进行内容查找5.用均值平移法查找目标6.比较直方图搜索相似图像7.用积分图统计图像 1.计算图像直方图 图像统计直方图的概念 图像统计直方图是一种用于描…...

深度学习处理时间序列(5)

Keras中的循环层 上面的NumPy简单实现对应一个实际的Keras层—SimpleRNN层。不过&#xff0c;二者有一点小区别&#xff1a;SimpleRNN层能够像其他Keras层一样处理序列批量&#xff0c;而不是像NumPy示例中的那样只能处理单个序列。也就是说&#xff0c;它接收形状为(batch_si…...

Mysql 索引性能分析

1.查看CRUD次数 show global status like Com_______&#xff08;7个下划线&#xff09; show global status like Com_______ 2.慢SQL分析 SET GLOBAL slow_query_log ON;-- 设置慢SQL日志记录开启 SET GLOBAL long_query_time 2; -- 设置执行超过 2 秒的查询为慢查询 开…...

win11+ubuntu双系统安装

操作步骤&#xff1a; 官网下载ubuntu 最新镜像文件 准备U盘 准备一个容量不小于 8GB 的 U 盘&#xff0c;用于制作系统安装盘。制作过程会格式化 U 盘&#xff0c;请注意提前备份数据。 制作U盘启动盘 使用rufus工具&#xff0c;或者 balenaEtcher工具&#xff08;官网安…...

linux-5.10.110内核源码分析 - 写磁盘(从VFS系统调用到I/O调度及AHCI写磁盘)

1、VFS写文件到page缓存(vfs_write) 1.1、写裸盘(dd) 使用如下命令写裸盘&#xff1a; dd if/dev/zero of/dev/sda bs4096 count1 seek1 1.2、系统调用(vfs_write) 系统调用栈如下&#xff1a; 对于调用栈的new_sync_write函数&#xff0c;buf为写磁盘的内容的内存地址&…...

arinc818 fpga单色图像传输ip

arinc818协议支持的常用线速率如下图 随着图像分辨率的提高&#xff0c;单lane的速率无法满足特定需求&#xff0c;一种方式是通过多个LANE交叉的去传输图像&#xff0c;另外一种是通过降低图像的带宽&#xff0c;即通过只传单色图像达到对应的效果 程序架构如下图所示&#x…...

业务流程先导及流程图回顾

一、测试流程回顾 &#xfeff; 1. 备测内容回顾 &#xfeff; 备测内容: 本次测试涵盖买家和卖家的多个业务流程&#xff0c;包括下单流程、发货流程、搜索退货退款、支付抢购、换货流程、个人中心优惠券等。 2. 先测业务强调 &#xfeff; 1&#xff09;测试业务流程 …...

HCIP(RSTP+MSTP)

一、STP的重新收敛&#xff1a; 复习STP接口状态 STP初次收敛至少需要50秒的时间。STP的重新收敛情况&#xff1a; 检测到拓扑变化&#xff1a;当网络中的链路故障或新链路加入时&#xff0c;交换机会检测到拓扑变化。 选举新的根桥&#xff1a;如果原来的根桥故障或与根桥直…...

《无线江湖五绝:BLE/WiFi/ZigBee的频谱大战》

点击下面图片带您领略全新的嵌入式学习路线 &#x1f525;爆款热榜 88万阅读 1.6万收藏 文章目录 **第一回武林大会&#xff0c;群雄并起****第二回WiFi的“降龙十八掌”****第三回BLE的“峨眉轻功”****第四回ZigBee的“暗器百解”****第五回LoRa的“千里传音”****第六回NB…...

QT第六课------QT界面优化------QSS

作者前言 &#x1f382; ✨✨✨✨✨✨&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f382; ​&#x1f382; 作者介绍&#xff1a; &#x1f382;&#x1f382; &#x1f382; &#x1f389;&#x1f389;&#x1f389…...

本地化智能运维助手:基于 LangChain 数据增强 和 DeepSeek-R1 的K8s运维文档检索与问答系统 Demo

写在前面 博文内容为基于 LangChain 数据增强 和 Ollams 本地部署 DeepSeek-R1实现 K8s运维文档检索与问答系统 Demo通过 Demo 对 LEDVR 工作流&#xff0c; 语义检索有基本认知理解不足小伙伴帮忙指正 &#x1f603;,生活加油 我看远山&#xff0c;远山悲悯 持续分享技术干货…...

C++ STL常用算法之常用算术生成算法

常用算术生成算法 学习目标: 掌握常用的算术生成算法 注意: 算术生成算法属于小型算法&#xff0c;使用时包含的头文件为 #include <numeric> 算法简介: accumulate // 计算容器元素累计总和 fill // 向容器中添加元素 accumulate 功能描述: 计算区间内容器元素…...

Tof 深度相机原理

深度相机(TOF)的工作原理_tof相机原理-CSDN博客 深度剖析 ToF 技术&#xff1a;原理、优劣、数据纠错与工业应用全解析_tof技术-CSDN博客 飞行时间技术TOF_tof计算公式-CSDN博客 深度相机&#xff08;二&#xff09;——飞行时间&#xff08;TOF&#xff09;_飞行时间技术-C…...

【Linux篇】进程入门指南:操作系统中的第一步

步入进程世界&#xff1a;初学者必懂的操作系统概念 一. 冯诺依曼体系结构1.1 背景与历史1.2 组成部分1.3 意义 二. 进程2.1 进程概念2.1.1 PCB&#xff08;进程控制块&#xff09; 2.2 查看进程2.2.1 使用系统文件查看2.2.2 使⽤top和ps这些⽤⼾级⼯具来获取2.2.3 通过系统调用…...

JavaScript 中的原型链与继承

JavaScript 是一种基于原型的编程语言&#xff0c;这意味着它的对象继承是通过原型链而非类的机制来实现的。原型链是 JavaScript 中对象与对象之间继承属性和方法的基础。本文将深入探讨 JavaScript 中的原型链和继承机制&#xff0c;帮助你理解这一重要概念。 一、原型&…...

无线通信技术(二):ITU、3GPP及传统波段对无线频谱的划分

目录 一.ITU波段划分 二.3GPP频带划分&#xff08;仅介绍5G NR&#xff09; 2.1 频带分类 2.2 频带划分表 2.2.1 FR1 2.2.2 FR2 2.3 全球部署趋势 三.传统波段划分 3.1 射频工程中的微波 3.2 军用雷达波段命名 本文介绍国际标准组织ITU、3GPP和传统波段对无线频谱的划…...

Android 系统ContentProvider流程

一、ContentProvider初始化注册流程 源码查看路径&#xff1a;http://xrefandroid.com/android-11.0.0_r48/ 涉及到源码文件&#xff1a; /frameworks/base/core/java/android/content/ContentProvider.java 自定义ContentProvider需要继承该类,内部类Transport继承关系如下,实…...

SpringBean模块(一)定义如何创建生命周期

一、介绍 1、简介 在 Spring 框架中&#xff0c;Bean 是指由 Spring 容器 管理的 Java 对象。Spring 负责创建、配置和管理这些对象&#xff0c;并在应用程序运行时对它们进行依赖注入&#xff08;Dependency Injection&#xff0c;DI&#xff09;。 通俗地讲&#xff0c;Sp…...

k8s存储介绍(六)StorangeClass

一、Kubernetes 存储类&#xff08;StorageClass&#xff09;详解 1. 什么是 StorageClass&#xff1f; 在 Kubernetes 中&#xff0c;StorageClass&#xff08;存储类&#xff09;是一种用于动态创建 PersistentVolume&#xff08;PV&#xff09;的资源对象。它允许管理员根…...

Redis-04.Redis常用命令-字符串常用命令

一.字符串操作命令 set name jack 点击左侧name&#xff0c;显示出值。 get name get abc&#xff1a;null setex key seconds value&#xff1a;设置过期时间&#xff0c;过期后该键值对将会被删除。 然后再get&#xff0c;在过期时间内可以get到&#xff0c;过期get不到。…...

golang接口-interface

interface接口 概述 接口&#xff08;interface&#xff09;是 Go 语言中的一种类型&#xff0c;用于定义行为的集合&#xff0c;它通过描述类型必须实现的方法&#xff0c;规定了类型的行为契约。 它把所有的具有共性的方法定义在一起&#xff0c;任何其他类型只要实现了这…...

Epub转PDF软件Calibre电子书管理软件

Epub转PDF软件&#xff1a;Calibre电子书管理软件 https://download.csdn.net/download/hu5566798/90549599 一款好用的电子书管理软件&#xff0c;可快速导入电脑里的电子书并进行管理&#xff0c;支持多种格式&#xff0c;阅读起来非常方便。同时也有电子书格式转换功能。 …...