【CXL协议-事务层之CXL.io(3)】
3.1 CXL.io
CXL.io 为 I/O 设备提供非一致的加载/存储接口。 图 14 显示了 CXL.io 事务层在 Flex Bus 分层结构中的位置。 交易类型、交易数据包格式、基于信用的流量控制、虚拟通道管理和交易排序规则遵循PCIe定义; 请参阅
有关详细信息,请参阅 PCI Express 基本规范的“事务层规范”一章。 本章重点介绍 CXL.io 使用的值得注意的 PCIe 操作模式或功能。
3.1.1 CXL.io 端点
CXL 设备需要支持在 CXL 1.1 和 CXL 2.0 模式下运行。 CXL 备用协议协商决定操作模式。 当链路配置为在 CXL 1.1 模式下运行时,CXL.io 端点必须作为 PCIe RCiEP 暴露给软件,而当配置为在 CXL 2.0 模式下运行时,必须暴露给软件,软件作为 PCI Express 端点。 更多详情请参阅 PCIe 5.0 基本规范。 请参阅第 9.12 节。
参与 CXL 协议的 CXL.io 端点函数不得生成 INTx 消息。 非 CXL 函数映射 DVSEC(第 8.1.4 节)枚举不参与 CXL.cache 或 CXL.mem 的函数。 即使不推荐,这些非 CXL 函数也可以生成 INTx 消息。
MLD 组件的 CXL.io 端点功能(包括非 CXL 功能)不允许生成 INTx 消息。
3.1.2 CXL 电源管理 VDM 格式
CXL 电源管理消息作为 PCIe 供应商定义的类型 0 发送
具有 4 DW 数据负载的消息。 其中包括 PMREQ、PMRSP 和 PMGO
消息。 图 15 提供了 CXL PM VDM 消息的格式。 下列
这些消息的特征是:
• Fmt 和Type 字段被设置为指示带有数据的消息。 所有消息都使用路由
“在接收方本地终止”。 消息代码设置为供应商定义的类型 0。
• 供应商ID 字段设置为1E98h1。
• 消息头的字节15 包含VDM 代码并设置为“CXL PM 消息”的值。 (68小时)
• 4 DW 数据有效负载包含 CXL PM 逻辑操作码(例如,PMREQ、GPF)以及与 CXL PM 消息相关的任何其他信息。 数据有效负载内字段的详细信息如表 5 所示。
如果 CXL 组件接收到有毒的 PM VDM (EP=1),则接收方应丢弃此类消息。 由于接收方在收到此类 VDM 后能够继续正常操作,因此它应将此事件视为建议性非致命错误。
如果接收器电源管理单元 (PMU) 不理解 PM VDM 有效负载的内容,它应默默地丢弃该消息,并且不应发出不可纠正的错误信号。
图 15. CXL 电源管理消息数据包格式
表 5. CXL 电源管理消息——数据有效负载字段定义
3.1.2.1 信用和 PM 初始化
PM 积分和初始化过程是链接本地的。 图 16 说明了使用 PM2IP.CREDIT_RTN 和 PM2IP.AGENT_INFO 消息来初始化电源管理消息传递协议,旨在促进下行端口 PMU 和上行端口 PMU 之间的通信。 CXL交换机为PM提供聚合功能
消息如第 9.1.2.1 节中所述。
GPF 消息不需要信用,并且接收方不应生成 CREDIT_RTN 来响应 GPF 消息。
Credit and PM Initialization:
PM Credits:这是一种流量控制机制,确保电源管理单元 (PMU) 之间的通信不会超过接收方的处理能力。发送方必须拥有足够的信用(Credits)才能发送消息。
Initialization Process:初始化过程是本地链路的,意味着它是针对连接两个PMU的特定链路进行的。它涉及特定的消息交换,用来建立电源管理通信协议。
使用PM2IP.CREDIT_RTN和PM2IP.AGENT_INFO消息:
PM2IP.CREDIT_RTN:这是一种信用返回消息,用于通知发送方已成功接收消息,并且可以再次发送更多消息。
PM2IP.AGENT_INFO:这是一种代理信息消息,用于在初始化过程中交换PMU之间的配置和状态信息。
CXL交换机的聚合功能:
CXL交换机具有聚合电源管理消息的功能,这意味着它可以将来自不同端口的电源管理消息进行汇总,以简化电源管理协议的通信。
GPF消息和信用返回:
GPF (Generic Protocol Flow) 消息:这些消息不要求信用,因为它们通常用于非流量控制的目的,例如系统级别的管理和控制信号。
接收方不应对GPF消息生成CREDIT_RTN响应,因为这些消息不受信用机制的限制。
Power Management Credits and Initialization 过程:
在CXL.io中,电源管理初始化过程通常涉及以下步骤:
链路建立后,下游和上游PMU之间交换AGENT_INFO消息,以传达电源管理能力和配置参数。
随后,PMU之间交换CREDIT_RTN消息,以建立信用计数和确认消息传输的准备就绪。
一旦建立了信用体系和电源管理通信协议,PMU就可以开始交换用于电源管理的其他消息,并据此调整功率状态。
这个过程确保了PMU之间的同步和一致性,使得电源管理操作可以根据系统的实时需求进行调整,从而在满足性能要求的同时优化能耗。
CXL 上行端口 PMU 必须能够接收和处理 CREDIT_RTN 消息,而不依赖于任何其他 PM2IP 消息。 此外,CREDIT_RTN 消息不使用信用。 CREDIT_RTN消息用于初始化和更新每一侧的TX信用,以便可以适当地管理流量控制。
在 PM 初始化期间的第一个 CREDIT_RTN 消息期间,通过 NUM_CREDITS 字段发送的信用表示 CREDIT_RTN 的发起者可以从另一端接收的依赖于信用的 PM 消息的数量。 在后续的 CREDIT_RTN 消息期间,NUM_CREDITS 字段表示自同一方向的最后一个 CREDIT_RTN 消息以来释放的 PM 信用数。 下行端口 PMU 还使用第一个 CREDIT_RTN 消息将 PM_AGENT_ID 分配给上行端口 PMU。 该 ID 通过 CREDIT_RTN 消息中的 TARGET_AGENT_ID 字段进行传达。 在发起任何 IP2PM 消息之前,上游端口 PMU 必须等待来自下游端口 PMU 的 CREDIT_RTN 消息。
上行端口 PMU 必须支持至少一个信用,其中信用意味着有足够的缓冲来接收具有 128 位有效负载的 PM2IP 消息。
信用初始化后,上行端口 PMU 必须等待来自下行端口 PMU 的 AGENT_INFO 消息。 该消息包含下游端口PMU的PM协议的CAPABILITY_VECTOR。 上游端口 PMU 必须将其 CAPABILITY_VECTOR 发送到下游端口 PMU,以响应来自下游端口 PMU 的 AGENT_INFO 请求。 当存在不匹配时,下游端口 PMU 可以实现兼容模式以与能力较差的上游端口 PMU 一起工作。 或者,如果下游端口 PMU 不知道如何与能力较差的上游端口 PMU 一起可靠地运行,则它可能会记录不匹配并报告错误。
上游端口 PMU 期望在收到消息后立即恢复下游端口 PMU 的信用。 如果下游端口 PMU 提供了多个信用,则它可以有多个正在传输的消息。 及时释放信用将为延迟敏感的流提供更好的性能。
以下列表总结了上行端口 PMU 必须遵循的规则。
• 上行端口PMU 在启动任何IP2PM 消息之前必须等待接收PM2IP.CREDIT_RTN 消息。
• 上游端口PMU 必须从从下游端口PMU 接收到的第一条PM2IP 消息中提取TARGET_AGENT_ID 字段,并将其用作未来消息中的PM_AGENT_ID。
• 上游端口PMU 必须实现足够的资源来接收和处理任何CREDIT_RTN 消息,而不依赖于任何其他PM2IP 或IP2PM 消息或其他消息类别。
• 上行端口PMU 必须实施至少一个信用来接收PM2IP 消息。
• 上游端口PMU 必须尽快将所有信用返回至下游端口PMU,以防止阻塞通过CXL 链路的PM 消息通信。
• 建议上游端口PMU 保留信用的时间不要超过10us。
3.1.3 CXL 错误 VDM 格式
CXL 错误消息作为 PCIe 供应商定义的类型 0 消息发送,不带数据负载。 目前,此类包括单一类型的消息,即内存错误固件通知(MEFN)。 图 17 提供了 CXL 错误 VDM 消息的格式。
MEFN消息的特点如下:
• Fmt 和Type 字段设置为指示没有数据的消息。
• 使用“路由到根联合体”的路由发送消息。 它始终由设备发起。
• 消息代码设置为供应商定义的类型0。
• 供应商ID 字段设置为1E98h。
• 消息头的字节15 包含VDM 代码并设置为“CXL 错误消息”的值。 (00 点)
• 字节8、9、12、13 设置为0。
• 字节14 的位[7:4] 设置为0。字节14 的位[3:0] 用于传送固件中断向量(在图17 中缩写为FW 中断向量)。
FW 中断向量字段的编码是主机特定的,因此 CXL 规范未定义。 主机可以支持多于一种类型的固件环境,并且该字段可以用于向主机指示这些环境中的哪一个要处理该消息。
3.1.4 CXL 所需的可选 PCIe 功能
表 7 列出了启用 CXL 所需的符合 PCIe 规范的可选功能。
Data Poisoning by transmitter:
数据毒化(Data Poisoning)是PCIe中的一种错误报告机制,它允许传输设备(transmitter)在检测到数据错误时标记该数据,以便接收设备(receiver)可以采取适当的行动。在CXL的上下文中,支持数据毒化是必需的,这样在发生错误时可以确保数据的完整性。
ATS (Address Translation Services):
ATS是一种用于改善虚拟内存地址转换效率的机制,它只在设备支持缓存(即具有.cache功能)时才需要。在CXL中,Type 1和Type 2设备需要ATS支持,因为它们可以与CPU共享缓存。然而,Type 3设备(不包含缓存的设备)则不需要ATS支持。
Additional VCs (Virtual Channels) and TCs (Traffic Classes) beyond VC0/TC0:
VC(Virtual Channel)和TC(Traffic Class)是PCIe中用于管理数据流和优先级的功能。VC0和TC0是基本的通道和类别,用于处理所有通信。CXL要求至少支持VC0,如果需要实现服务质量(QoS)控制,可以选择性地支持额外的VC1。
Advanced Error Reporting (AER):
AER是PCIe高级错误报告功能,允许设备报告详细的错误信息和执行更复杂的错误处理。CXL协议要求支持AER,以便在发生错误时可以提供更详细的诊断信息,从而提高系统的可靠性和可维护性。
3.1.5 错误传播
设备检测到的 CXL.cache 和 CXL.mem 错误通过 CXL.io 流量流传播到上游端口。 这些错误在 PCIe AER 寄存器中记录为可纠正和不可纠正的内部错误。
3.1.6 ATS 上的内存类型指示
对某些内存区域的请求只能在 CXL.io 上发出,而不能在 CXL.cache 上发出。 由主机决定这些内存区域是什么。 例如,在 x86 系统上,主机可以选择仅通过 CXL.io 限制对不可缓存 (UC) 类型内存的访问。 主机通过向设备发出 ATS 完成指示来指示此类区域。
来自 CXL 设备的 ATS 请求必须设置“Source-CXL”位。
64 位:DWORD3,字节 3,位 3; 32 位:DWORD2、字节 3、位 3 定义如下 0b - 表示由不支持 ATS 上内存类型指示的功能发起的请求 1b - 表示由支持 ATS 上内存类型指示的功能发起的请求。 如上所述,所有 CXL 设备功能都必须设置该位。
注:根据 PCIe 规范的定义,该位在 ATS 请求中保留。
来自主机的 ATS 转换完成将携带这样的指示:对给定页面的请求只能在转换完成数据条目中使用以下位“Issue-on-CXL.io”在 CXL.io 上发出:
DWORD1,字节 2,位 1 定义如下 0b - 可以在所有 CXL 协议上发出对页面的请求。
1b - 对页面的请求只能由 CXL.io 上的功能发出。 使用 CXL.Cache 协议向页面发出请求是一种功能违规。
注:根据 PCIe 规范的定义,该位在 ATS 完成中保留。
3.1.7 可延迟写入
CXL 规范中定义的可延迟写入仅适用于在 CXL 1.1 模式下运行时。 在 CXL 2.0 模式下运行时,请参阅 PCIe 规范以了解此功能。 可延迟写入允许多个软件实体将可扩展的工作提交到 CXL 设备,而无需显式锁定或软件同步。 可延迟写入是下游非发布内存写入。 可延迟写入的完成允许设备指示命令是否已成功接受或是否需要延迟。
在 CXL.io 上,可延迟写入作为 NPMemWr32/64 事务发送,该事务具有以下编码(请注意,NPMemWr32 的编码在 PCIe 中已弃用):
FMT[2:0] - 010b/011b
类型[4:0] - 11011b
由于可延迟写入是非发布的,因此设备预计会发送 Cpl 响应。
Cpl 中的完成状态字段(字节数为“4”)指示工作是否已成功接受。 成功提交的作品会附有
“成功完成”完成状态。 不成功的工作提交会伴随“内存请求重试状态”完成状态。 这些的编码是:
成功完成 (SC) - 000b 内存请求重试状态 (MRS) - 010b
相关文章:

【CXL协议-事务层之CXL.io(3)】
3.1 CXL.io CXL.io 为 I/O 设备提供非一致的加载/存储接口。 图 14 显示了 CXL.io 事务层在 Flex Bus 分层结构中的位置。 交易类型、交易数据包格式、基于信用的流量控制、虚拟通道管理和交易排序规则遵循PCIe定义; 请参阅 有关详细信息,请参阅 PCI Ex…...

如何自己构建 Ollama 模型
如何自己构建 Ollama 模型 0. 引言1. 下载原始模型2. 创建 Modelfile 文件3. 构建 Ollama 模型4. 运行自构建的 Ollama 模型 0. 引言 针对模型新出的大模型,可能 Ollama Models Library 不提供,或者会在今后的某个时点提供。还有可能 Ollama Models Lib…...
5.84 BCC工具之tcpretrans.py解读
一,工具简介 tcpretrans工具追踪内核TCP重传函数,以显示这些重传的详细信息。 它专门用于追踪TCP重传事件。在网络通信中,重传是由于数据包丢失、损坏或延迟到达而需要重新发送的情况。tcpretrans通过利用Linux内核中的BPF(Berkeley Packet Filter)机制,能够实时捕获和…...

从0到1实现RPC | 03 重载方法和参数类型转换
一、存在的问题 1.重载方法在当前的实现中还不支持,调用了会报错。 2.类型转换也还存在问题。 假设定义的接口如下,参数是float类型。 在Provider端接受到的是一个Double类型,这是因为web应用接收的请求后处理的类型。 在反射调用的时候就会…...

Matlab之已知2点绘制长度可定义的射线
目的:在笛卡尔坐标系中,已知两个点的位置,绘制过这两点的射线。同时射线的长度可以自定义。 一、函数的参数说明 输入参数: PointA:射线的起点; PointB:射线过的零一点; Length&…...

虚拟机安装Linux系统,FinalShell远程连接Linux
1.虚拟机安装CentOS系统 2. 查看CentOS系统的ip地址 3. FinalShell远程连接Linux 3.虚拟机快照(存档) 确保虚拟机关机,找到快照模拟器 恢复快照...

MacOS Xcode 使用LLDB调试Qt的 QString
环境: MacOS: 14.3Xcode: Version 15.0Qt:Qt 6.5.3 前言 Xcode 中显示 预览 QString 特别不方便, 而Qt官方的 lldb 脚本debugger/lldbbridge.py一直加载失败,其他第三方的脚本都 不兼容当前的 环境。所以自己研究写…...

C/C++代码性能优化——编程实践
1. 编程实践 在一些关键的地方,相应的编程技巧能够给性能带来重大提升。 1.1. 参数传递 传递非基本类型时,使用引用或指针,这样可以避免传递过程中发生拷贝。参数根据是否需要返回,相应加上const修饰,代码更安全&am…...

JVM—内存可见性
什么是可见性 可见性:一个线程对共享变量值的修改,能够及时地被其他线程看到共享变量:如果一个变量在多个线程的工作内存中都存在副本,那么这个变量就是这几个线程的共享变量 Java内存模型(JMM) Java内存模型(Java Memory Model)描述了Java程序中各种…...

VScode手动安装vsix格式插件,提示安装插件与code版本不兼容问题
问题描述: vscode手动按装插件提示"插件不兼容code版本 原因方案:修改安装包内的package.json文件中的版本号与vscode版本号对应即可 解决步骤 以(adpyke.codesnap-1.3.4.vsix)安装包为例 手动安装vscode弹出 无法安装扩展“adpyke.codesnap-1.3.4”,它与 …...

K8S Storage
概述 一般情况下,K8S中的Pod都不应该将数据持久化到Pod中,因为Pod可能被随时创建和删除(扩容或缩容),即便是StatefulSet或Operator的Pod,也都不建议在Pod里存放数据,可以将数据持久化到Host上。…...
Day54-nginx限速-访问日志-错误日志精讲
Day54-nginx限速-访问日志-错误日志精讲 测试请求限制连接限制(limit_conn)下载速度限制(limit_rate) ngx_http_core_module综合配置1.Nginx状态监控1.1 Nginx status介绍1.2 Nginx status配置1.3 基本状态数据如下所示:(注意本地…...
SQL经典面试题
这里写目录标题 1 背概念2 学例子 1 背概念 1 事务 事务是最小的不可在分的工作单元,事务的操作要么同时成功,要么同时失败。 ACID: 原子性、一致性、隔离性、持久性 2 约束 主键约束;外键约束(少用,会增加程序的耦合性ÿ…...
Java基础知识总结(14)
map集合 /* java.util.Map接口中常用的方法 1、Map和Collection 没有继承关系 2、Map集合以key和value的方式存储数据:键值对key和valuea都是引用数据类型key和value都是存储对象的内存地址key起到主导地位,value是key的一个附属品 3、Map接口中常用的方…...
MacOS - GCC 版本升级解决方案
Mac 中自带的 GCC 版本是 4.2.1,由于版本太低,在很多操作的时候会报错。因此需要对其进行升级,这里使用 Homebrew 来下载最新的 GCC。 安装 Homebrew MacOS 的终端中输入如下的命令来安装 Homebrew $ /usr/bin/ruby -e "$(curl -fsSL …...

小程序绕过 sign 签名
之前看到了一篇文章 小程序绕过sign签名思路 之前在做小程序渗透时也遇到了这种情况,但是直接放弃测试了,发现这种思路后,又遇到了这种情况,记录下过程 并没有漏洞分享,仅仅是把小程序也分享出来,方便大家…...

【Canvas与艺术】绘制动态太极图
【图例】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>绘制旋转太极图</title><style type"text/css"&g…...

Llama 2 模型
非常清楚!!!Llama 2详解 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/649756898?utm_campaignshareopn&utm_mediumsocial&utm_psn1754103877518098432&utm_sourcewechat_session一些补充理解: 序列化ÿ…...

SQLiteC/C++接口详细介绍sqlite3_stmt类(十一)
返回:SQLite—系列文章目录 上一篇:SQLiteC/C接口详细介绍sqlite3_stmt类(十) 下一篇: SQLiteC/C接口详细介绍sqlite3_stmt类(十二) 43、sqlite3_reset sqlite3_reset 函数用于重置已经编…...

【理解机器学习算法】之Clustering算法(Agglomerative Clustering)
聚合聚类(Agglomerative Clustering)是一种层次聚类算法,通过逐步合并或“聚集”它们来构建嵌套聚类。这种方法采用自底向上的方式构建聚类层次:它从将每个数据点作为单个聚类开始,然后迭代合并最接近的聚类对,直到所有数据点合并…...
变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析
一、变量声明设计:let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性,这种设计体现了语言的核心哲学。以下是深度解析: 1.1 设计理念剖析 安全优先原则:默认不可变强制开发者明确声明意图 let x 5; …...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
Cesium1.95中高性能加载1500个点
一、基本方式: 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...

k8s业务程序联调工具-KtConnect
概述 原理 工具作用是建立了一个从本地到集群的单向VPN,根据VPN原理,打通两个内网必然需要借助一个公共中继节点,ktconnect工具巧妙的利用k8s原生的portforward能力,简化了建立连接的过程,apiserver间接起到了中继节…...

【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...

Yolov8 目标检测蒸馏学习记录
yolov8系列模型蒸馏基本流程,代码下载:这里本人提交了一个demo:djdll/Yolov8_Distillation: Yolov8轻量化_蒸馏代码实现 在轻量化模型设计中,**知识蒸馏(Knowledge Distillation)**被广泛应用,作为提升模型…...

宇树科技,改名了!
提到国内具身智能和机器人领域的代表企业,那宇树科技(Unitree)必须名列其榜。 最近,宇树科技的一项新变动消息在业界引发了不少关注和讨论,即: 宇树向其合作伙伴发布了一封公司名称变更函称,因…...
第7篇:中间件全链路监控与 SQL 性能分析实践
7.1 章节导读 在构建数据库中间件的过程中,可观测性 和 性能分析 是保障系统稳定性与可维护性的核心能力。 特别是在复杂分布式场景中,必须做到: 🔍 追踪每一条 SQL 的生命周期(从入口到数据库执行)&#…...
土建施工员考试:建筑施工技术重点知识有哪些?
《管理实务》是土建施工员考试中侧重实操应用与管理能力的科目,核心考查施工组织、质量安全、进度成本等现场管理要点。以下是结合考试大纲与高频考点整理的重点内容,附学习方向和应试技巧: 一、施工组织与进度管理 核心目标: 规…...