PCIe P2P DMA全景解读
温馨提醒:本文主要分为5个部分,总计4842字,需要时间较长,建议先收藏!
-
P2P DMA简介
-
P2P DMA软硬件支持
-
CXL P2P DMA原理差异
-
P2P DMA应用场景
-
P2P DMA技术挑战
一、P2P DMA简介
P2P DMA(Peer-to-Peer Direct Memory Access)技术是一种允许连接到PCIe总线上的不同设备之间直接进行数据交换的机制,无需通过CPU和系统内存中转。这一特性极大地提升了数据传输效率,减少了CPU负载,并在特定场景下优化了系统性能。
P2P DMA的概念早在NVMe SSD和RDMA技术发展的初期就已出现。大约在2012年左右,Stephen Bates等人在研究NVMe、RDMA及NVMe over fabrics时发现了对设备间直接DMA的需求。早期实现主要依赖于一些具备可暴露内存区域(即现在的CMB - Controller Memory Buffer)的设备来实验性地支持P2PDMA。
Host与存储设备数据移动优化的技术中,控制器内存缓冲区(Controller Memory Buffer,CMB)是一个重要的概念。

自2014年以来,CMB被纳入到NVMe 1.2标准中,其目的是减少主机和设备之间的数据移动。CMB是控制器内部的一块专用内存,通过PCIe总线访问。当CPU需要访问存储设备的数据时,它可以通过内存读写事务层封装(MRd或MRw)直接访问CMB,而不需要将整个数据块传输到主机内存。

由于主机CPU无法像访问DDR内存那样高效地访问CMB,因此CMB通常被用作PCIe设备之间块数据传输的DMA(直接内存访问)缓冲区。这种方式减少了数据在主机和设备之间来回移动的次数,从而提高了数据传输效率。尽管CMB提供了一种优化数据移动的方法,但它仍然存在一些限制。例如,由于主机CPU访问CMB的效率低于DDR内存,且CMB的大小有限,因此对于需要频繁、大量数据交换的应用场景,CMB可能无法提供最佳的性能。
二、P2P DMA软硬件支持
随着时间的推移,随着硬件技术的进步以及软件栈的支持,如Linux内核从6.2版本开始提供用户空间对P2PDMA的支持,该功能逐渐成熟并应用在更多领域,例如NVIDIA GPUDirect Storage利用P2PDMA实现了GPU与NVMe命名空间之间的直接数据复制。
完整阅读:PCIe P2P DMA全景解读完整版本
相关文章:
PCIe P2P DMA全景解读
温馨提醒:本文主要分为5个部分,总计4842字,需要时间较长,建议先收藏! P2P DMA简介 P2P DMA软硬件支持 CXL P2P DMA原理差异 P2P DMA应用场景 P2P DMA技术挑战 一、P2P DMA简介 P2P DMA(Peer-to-Peer…...
【Git】window下大小写不敏感问题处理
在Windows环境下,Git因为文件名的大小写敏感性而导致了一些问题。 首先,Windows文件系统是不区分大小写的,这意味着在Windows中创建的两个文件名只有大小写不同,但字母顺序和字符完全相同的文件会被视为相同的文件。然而…...
【JS】【Vue3】【React】获取滚轮位置的方法:JavaScript、Vue 3和React示例
目录 使用JavaScript原生方法在Vue 3中获取滚轮位置在React中获取滚轮位置 随着Web应用程序的发展,滚轮位置的获取变得越来越重要,可以用于实现页面的滚动效果、导航条的隐藏和显示等功能。本文将探讨在JavaScript、Vue 3和React中获取滚轮位置的不同方法…...
什么是线程和进程?
什么是线程和进程? 文章目录 什么是线程和进程?何为进程?何为线程? Java 线程和操作系统的线程有啥区别?请简要描述线程与进程的关系,区别及优缺点?图解进程和线程的关系程序计数器为什么是私有的?虚拟机栈和本地方法栈为什么是私有的?一句话简单了…...
MaxScale实现mysql8读写分离
MaxScale 实验环境 中间件192.168.150.24MaxScale 22.08.4主服务器192.168.150.21mysql 8.0.30从服务器192.168.150.22mysql 8.0.30从服务器192.168.150.23mysql 8.0.30 读写分离基于主从同步 1.先实现数据库主从同步 基于gtid的主从同步配置 主库配置 # tail -3 /etc/my.…...
【c语言】内存函数
欢迎关注个人主页:逸狼 创造不易,可以点点赞吗~ 如有错误,欢迎指出~ 目录 memcpy函数的使用和模拟实现 memcpy函数的使用 memcpy函数的模拟实现 memmove的使用和模拟实现 memmove的使用 memmove的模拟实现 memset函数的使用 memcmp函数…...
规则引擎项目
https://github.com/expr-lang/expr https://github.com/gorules/zen...
Docker Image(镜像)
“脚印会旧而梦还在走” Docker 镜像介绍 (1) 如何理解镜像? 🎯 docker image本质就是一个 read-only(只读)文件,这个文件包含了文件系统、源码、库文件、依赖文件、工具等一些运行 application 所必须的文件。 🎯 我们也可以…...
qgis启动提示Could not load qgis_app.dll
qgis启动提示Could not load qgis_app.dll 报错信息 我安装了QGIS3.16和3.22和3.28,都无法运行,启动程序报错问题如下图所示 解决方法 在开始菜单运行OSGeo4W 然后进去看看已经下载的qgis有没有更新,如果有更新的话,就直接点…...
数据分析---Python与sql
目录 Python的pandas,如何实现SQL中的leftjoinPython的pandas,如何实现SQL中的unionPython的pandas,如何实现类似SQL中的where进行限制Python的pandas,如和实现SQL中的group byPython的pandas,如何删除某一列Python的pandas,如何实现SQL中的leftjoin 在Python的pandas库中…...
【Oracle】玩转Oracle数据库(六):模式对象管理与安全管理
前言 嘿,数据库大冒险家们!准备好迎接数据库管理的新挑战了吗?今天我们要探索的是Oracle数据库中的模式对象管理与安全管理!🛡️💻 在这篇博文【Oracle】玩转Oracle数据库(六)&#…...
微服务篇之限流
一、为什么要限流 1. 并发的确大(突发流量)。 2. 防止用户恶意刷接口。 二、限流的实现方式 1. Tomcat限流 可以设置最大连接数,但是每一个微服务都有一个tomcat,实现起来非常麻烦。 2. Nginx限流 (1)控…...
react脚手架
1.react概述 1.1 什么是react React是一个用于构建用户界面的JS库。 用户界面:HTML页面(前端) React主要用来写HTML界面,或构建Web应用 如果从MVC的角度来看,React仅仅是视图层(V),也就是只负…...
【Vue3】插槽使用和animate使用
插槽使用 插槽slot匿名插槽具名插槽插槽作用域简写 动态插槽transition动画组件自定义过渡class类名如何使用animate动画库组件动画生命周期appear transition- group过渡列表 插槽slot 插槽就是子组件中提供给父组件使用的一个占位符父组件可以在这个占位符智能填充任何模板代…...
HarmonyOS—低代码开发Demo示例
接下来为大家展示一个低代码开发的JS工程的Demo示例,使用低代码开发如下华为手机介绍列表的HarmonyOS应用/服务示例。 1.删除模板页面中的控件后,选中组件栏中的List组件,将其拖至中央画布区域,松开鼠标,实现一个List组…...
Spring体系下解决请求统一加解密之ResponseBodyAdvice和RequestBodyAdvice
在日常写项目中经常一般正规的项目都需要将信息加密后返回前端,前端进行解密后再展示出来给用户,这样做的目的无一不是为了安全,在Java开发中,如何简单快速的完成这个功能呢,这里就需要用到这两个接口ResponseBodyAdvi…...
C# 经典:ref 和 out 的区别详解
在C#中,ref和out关键字用于按引用传递变量,它们在变量传递、输出参数、返回值以及异常处理等方面有一些重要区别。本文将详细阐述这些差异。 1. 变量传递 ref和out关键字都可以用于方法的参数传递。它们的主要区别在于如何处理变量的引用。 ref关键字…...
Linux 系统添加虚拟内存的方法
https://cloud.189.cn/t/6nqy2m3YnUN3 (访问码:ic3i) 云服务器 群晖NAS 切换到 root 模式 sudo su 或者 sudo -i #群晖/volume2 是你添加的硬盘挂载路径 不一定是 volume2 有可能是 volume1 #如果你只有1快硬盘 volume2 改成 volume1 …...
PHP 函数四
一 fgets(resource $stream, ?int $length null) 从文件指针中读取一行。 返回字符串,如果文件指针中没有更多的数据了则返回 false。错误发生时返回 false。 $stream 为文件资源,必须指向fopen()或fscokopen()成功打开的文件。文件打开之后&#x…...
【Android】反编译APK及重新打包
1.下载 APK 反编译工具 首先,需要下载一个 APK 反编译工具,例如 Apktool。可以在官网(https://apktool.org/docs/install)上下载最新版本的 Apktool,也可以使用包管理器来安装。 2.反编译 APK 文件 将要修改包名的 …...
Honey Select 2 进阶体验:从基础API到画质优化的必备插件指南
1. 基础框架搭建:插件系统的核心组件 当你第一次打开Honey Select 2的mod文件夹时,可能会被各种.dll文件和压缩包搞得晕头转向。别担心,我们先从最基础的框架开始搭建。就像盖房子需要打地基一样,这些核心组件是所有高级功能的前提…...
铁岭生态休闲研学基地圆吉祥?小程序开源代码
圆吉祥品牌小程序定位为全场景生态休闲研学平台,其核心功能模块与UNIAPP跨端开发框架密切相关。以下为关键实现逻辑:提起圆吉祥,很多人都会好奇,这个品牌究竟是什么模样?圆吉祥,核心定位为生态休闲研学基地…...
Boost变换器建模避坑指南:手把手教你用Simulink搞定CCM模式下的RHPZ分析
Boost变换器CCM模式下的RHPZ实战分析:从Simulink建模到稳定性设计 在电力电子系统设计中,Boost变换器的右半平面零点(RHPZ)现象一直是工程师面临的棘手问题。当你在实验室调试电路时,可能会遇到这样的情况:…...
如何在5分钟内掌握Nexus Mods App:游戏模组管理的终极解决方案
如何在5分钟内掌握Nexus Mods App:游戏模组管理的终极解决方案 【免费下载链接】NexusMods.App Home of the development of the Nexus Mods App 项目地址: https://gitcode.com/gh_mirrors/ne/NexusMods.App 你是否曾经因为模组冲突导致游戏崩溃而烦恼&…...
量子通信中的纠缠蒸馏技术与全局优化策略
1. 量子通信中的纠缠蒸馏技术概述量子通信的核心挑战在于如何克服量子态在传输过程中的退相干和噪声干扰。与经典通信不同,量子信息无法被完美复制(不可克隆定理),这使得传统的中继放大方案在量子领域完全失效。纠缠蒸馏ÿ…...
如何用 JSON.stringify 配合本地存储存放复杂的对象数据
localStorage只能存储字符串,存对象需先JSON.stringify序列化,读取时用JSON.parse解析;函数、undefined等无法直接保存,Date需手动转换;必须用try...catch防止解析失败。直接用 localStorage.setItem 存对象会出错&…...
为什么92%的Blazor项目在2026年Q1升级后失败?揭秘.NET 9 Runtime与Blazor Hybrid双模式配置断点
第一章:为什么92%的Blazor项目在2026年Q1升级后失败?揭秘.NET 9 Runtime与Blazor Hybrid双模式配置断点2026年第一季度,.NET 9正式发布后,大量采用Blazor Hybrid架构的现有项目在升级过程中遭遇静默崩溃、WebView初始化失败或Razo…...
从Kubernetes到Docker:看云原生技术如何成功‘跨越鸿沟’(给技术布道者的实战指南)
云原生技术布道实战:如何复制Kubernetes的成功跨越路径 当Docker在2013年横空出世时,开发者们突然发现容器技术不再只是谷歌等科技巨头的专利。短短几年后,Kubernetes从Google内部项目成长为云原生计算的基石。这两个标志性技术的成功绝非偶然…...
248MHz RISC-V MCU还能这么玩?手把手教你用AG32VF407内置的2KLE CPLD做高速数据采集
248MHz RISC-V MCU与2KLE CPLD的协同设计实战:构建高速数据采集系统 当传统MCU遇到多路高速信号采集需求时,开发者常面临两种选择:要么增加昂贵的专用芯片,要么外挂FPGA/CPLD实现硬件并行处理。AG32VF407的独特之处在于࿰…...
别再调第三方API了!用ip2region自建离线IP库,为你的应用省下一大笔钱
离线IP定位实战:用ip2region替代商业API的完整指南 当你的应用需要获取用户地理位置时,第一反应可能是调用第三方API服务。但你是否计算过,每月数百万次API调用背后的成本有多惊人?一位独立开发者曾告诉我,他的小型电商…...
