当前位置: 首页 > news >正文

【零拷贝】

目录

一:了解IO基础概念

二:数据流动的层次结构

三:零拷贝

1.传统IO文件读写

2.mmap 零拷贝技术

3.sendFile 零拷贝技术


一:了解IO基础概念

理解CPU拷贝和DMA拷贝

​         我们知道,操作系统对于内存空间,是分为用户态和内核态的。用户态的应用程序无法直接操作硬件,需要通过内核空间进行操作转换,才能真正操作硬件。这其实是为了保护操作系统的安全。正因为如此,应用程序需要与网卡、磁盘等硬件进行数据交互时,就需要在用户态和内核态之间来回的复制数据。而这些操作,原本都是需要由CPU来进行任务的分配、调度等管理步骤的,早先这些IO接口都是由CPU独立负责,所以当发生大规模的数据读写操作时,CPU的占用率会非常高。

之后,操作系统为了避免CPU完全被各种IO调用给占用,引入了DMA(直接存储器存储)。由DMA来负责这些频繁的IO操作。DMA是一套独立的指令集,不会占用CPU的计算资源。这样,CPU就不需要参与具体的数据复制的工作,只需要管理DMA的权限即可。

​ DMA拷贝极大的释放了CPU的性能,因此他的拷贝速度会比CPU拷贝要快很多。但是,其实DMA拷贝本身,也在不断优化。

​ 引入DMA拷贝之后,在读写请求的过程中,CPU不再需要参与具体的工作,DMA可以独立完成数据在系统内部的复制。但是,数据复制过程中,依然需要借助数据总进线。当系统内的IO操作过多时,还是会占用过多的数据总线,造成总线冲突,最终还是会影响数据读写性能。

​ 为了避免DMA总线冲突对性能的影响,后来又引入了Channel通道的方式。Channel,是一个完全独立的处理器,专门负责IO操作。既然是处理器,Channel就有自己的IO指令,与CPU无关,他也更适合大型的IO操作,性能更高。

​ 这也解释了,为什么Java应用层与零拷贝相关的操作都是通过Channel的子类实现的。这其实是借鉴了操作系统中的概念。

channel知识点:

在计算机系统中,“通道”(Channel) 的具体作用范围取决于上下文(如硬件架构、操作系统或编程框架)。以下是不同场景下的解释:


通道是 数据传输的路径或抽象机制,通常不直接等同于“操作系统内存 ↔ 外设”的物理传输,而是分层协作中的一环。

(1) 硬件层的通道(如传统大型机)

  • 功能
    某些系统(如 IBM 大型机)的 I/O 通道 是专用硬件,直接管理外设(磁盘、磁带)与内存的传输。

  • 特点

    • 通道是独立于 CPU 的处理器,可执行复杂的 I/O 指令(如协议解析、数据分块)。

    • 直接与外设控制器交互,完成物理数据传输(类似增强版 DMA)。

  • 示例
    大型机中,通道从磁盘读取数据到内存,无需 CPU 干预。

(2) 操作系统层的通道(如设备驱动)

  • 功能
    操作系统通过 设备驱动内核 I/O 子系统 管理外设与内存的交互。

  • 特点

    • 通道在此上下文中更接近 逻辑抽象(如 /dev 下的设备文件)。

    • 实际数据传输依赖 DMAPIO(编程 I/O)

(3) 编程框架中的通道(如 Java NIO)

  • 功能
    Java NIO 的 Channel(如 FileChannelSocketChannel)是 用户空间与内核空间之间的桥梁

  • 特点

    • 通过系统调用与内核交互,数据在用户缓冲区(如 ByteBuffer)和内核的 Page Cache 之间传输。

    • 不直接操作外设,物理传输由操作系统和 DMA 完成。

二:数据流动的层次结构

计算机系统中,数据从程序到磁盘(或反向)的流动通常经过以下层级:

程序中的 IO 流 → 用户空间缓冲区 → 操作系统缓存页(内核空间) → 磁盘驱动 → 物理磁盘

示意图

程序代码               用户空间              内核空间              硬件层
┌───────────┐       ┌─────────────┐      ┌──────────────┐      ┌────────┐
│  IO 流    │ → → → │ 用户缓冲区   │ → → → │ Page Cache    │ → → → │ 磁盘   │
└───────────┘       └─────────────┘      └──────────────┘      └────────┘(程序层)             (操作系统层)        (物理层)

 而零拷贝技术是减少用户空间和内存空间之间数据传输的次数,接下来,将进入零拷贝的讲解。

三:零拷贝

        零拷贝(Zero-copy) 是一种优化技术,旨在 减少或消除数据在内存中的冗余复制操作,从而提升 I/O 性能。它主要作用于 用户空间内存与内核空间内存之间的数据传输,但最终目标是减少整个数据链路(从磁盘到网络、或内存到外设)中的复制次数。

        对于Java应用层来说,零拷贝有mmap和sendFile两种方式。

1.传统IO文件读写

        说零拷贝技术之前,要先了解传统的IO文件读写是怎么样的,才能更好的理解零拷贝技术,下面先说传统IO的读写工作流程。

传统IO文件读写

      传统IO文件读写如下图1-1所示:

                                                图1-1 传统IO文件读写流程图

传统IO文件读写工作流程:

整体流程

Java 程序 → 用户空间 → 内核空间(Page Cache) → 磁盘(修改数据) ↑↓(读写)       (DMA 传输)

流程分三个阶段:读取数据修改数据写回数

详细步骤与层级交互

(1) 打开文件

  • Java 代码:使用 FileInputStreamFileChannelRandomAccessFile 打开文件。

  • 系统调用open(),触发内核创建文件描述符,建立程序与文件的连接。

(2) 读取数据(磁盘 → 内核空间 → 用户空间)

  1. 磁盘到内核空间(Page Cache)

    • DMA 传输:磁盘控制器通过 DMA(直接内存访问) 将文件数据直接读取到内核的 Page Cache,无需 CPU 参与。

    • 触发方式:Java 调用 FileChannel.read(ByteBuffer)InputStream.read(),底层触发 read() 系统调用。

  2. 内核空间到用户空间

    • 数据拷贝:内核将 Page Cache 中的数据复制到用户空间的缓冲区(如 byte[]ByteBuffer)。

    • 性能开销:此拷贝由 CPU 完成,是小文件读取的主要性能瓶颈。

(3) 修改数据(用户空间内操作)

  • Java 操作:在用户空间的缓冲区中修改数据(如字符串替换、字节操作)。

  • 示例

    String content = new String(buffer.array(), StandardCharsets.UTF_8);
    String modifiedContent = content.replace("old", "new");
    byte[] newData = modifiedContent.getBytes(StandardCharsets.UTF_8);

(4) 写回数据(用户空间 → 内核空间 → 磁盘)

  1. 用户空间到内核空间(Page Cache)

    • 数据拷贝:用户空间的修改后数据通过 FileChannel.write(ByteBuffer)OutputStream.write() 触发 write() 系统调用,将数据复制到内核的 Page Cache。

    • 延迟写入:数据暂存于 Page Cache,不会立即写入磁盘。

  2. 内核空间到磁盘

    • DMA 传输:操作系统通过 DMA 将 Page Cache 中的数据异步写入磁盘。

    • 刷盘时机

      • 定时刷盘:由内核线程(如 pdflush)定期将脏页(修改过的数据)写入磁盘。

      • 强制刷盘:调用 FileChannel.force(true) 触发 fsync() 系统调用,确保数据持久化。

(5) 关闭文件

  • Java 代码:调用 close() 释放文件描述符。

  • 系统调用close(),释放内核资源。

2.mmap 零拷贝技术

  mmap 零拷贝技术 的核心是通过内存映射文件(Memory-Mapped File)将文件内容直接映射到用户空间的虚拟内存,从而避免传统 I/O 中用户空间与内核空间之间的数据拷贝。

mmap零拷贝技术IO读写

       IO文mmap零拷贝技术文件读写如下图1-2所示:

                                        图2-1 mmap零拷贝技术文件读写流程图

mmap零拷贝IO文件读写工作流程:

工作流程概述

磁盘 → Page Cache →(内存映射)→ 用户空间虚拟内存 →(修改数据)→ Page Cache → 磁盘

 详细步骤

1. 打开文件并创建内存映射

  • 用户空间
    使用 FileChannel.map() 将文件映射到用户空间的虚拟内存。

  • 内核空间
    内核将文件的磁盘块映射到 Page Cache,并建立用户空间虚拟内存与 Page Cache 的映射关系。

  • 代码示例

    FileChannel channel = FileChannel.open(Paths.get("file.txt"), StandardOpenOption.READ, StandardOpenOption.WRITE);
    MappedByteBuffer buffer = channel.map(FileChannel.MapMode.READ_WRITE, 0, channel.size());

2. 读取数据

  • 用户空间
    用户程序直接通过 MappedByteBuffer 访问数据,无需显式调用 read()

  • 内核空间
    若数据未加载到 Page Cache,触发缺页中断,内核从磁盘读取数据到 Page Cache。

  • 零拷贝
    数据直接从 Page Cache 映射到用户空间,无需复制到用户缓冲区。

3. 修改数据

  • 用户空间
    用户程序直接修改 MappedByteBuffer 中的数据。

  • 内核空间
    修改后的数据标记为 脏页(Dirty Page),暂存于 Page Cache。

4. 写回磁盘

  • 用户空间
    调用 buffer.force() 强制将脏页刷回磁盘。

  • 内核空间
    内核将脏页从 Page Cache 写回磁盘的对应位置。

  • 代码示例

    buffer.force(); // 强制刷盘

5. 关闭映射

  • 用户空间
    关闭 FileChannel,释放映射的内存区域。

  • 内核空间
    解除内存映射,释放相关资源。

  • 代码示例

    channel.close();

3.sendFile 零拷贝技术

        早期的sendFile其实和mmap一样,实现机制还是依靠CPU进行页缓存与socket缓存区之间的数据拷贝,如图3-1所示。

                                 图3-1 早期的sendFile 读写流程图

         从Linux内核2.6.33版本开始,引入了对 Scatter-Gather DMA(分散-聚集 DMA) 的支持,优化了实现机制,在拷贝过程中,并不直接拷贝文件的内容,而是只拷贝一个带有文件位置和长度等信息的文件描述符FD,这样子就大大减少了需要传递的数据。而真实的数据内容,会交由DMA控制器,从页缓存中打包异步发送到socket中。如图3-2所示。

                                       图3-2 Linux内核2.6.33 版本 sendFile 读写流程图

注意: sendfile 系统调用 的主要设计目标是 将文件数据高效地发送到网络套接字,因此它 不支持将用户空间的数据直接写入磁盘

工作流程概述

磁盘 → Page Cache →(sendfile)→ 网卡

详细步骤

1. 打开文件

  • 用户空间
    使用 FileChannel 打开文件。

  • 内核空间
    内核将文件的磁盘块映射到 Page Cache

  • 代码示例

    FileChannel fileChannel = new FileInputStream("file.txt").getChannel();

2. 打开网络套接字

  • 用户空间
    使用 SocketChannel 打开网络连接。

  • 内核空间
    内核创建 Socket Buffer,用于管理网络数据。

  • 代码示例

    SocketChannel socketChannel = SocketChannel.open(new InetSocketAddress("host", 8080));

3. 使用 sendfile 发送数据

  • 用户空间
    调用 FileChannel.transferTo(),底层使用 sendfile 系统调用。

  • 内核空间
    数据直接从 Page Cache 通过 DMA 发送到网卡,绕过用户空间。

  • 代码示例

    fileChannel.transferTo(0, fileChannel.size(), socketChannel); // 零拷贝发送

4. 关闭资源

  • 用户空间
    关闭 FileChannelSocketChannel,释放资源。

  • 内核空间
    释放 Page Cache 和 Socket Buffer 资源。

  • 代码示例

    fileChannel.close();
    socketChannel.close();

相关文章:

【零拷贝】

目录 一:了解IO基础概念 二:数据流动的层次结构 三:零拷贝 1.传统IO文件读写 2.mmap 零拷贝技术 3.sendFile 零拷贝技术 一:了解IO基础概念 理解CPU拷贝和DMA拷贝 ​ 我们知道,操作系统对于内存空间&…...

深入解析 C++ 字符串处理:提取和分割的多种方法

在 C 编程中,字符串处理是一个常见的任务,尤其是在需要从字符串中提取特定数据时。本文将详细探讨如何使用 C 标准库中的工具(如 std::istringstream 和 std::string 的成员函数)来提取和分割字符串,并分析不同方法的适…...

计算机组成原理——存储系统(一)

在人生的道路上,成功与失败交织成一幅丰富多彩的画卷。不论我们是面对胜利的喜悦,还是遭遇失败的痛苦,都不能放弃对梦想的追求。正是在这种追求中,我们不断地超越自我,不断地突破自己的极限。只有勇往直前,…...

Jenkins未在第一次登录后设置用户名,第二次登录不进去怎么办?

Jenkins在第一次进行登录的时候,只需要输入Jenkins\secrets\initialAdminPassword中的密码,登录成功后,本次我们没有修改密码,就会导致后面第二次登录,Jenkins需要进行用户名和密码的验证,但是我们根本就没…...

论文和代码解读:RF-Inversion 图像/视频编辑技术

Diffusion Models专栏文章汇总:入门与实战 前言:Rectified Flow的反演和DDIM这些不太一样,上一篇博客中介绍了腾讯提出的一种方法《基于Rectified Flow FLUX的图像编辑方法 RF-Solver》,主要就是用泰勒展开和一阶导数近似来分解反演公式。这篇博客介绍谷歌提出的方法RF-Inv…...

大模型培训讲师老师叶梓分享:DeepSeek多模态大模型janus初探

以下视频内容为叶梓分享DeepSeek多模态大模型janus的部署,并验证其实际效果,包括图生文和文生图两部分。 叶梓老师人工智能培训分享DeepSeek多模态大模型janus初探 DeepSeek 的多模态大模型 Janus 是一款强大的 AI 模型,专注于图像和文本的多…...

2025最新源支付V7全套开源版+Mac云端+五合一云端

2025最新源支付V7全套开源版Mac云端五合一云端 官方1999元, 最新非网上那种功能不全带BUG开源版,可以自己增加授权或二开 拥有卓越的性能和丰富的功能。它采用全新轻量化的界面UI,让您能更方便快捷地解决知识付费和运营赞助的难题 它基于…...

稀疏混合专家架构语言模型(MoE)

注:本文为 “稀疏混合专家架构语言模型(MoE)” 相关文章合辑。 手把手教你,从零开始实现一个稀疏混合专家架构语言模型(MoE) 机器之心 2024年02月11日 12:21 河南 选自huggingface 机器之心编译 机器之心…...

比较热门的嵌入式项目

嵌入式系统在现代科技中应用广泛,以下是一些当前比较热门的嵌入式项目方向及其应用场景: 1. 物联网(IoT) 智能家居:智能灯光、温控器、安防系统。环境监测:空气质量、温湿度、土壤湿度传感器。工业物联网&…...

牛客网 除2!(详解)c++

题目链接:除2! 1.题目解析 1:想让数组所有数之和尽可能小,肯定有个想法,就是我每次选数组中偶数的时候,我必定挑一个最大的,因为我挑一个最大的出来,把它变成一半,这个时…...

被裁与人生的意义--春节随想

还有两个月就要被迫离开工作了十多年的公司了,不过有幸安安稳稳的过了一个春节,很知足! 我是最后一批要离开的,一百多号同事都没“活到”蛇年。看着一批批仁人志士被“秋后斩首”,马上轮到我们十来个,个中滋味很难言清…...

ASP.NET Core 中间件

目录 一、常见的内置中间件 二、自定义中间件 三、中间件的执行顺序 四、其他自动逸中间件案例 1. 身份验证中间件 2、跨域中间件(CORS) ASP.NET Core 中,中间件(Middleware)是处理 HTTP 请求和响应的组件链。你…...

Pyecharts之图表样式深度定制

在数据可视化的世界里,图表的样式定制对于提升数据展示效果和用户体验至关重要。Pyecharts 提供了丰富的样式定制功能,能让我们创建出独具特色的可视化作品。本篇将深入探讨如何使用 Pyecharts 为图表添加线性渐变色、径向渐变色,以及如何添加…...

git笔记-简单入门

git笔记 git是一个分布式版本控制系统,它的优点有哪些呢?分为以下几个部分 与集中式的版本控制系统比起来,不用担心单点故障问题,只需要互相同步一下进度即可。支持离线编辑,每一个人都有一个完整的版本库。跨平台支持…...

Joplin 插件在Vscode中无法显示图片

1.问题 在vscode里面装好joplin插件之后,无法显示图片内容。 粘贴的图片可以再vscode中显示,无法再joplin客户端显示 2.解决方法 这种情况是因为和vscode自带的MD编辑器的预览模式有冲突,或者没用通过专用方式上传图片。 方法一&#xff…...

python学opencv|读取图像(四十七)使用cv2.bitwise_not()函数实现图像按位取反运算

【0】基础定义 按位与运算:两个等长度二进制数上下对齐,全1取1,其余取0。按位或运算:两个等长度二进制数上下对齐,有1取1,其余取0。 按位取反运算:一个二进制数,0变1,1变0。 【1】…...

pandas分组

分组 分组的关键要素是: 分组依据、数据来源、操作及其返回结果。 df.groupby(分组依据)[数据来源].使用操作对学生按照性别统计身高中位数。 print(df.groupby(Gender)[Height].median())上面是一维度进行分组,如果要根据多个维度分组,则…...

爬虫基础(三)Session和Cookie讲解

目录 一、前备知识点 (1)静态网页 (2)动态网页 (3)无状态HTTP 二、Session和Cookie 三、Session 四、Cookie (1)维持过程 (2)结构 正式开始说 Sessi…...

【Super Tilemap Editor使用详解】(十三):快捷键指南(Keyboard Shortcuts)

在使用 Super Tilemap Editor 进行图块地图编辑时,键盘快捷键可以显著提高工作效率。本文将详细介绍常用的快捷键及其功能,帮助你更快地完成图块绘制、翻转、旋转以及工具切换等操作。 一、快捷键文件位置 所有键盘快捷键的定义可以在以下路径找到&…...

【Leetcode 每日一题】119. 杨辉三角 II

问题背景 给定一个非负索引 r o w I n d e x rowIndex rowIndex,返回「杨辉三角」的第 r o w I n d e x rowIndex rowIndex 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 数据约束 0 ≤ r o w I n d e x ≤ 33 0 \le rowIndex \le 33 …...

SMUDebugTool终极指南:AMD Ryzen系统硬件调试与性能优化的完整解决方案

SMUDebugTool终极指南:AMD Ryzen系统硬件调试与性能优化的完整解决方案 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目…...

ugrep布尔搜索实战:使用AND/OR/NOT构建复杂查询

ugrep布尔搜索实战:使用AND/OR/NOT构建复杂查询 【免费下载链接】ugrep Ugrep 4.3: an ultra fast, user-friendly, compatible grep. Ugrep combines the best features of other grep, adds new features, and searches fast. Includes a TUI and adds Google-lik…...

SRS+WebRTC直播搭建实录:用安卓手机做推流器的5个关键步骤

SRSWebRTC直播搭建实录:用安卓手机做推流器的5个关键步骤 移动直播的轻量化趋势正在重塑内容创作生态。当专业摄像机与PC推流设备显得笨重时,一台随身携带的安卓手机配合SRSWebRTC技术栈,就能实现低于500ms延迟的直播推流方案。本文将拆解从设…...

Qwen3.5-2B多场景案例:法律文书图识别+法条关联+类案推荐三合一系统

Qwen3.5-2B多场景案例:法律文书图识别法条关联类案推荐三合一系统 1. 轻量化多模态模型介绍 Qwen3.5-2B是Qwen3.5系列中的轻量化版本,仅有20亿参数规模,专为低功耗、低门槛部署场景设计。这款模型特别适合部署在端侧和边缘设备上&#xff0…...

SpringAI实践(07) - 本地向量嵌入模型集成指南

SpringAI实践(07) - 本地向量嵌入模型集成指南 1.概述 本文档详细说明如何在 SpringBoot 应用中集成本地部署的 ONNX 格式向量嵌入模型(如 bge-small-zh),通过 spring-ai-starter-model-transformers 模块调用 ONNX …...

CODESYS组件开发进阶:如何通过修改.m4文件调用SysFile等系统函数(附实例代码)

CODESYS组件开发进阶:深入解析.m4文件配置与系统函数调用实战 在工业自动化领域,CODESYS作为主流的PLC开发平台,其组件化开发能力为工程师提供了极大的灵活性。但当你需要突破基础功能限制,实现文件操作、系统管理等高级功能时&am…...

PyTorch升级1.10.1后GPU失效?3分钟搞定CUDA环境回滚(以Colab对比为例)

PyTorch 1.10.1 GPU失效排查与CUDA环境精准回滚指南 当你满心欢喜地升级到PyTorch最新版本1.10.1,准备继续你的深度学习项目时,突然发现GPU无法正常工作——这种"昨天还能用,今天突然报错"的场景让许多开发者抓狂。本文将带你深入分…...

缺失值处理失效、类型推断崩塌、内存暴增…Polars 2.0清洗故障全解析,深度解读Arrow底层Schema约束机制

第一章:Polars 2.0数据清洗的核心挑战与演进脉络随着数据规模持续膨胀与实时分析需求激增,传统基于 Pandas 的数据清洗范式在内存效率、并行粒度和类型安全方面日益显露瓶颈。Polars 2.0 的发布并非简单功能叠加,而是以 Arrow-native 执行引擎…...

Java TCC到底要不要用?90%团队踩坑的4个认知误区,今天一次性说透

第一章:Java TCC到底要不要用?90%团队踩坑的4个认知误区,今天一次性说透TCC(Try-Confirm-Cancel)作为分布式事务的一种经典模式,在 Java 生态中常被误认为“高可用银弹”或“微服务标配”。但真实生产实践中…...

OpenClaw+Phi-3-vision-128k-instruct医疗辅助:医学影像报告自动生成系统

OpenClawPhi-3-vision-128k-instruct医疗辅助:医学影像报告自动生成系统 1. 医疗AI落地的隐私合规挑战 去年参与某三甲医院科研项目时,我深刻体会到医疗AI落地的核心矛盾——技术潜力与隐私合规的冲突。当时我们需要处理数千份CT影像,传统人…...