当前位置: 首页 > article >正文

【Linux篇】缓冲区的工作原理:如何影响你程序的输入输出速度

从内存到磁盘:缓冲区如何提升文件I/O效率

  • 一. 缓冲区
    • 1.1 什么是缓冲区
    • 1.2 为什么要引入缓冲区
    • 1.3 缓冲区类型
    • 1.4 FILE
      • 1.4.1 基本概念
      • 1.4.2 FILE 结构体的作用
      • 1.4.3 FILE 的工作机制
  • 二. 最后

在程序开发中,缓冲区是一个经常被提及却不容易深入理解的概念。它不仅在文件操作中起着至关重要的作用,还与程序的执行效率息息相关。无论是处理磁盘读写、网络数据传输,还是标准输入输出,缓冲区都默默地为程序提供性能上的提升。本文将带你从零开始深入理解缓冲区的工作原理,探讨它在程序中的重要性,并通过具体的实例展示如何通过合理的缓冲区管理,显著提高程序的效率。通过简单易懂的解析,你将掌握缓冲区背后的秘密,提升你的编程技巧和对操作系统底层机制的理解。

💬 欢迎讨论:如果你在学习过程中有任何问题或想法,欢迎在评论区留言,我们一起交流学习。你的支持是我继续创作的动力!
👍 点赞、收藏与分享:觉得这篇文章对你有帮助吗?别忘了点赞、收藏并分享给更多的小伙伴哦!你们的支持是我不断进步的动力!
🚀 分享给更多人:如果你觉得这篇文章对你有帮助,欢迎分享给更多对Linux OS感兴趣的朋友,让我们一起进步!

一. 缓冲区

1.1 什么是缓冲区

缓冲区是计算机内存中的一块临时存储区域,用于存储即将被处理或已经处理的数据。它的主要目的是提高程序效率,特别是在进行I/O操作时。由于磁盘或网络的读写速度远低于CPU的处理速度,直接进行频繁的I/O操作会导致性能瓶颈。缓冲区通过先将数据读入内存,再一次性写入或读取,减少了I/O操作的频率,从而提升了效率。常见的缓冲区应用包括文件操作中的数据缓冲、网络数据传输中的数据缓存等。合理利用缓冲区能显著提高程序的响应速度和整体性能。

1.2 为什么要引入缓冲区

引入缓冲区的主要原因是 提高程序的效率和性能,特别是在处理输入输出(I/O)操作时。具体原因包括:

  1. 性能提升:
    磁盘、网络等外部设备的读写速度通常远低于内存访问速度。直接与这些设备进行频繁的数据交互会导致程序性能下降。缓冲区通过将数据暂时存储在内存中,减少了I/O操作的次数,从而提高了数据处理效率。
  2. 减少I/O操作频率:
    每次I/O操作(如磁盘写入或网络传输)都有较高的开销。通过使用缓冲区,程序可以批量处理数据,减少与外部设备的交互频率,从而降低系统负担。
  3. 平滑数据流: 在数据传输过程中,缓冲区可以暂存数据,确保数据流的平稳处理,避免因为设备速度不一致而导致的程序阻塞或延迟。
  4. 优化资源使用: 缓冲区使得程序能够更有效地利用内存和CPU资源,避免因频繁等待I/O操作而造成的资源浪费。

总的来说,缓冲区通过减少不必要的I/O操作、提升数据处理速度,显著优化了程序的整体性能。

1.3 缓冲区类型

  1. 全缓冲区(Full Buffering)
    定义:全缓冲区是指数据在缓冲区中存储直到缓冲区填满或达到一定大小后才进行读写操作。

应用场景:常用于大文件或大量数据的处理,例如文件写入操作。

优点:减少了I/O操作的次数,提高了性能。

缺点:当缓冲区未填满时,程序需要等待,可能导致延迟。

示例:当你使用 fwrite() 或 printf() 向文件写入数据时,系统会先将数据写入缓冲区,直到缓冲区满了才会将数据实际写入文件。

  1. 行缓冲区(Line Buffering)
    定义:行缓冲区会在每一行数据写入时进行刷新(通常遇到换行符时)。它不像全缓冲那样等待缓冲区填满,而是在每行结束时刷新数据。

应用场景:常用于终端输出(例如,标准输出和标准错误),每当遇到换行符(\n)时,缓冲区会被刷新并立即写入终端。

优点:适用于交互式程序,输出数据及时反馈给用户。

缺点:相比全缓冲,可能会导致更多的I/O操作,降低性能。

示例:stdout 在行缓冲模式下,调用 printf(“Hello World\n”); 后,输出会立即显示。

  1. 无缓冲区(No Buffering)
    定义:无缓冲区模式下,每次写入或读取数据时,都会直接进行I/O操作,而不经过缓冲区。

应用场景:用于需要实时性或高精度控制的场景,例如与硬件设备或需要立即响应的网络操作。

优点:可以确保数据及时处理,适用于对延迟要求严格的应用。

缺点:频繁的I/O操作会导致系统效率低下,因为每个数据操作都涉及到昂贵的硬盘或网络访问。

示例:使用 stderr(标准错误输出)通常是无缓冲的,错误信息会立即输出,而不会被缓存。

  1. 双缓冲区(Double Buffering)
    定义:双缓冲技术使用两个缓冲区交替工作,避免了在渲染或数据传输过程中出现闪烁或延迟的现象。

应用场景:常用于图形处理、视频播放或实时数据渲染等场景。

优点:通过避免在显示过程中直接操作数据缓冲,能够提供更流畅的显示体验。

缺点:需要更多的内存资源来维护两个缓冲区。

示例:图形显示或视频渲染中,应用通常使用双缓冲来确保画面流畅过渡。

  1. 循环缓冲区(Circular Buffer)
    定义:循环缓冲区是一种特殊类型的缓冲区,缓冲区的末尾与开头相连,因此当缓冲区已满时,新的数据会覆盖掉最旧的数据。

应用场景:用于实时流数据处理,如音频、视频流或通信协议中的数据缓存。

优点:无需频繁的内存分配和释放,适合实时数据流的处理。

缺点:如果数据没有及时处理,旧的数据可能被覆盖。

示例:音频处理或网络数据流中的缓冲区,处理数据时可能会覆盖过期的无效数据。

  1. 预读缓冲区(Read-ahead Buffering)
    定义:预读缓冲区用于在数据真正需要时,提前将数据从磁盘或其他外部设备读取到内存中,以减少访问延迟。

应用场景:通常用于文件系统或数据库中,提前加载文件或数据库的内容,以便快速响应请求。

优点:提高了数据访问速度,减少了等待时间。

缺点:可能会浪费内存资源,如果数据访问模式不可预测,可能会读取过多不需要的数据。

示例:操作系统中的文件缓存机制,提前加载文件内容,提高后续读取的速度。

1.4 FILE

1.4.1 基本概念

在 C 语言中,FILE 是一个由标准库定义的结构体,用于表示一个文件流。它是与文件操作相关的核心数据结构,通常通过 FILE * 类型的指针来引用。FILE 结构体封装了文件的状态信息,包括文件的缓冲区、文件指针、文件描述符等,用于支持 C 语言中对文件的读写操作。

1.4.2 FILE 结构体的作用

FILE 结构体用于在内存中表示一个文件流,它不仅与文件的物理位置相关,还包含文件当前的读写位置、缓冲区状态、错误标志等信息。通过 FILE * 指针,程序能够方便地进行文件操作,而不需要直接处理底层的文件描述符。

通过代码测试:

示例代码:

#include <stdio.h>
#include <string.h>
int main()
{
const char *msg0="hello printf\n";
const char *msg1="hello fwrite\n";
const char *msg2="hello write\n";
printf("%s", msg0);
fwrite(msg1, strlen(msg0), 1, stdout);
write(1, msg2, strlen(msg2));
fork();
return 0;
}

运行结果:

hello printf
hello fwrite
hello write

但如果对进程实现输出重定向呢? ./hello > file:
输出结果:

hello write
hello printf
hello fwrite
hello printf
hello fwrite

补充当用户进行如下操作,会将数据拷贝至内核缓冲区:

  1. 强制刷新
  2. 刷新条件满足
  3. 进程退出

解释(原理):
因为写入进去的是文件,而文件的缓冲类型一般是全缓冲。发现与库函数相关的函数打印了两次,而系统调用只打印1次。
C库函数将数据写入语言层缓冲区,write()系统调用直接写在内核缓冲区,OS会直接将在此中的数据直接刷新到磁盘中,并清空数据,因为内核缓冲区里面的数据具有临时性,所以系统调用写入的数据只打印1次;而语言层的数据具有永久性forkk后,进程退出时(满足刷新条件),父子进程各自将自己语言层缓冲区的数据通过fd+write()拷贝到内核缓冲区,所以与语言有关的函数的数据会打印2次。
数据流动的本质:将语言层缓冲区的数据拷贝至内核缓冲区,OS自主决定将此数据刷新至外设(网卡,磁盘等)。

1.4.3 FILE 的工作机制

  1. 缓冲区:FILE 对象通常使用缓冲区来提高 I/O
    操作的效率。通过缓冲区,数据可以先存入内存,等到缓冲区满了再批量写入或读取,减少了与磁盘的频繁交互。具体的缓冲策略可以通过
    setvbuf() 来调整。
  2. 文件描述符与 FILE:在底层,FILE 结构体通过文件描述符与操作系统进行交互。文件描述符是与文件相关的一个整数值,而 FILE
    是对该文件描述符的更高层次的封装。

小结
FILE 结构体在 C 语言的文件操作中起着至关重要的作用,它提供了一个抽象层,使得程序员能够方便地进行文件的读写、定位等操作,而无需直接处理底层的文件描述符。掌握 FILE 的使用,可以有效简化文件操作的复杂性,同时提高程序的效率和可读性。

二. 最后

本文主要讲解了缓冲区在提升文件I/O效率中的重要作用。缓冲区通过将数据暂时存储在内存中,减少与磁盘等外部设备的频繁交互,显著提高了程序的执行效率。文章介绍了缓冲区的不同类型,如全缓冲、行缓冲、无缓冲、双缓冲、循环缓冲等,并详细阐述了 C 语言中的 FILE 结构体,说明了其如何通过缓冲区和文件描述符与操作系统交互,优化文件操作。通过合理使用缓冲区,程序不仅能提升性能,还能减少 I/O 操作的开销,提高整体运行效率。

路虽远,行则将至;事虽难,做则必成

亲爱的读者们,下一篇文章再会!!! \color{Red}亲爱的读者们,下一篇文章再会!!! 亲爱的读者们,下一篇文章再会!!!

相关文章:

【Linux篇】缓冲区的工作原理:如何影响你程序的输入输出速度

从内存到磁盘&#xff1a;缓冲区如何提升文件I/O效率 一. 缓冲区1.1 什么是缓冲区1.2 为什么要引入缓冲区1.3 缓冲区类型1.4 FILE1.4.1 基本概念1.4.2 FILE 结构体的作用1.4.3 FILE 的工作机制 二. 最后 在程序开发中&#xff0c;缓冲区是一个经常被提及却不容易深入理解的概念…...

kotlin,Android,jetpack compose,日期时间设置

AI生成&#xff0c;调试出来学习&#xff0c;这些小组件会用了&#xff0c;就可以组合一个大点的程序了。 package com.example.mydatetimeimport android.app.AlertDialog import android.os.Bundle import androidx.activity.ComponentActivity import androidx.activity.co…...

ASP.NET图书馆借阅系统(源码+lw+部署文档+讲解),源码可白嫖!

摘要 近些年来&#xff0c;随着科技的飞速发展&#xff0c;互联网的普及逐渐延伸到各行各业中&#xff0c;给人们生活带来了十分的便利&#xff0c;图书馆借阅系统利用计算机网络实现信息化管理&#xff0c;使图书信息、图书借阅、归还的管理发展和服务水平有显著提升。 本文拟…...

LeetCode算法题(Go语言实现)_35

题目 给你一棵根为 root 的二叉树&#xff0c;请你返回二叉树中好节点的数目。 「好节点」X 定义为&#xff1a;从根到该节点 X 所经过的节点中&#xff0c;没有任何节点的值大于 X 的值。 一、代码实现 func goodNodes(root *TreeNode) int {if root nil {return 0}return d…...

vi/vim常用快捷键

那么今天我们继续昨天没有介绍完的vi编辑器,来看看常用的一些快捷键,方便我们对文件的编辑. 1.拷贝当前行yy,拷贝当前行向下的5行5yy,并粘贴(输入p) 2.删除当前行dd,删除当前行向下的5行5d 3.在文件中查找某个单词[命令模式/关键字,回车查找,输入n就是查找下一个] ⭐️&…...

JVM核心机制:类加载×字节码引擎×垃圾回收机制

&#x1f680;前言 “为什么你的Spring应用启动慢&#xff1f;为什么GC总是突然卡顿&#xff1f;答案藏在JVM的核心机制里&#xff01; 本文将用全流程图解字节码案例&#xff0c;带你穿透三大核心机制&#xff1a; 类加载&#xff1a;双亲委派如何防止恶意代码入侵&#xff…...

opencv无法设置禁用RGB转换问题

树莓派连接摄像头,摄像头输出格式为YUYV(YUV422)。 通过执行 v4l2-ctl --list-formats --device/dev/video0 可以看的具体的摄像头的数据格式。 使用opencv获取视频流&#xff0c;通过cap.set(cv2.CAP_PROP_CONVERT_RGB, 0)设置禁用自动转换RGB格式&#xff0c;但是打印输出…...

k8s 1.30.6版本部署(使用canal插件)

#系统环境准备 参考 https://blog.csdn.net/dingzy1/article/details/147062698?spm1001.2014.3001.5501 #配置下载源 curl -fsSL https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.30/deb/Release.key |gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyri…...

GZ036区块链卷一 EtherStore合约漏洞详解

题目 pragma solidity >0.8.3;contract EtherStore {mapping(address > uint) public balances;function deposit() public payable {balances[msg.sender] msg.value;emit Balance(balances[msg.sender]);}function withdraw() public {uint bal balances[msg.sender…...

MCP+Blender创建电力塔

MCP&#xff08;Model Context Protocol&#xff09;与Blender的结合是当前AI与3D建模领域的热门技术&#xff0c;它通过协议化的方式让Claude等AI模型直接控制Blender&#xff0c;实现自动化3D建模。 1. 功能与原理 • 核心能力&#xff1a;用户通过自然语言指令&#xff08;…...

什么是RACI矩阵,应用在什么场景?

一、什么是RACI RACI矩阵是一种用于明确项目或任务中角色与责任的管理工具&#xff0c;通过定义不同人员在任务中的参与程度来避免职责不清的问题。以下是其核心要点&#xff1a; ‌RACI的含义‌ ● ‌R&#xff08;Responsible&#xff09;执行者‌&#xff1a;直接完成任务…...

Selenium自动化:玩转浏览器,搞定动态页面爬取

嘿&#xff0c;各位爬虫爱好者和自动化达人们&#xff01;是不是经常遇到这种情况&#xff1a;信心满满地写好爬虫&#xff0c;requests一把梭&#xff0c;结果抓下来的HTML里&#xff0c;想要的数据空空如也&#xff1f;定睛一看&#xff0c;原来数据是靠JavaScript动态加载出…...

QAI AppBuilder 快速上手(8): 图像修复应用实例2

LaMa-Dilated模型旨在通过扩张卷积技术实现高效的图像擦除和修复。该模型采用先进的卷积神经网络架构&#xff0c;能够处理复杂的图像输入&#xff0c;并填补图像中的缺失部分&#xff0c;使修复后的图像更加自然和逼真。LaMa-Dilated不仅在图像编辑领域表现出色&#xff0c;还…...

`ConstantPositionProperty` 的使用与应用

ConstantPositionProperty 的使用与应用 1. 什么是 ConstantPositionProperty&#xff1f; ConstantPositionProperty 是 Cesium 中用于表示实体位置的属性类。它表示一个实体在三维空间中的位置是固定的&#xff0c;不会随时间变化。与动态位置属性&#xff08;如 SampledPo…...

【计网】作业4

一. 单选题&#xff08;共22题&#xff0c;64分&#xff09; 1. (单选题)主机甲采用停止-等待协议向主机乙发送数据&#xff0c;数据传输速率是4kb/s&#xff0c;单向传播时延为30ms&#xff0c;忽略确认帧的发送时延。当信道利用率等于80%时&#xff0c;数据帧的长度为&#…...

MPDrive:利用基于标记的提示学习提高自动驾驶的空间理解能力

25年4月来自南方科技大学、百度、英国 KCL和琶洲实验室&#xff08;广东 AI 和数字经济实验室&#xff09;的论文“MPDrive: Improving Spatial Understanding with Marker-Based Prompt Learning for Autonomous Driving”。 自动驾驶视觉问答&#xff08;AD-VQA&#xff09;…...

QTSql全解析:从连接到查询的数据库集成指南

概览 与数据库的有效集成是确保数据管理效率和应用性能的关键&#xff0c;Qt框架就提供了强大的QtSql模块&#xff0c;使得开发者能够轻松地进行数据库操作&#xff0c;包括连接、查询执行以及结果处理等 一、引入QtSql模块 首先&#xff0c;需要在项目中引入QtSql模块&…...

FreeRTOS临界区

在FreeRTOS中&#xff0c;临界区通过关闭可管理的中断来保护共享资源&#xff0c;具体关闭的中断层级由configMAX_SYSCALL_INTERRUPT_PRIORITY宏定义决定。以下是关键点解析&#xff1a; 中断优先级分类&#xff1a; 高优先级中断&#xff1a;数值低于configMAX_SYSCALL_INTERR…...

【学习笔记】HTTP和HTTPS的核心区别及工作原理

一、基础概念 HTTP&#xff08;超文本传输协议&#xff09;&#xff1a;明文传输数据&#xff0c;默认端口80&#xff0c;容易被窃听或篡改。 HTTPS&#xff08;HTTP SSL/TLS&#xff09;&#xff1a;通过加密传输数据&#xff0c;默认端口443&#xff0c;保障安全性。 二、…...

Dubbo的简单介绍

Dubbo的简单介绍 Dubbo 是一个高性能的 Java RPC 框架&#xff0c;最初由阿里巴巴开发&#xff0c;用于构建分布式服务。它主要用于提供服务间的通信&#xff0c;支持高效的远程调用和服务治理&#xff0c;常用于大规模分布式系统中。Dubbo 提供了以下几个核心功能&#xff1a…...

7.2 重复推送(每日、每周等)

1. 核心方法 使用 UNCalendarNotificationTrigger 的 dateMatching 参数配置日历组件&#xff08;DateComponents&#xff09;&#xff0c;结合 repeats: true 实现周期性触发。 2. 不同频率的重复推送配置 2.1 每日重复 每天固定时间触发&#xff08;如上午 10:00&#xff…...

【STL】list介绍(附与vector的比较)

文章目录 1.关于list2.使用2.1 list的构造2.2 list 迭代器的使用2.3 list 容量操作2.3.1 size()2.3.2 empty()2.3.3 resize() 2.4 list 元素访问2.4.1 front()2.4.2 back() 2.5 list 修改操作2.5.1 push_front()2.5.2 pop_front()2.5.3 push_back()2.5.4 pop_back()2.5.5 inser…...

Ansible:roles角色

文章目录 Roles角色Ansible Roles目录编排Roles各目录作用创建 roleplaybook调用角色调用角色方法1&#xff1a;调用角色方法2&#xff1a;调用角色方法3&#xff1a; roles 中 tags 使用实战案例 Roles角色 角色是ansible自1.2版本引入的新特性&#xff0c;用于层次性、结构化…...

找不到导入的项目“xxx\QtMsBuild\Qt.props”。请确认 Import 声明“$(QtMsBuild)\Qt.props”中计算结果为

系列文章目录 文章目录 系列文章目录前言一、问题原因 前言 新建的项目visual studio2022 使用Qt vs tools 找不到导入的项目“E:\osgEarth\DigitalSimulationPlatform\DigitalSimulationPlatform\QtMsBuild\Qt.props”。 请确认 Import 声明“$(QtMsBuild)\Qt.props”中计算结…...

Rust 是如何层层防错的

一、Rust 的多层防错机制 &#x1f9f1; 第一层&#xff1a;Rust语言自带的“编译时护盾” —— 错误连运行都跑不起来 错误类型Rust 怎么发现的&#xff1f;工具/机制举个例子✅ 语法缺陷写错了代码格式或语法Rust Analyzer&#xff08;智能补全&#xff09;少写了分号、括号…...

SQL Server 数据库邮件配置失败:SMTP 连接与权限问题

问题现象&#xff1a; 配置数据库邮件时&#xff0c;发送测试邮件失败&#xff0c;提示 “邮件无法发送到 SMTP 服务器&#xff0c;操作超时”&#xff08;错误 14661&#xff09;或 “服务器拒绝发件人地址”&#xff08;错误 15009&#xff09;。 快速诊断 检查数据库邮件配置…...

2025 年福建交安安全员考试:结合本省交通特点备考​

福建地处东南沿海&#xff0c;交通建设具有独特特点&#xff0c;这对交安安全员考试备考意义重大。在桥梁建设方面&#xff0c;由于面临复杂的海洋环境&#xff0c;桥梁的防腐、防台风等安全措施成为重点。考生在学习桥梁施工安全知识时&#xff0c;要特别关注福建本地跨海大桥…...

OpenBMC:BmcWeb 处理http请求5 检查权限

OpenBMC:BmcWeb 处理http请求4 处理路由对象-CSDN博客 在通过url获取了路由对象后,如果该请求是有session的,那么下一步需要检查权限 1.validatePrivilege调用时传入了一个lambda(1)做为回调 validatePrivilege(req, asyncResp, rule,[req, asyncResp, &rule, params =…...

996引擎-源码学习:Cocos2d-Lua 的 class(classname, ...)

996引擎-源码学习:Cocos2d-Lua 的 class(classname, ...) 一、核心方法调用顺序用户调用入口完整调用链二、__create 工厂方法的三种情形情形1:父类为函数(自定义工厂)情形2:父类为Cocos原生类情形3:父类为普通Lua表三、方法职责与内存管理对照表四、正确使用示例示例1…...

UE5 蓝图里的声音

文章目录 支持的格式设置循环播放在场景中放置音频设置音频的衰减与不衰减在UI动画中播放声音使用蓝图节点播放声音按钮本身就可以播放声音 支持的格式 支持&#xff1a;WAV 不支持&#xff1a;MP3 设置循环播放 双击音频&#xff0c;打开音频设置&#xff0c;勾选Looping …...