C语言——文件缓冲区
一、用户缓冲区和系统缓冲区
缓冲区的概念确实可以分为多个层次,其中最常见的两个层次是用户缓冲区和系统缓冲区。
这里的用户缓冲区和系统缓冲区都包括输入输出缓冲区。
1、用户缓冲区(User-space Buffer)
用户缓冲区是指由用户程序(如C语言程序)在用户空间(即非内核空间)中分配和管理的内存区域。在C语言中,当使用标准I/O库(如stdio.h
中定义的函数)进行文件操作时,标准I/O库会自动为每个打开的文件流(FILE*
)分配一个用户缓冲区。这个缓冲区用于暂存读取或写入的数据,以减少对系统调用的依赖,从而提高I/O效率。我们下面将对这个缓冲区进行详细的讲解。
用户缓冲区的特点:
-
由用户程序控制,通常由C标准I/O库管理。
-
用于减少系统调用的次数,提高I/O效率。
-
可以通过
setvbuf
或setbuf
函数来设置缓冲区的大小和类型(全缓冲、行缓冲、无缓冲)。
2、系统(内核)缓冲区(Kernel-space Buffer)
系统缓冲区是指由操作系统内核在系统空间中分配和管理的内存区域。当用户程序通过系统调用(如read
、write
)进行文件I/O操作时,操作系统会在内核中为这些操作分配缓冲区。系统缓冲区用于暂存从磁盘读取的数据或准备写入磁盘的数据,以减少对物理设备的直接访问,提高I/O性能。
系统缓冲区的特点:
-
由操作系统内核控制,用户程序无法直接访问。
-
用于减少对物理设备的访问次数,提高I/O效率。
-
在某些情况下,用户程序需要显式地调用
fsync
、fdatasync
或sync
等函数来确保数据被写入磁盘,以避免数据丢失。
3、总结
用户缓冲区和系统缓冲区都是为了提高I/O操作的效率而设计的,但它们位于不同的内存空间,由不同的实体管理。用户缓冲区是用户程序的一部分,而系统缓冲区是操作系统内核的一部分。在实际的文件I/O操作中,这两种类型的缓冲区可能会同时存在,共同协作以优化性能。例如,用户程序可能首先将数据写入用户缓冲区,然后由C标准I/O库将数据从用户缓冲区转移到系统缓冲区(这里是通过调用系统接口),最终由操作系统内核将数据写入磁盘。
二、文件缓冲区
1、介绍
缓冲文件系统(Buffered I/O)是标准C(ANSI C)中处理文件输入输出的一种机制。它是C语言标准库提供的一种文件处理方式,旨在提高文件读写的效率,同时减少对系统调用接口的调用次数。缓冲文件系统通过在内存中为每一个正在使用的文件自动开辟一个文件缓冲区来实现这一目的。
Word文档在编辑时创建的带有 "~$" 前缀的同名文件是一个临时文件,它就是作为一种缓冲机制来提高数据处理效率。
磁盘的访问速度是小于RAM的,当我们在对Word文档进行编辑时,数据其实是先保存在这个临时文件中的,然后在我们按下Ctrl + S(即完成编辑并保存文档时),Word才会将临时文件中的数据写入原始文档。这种一次性写入原始文件而不是多次写入可以减少磁盘损耗并提高性能。
这里的这个临时文件就可以看做一种缓冲区的技术。
2、缓冲区的刷新策略
缓冲区的刷新策略是操作系统或编程语言库用来管理输入输出(I/O)缓冲区的一种机制。不同的刷新策略适用于不同的I/O场景,以优化性能和效率。以下是三种缓冲区刷新策略的详细解释:
1)立即刷新(无缓冲,Unbuffered)
特点:数据一旦产生就立即被写入到目的地,每次写入操作都会立即发送到目标设备,不使用缓冲区来暂存数据。
适用场景:适用于需要立即看到输出结果的场景,比如标准错误输出(stderr)通常是无缓冲的,以便错误信息可以立即显示给用户,或者对于数据一致性要求极高的应用。
由于每次操作都需要与设备交互,这种策略可能会导致较低的I/O效率。在C语言中,可以使用setbuf(stdout, NULL)
来关闭标准输出的缓冲。
2) 行刷新(行缓冲,Line Buffered)
特点:在这种策略下,缓冲区会暂存数据,当缓冲区中遇到换行符(\n
)时,或者缓冲区满时,数据会被写入到目的地。
适用场景:适用于交互式程序,如终端I/O,因为用户通常期望在输入换行符后看到输出。比如向终端或控制台输出文本。
在C语言中,标准输出(stdout
)默认是行缓冲的,当程序输出换行符时,数据会被立即写入到终端。行缓冲可以提高效率,因为它减少了与设备的交互次数,同时保持了良好的用户体验,因为用户可以看到按行输出的内容。
3)全缓冲(Fully Buffered)
特点:只有当缓冲区满时,直到缓冲区满、程序显式调用刷新函数(如 fflush
)、或者程序结束时,数据才会被写入到目的地。
适用场景:适用于大量数据传输的场景,如向磁盘文件写入数据,因为这样可以减少磁盘I/O操作的次数,提高效率。
在C语言中,文件I/O默认是全缓冲的,可以使用setvbuf
函数来设置缓冲区的大小和类型。全缓冲可以最大化I/O效率,因为它允许操作系统或库函数以最优的方式与设备交互,减少了小数据块的频繁写入。
3、证明缓冲区的存在
我们可以通过下面的代码来证明缓冲区是存在的:
#include <stdio.h>
#include <Windows.h>int main() {FILE* pf = fopen("test.txt", "w");if (pf == NULL) {perror("fopen");return -1;}fputs("abcdef", pf);//写入内容,实际上会存入输出缓冲区printf("下面会暂停,但是缓冲区不会刷新,所以打开文件会发现文件没有内容\n\n");system("pause");//暂停,这时可以打开文件,发现文件内没有内容,表明缓冲区是存在的fflush(pf);//刷新缓冲区,这时缓冲区中的内容会写入文件中printf("下面会暂停,缓冲区在上面的fflush语句就已经刷新,所以打开文件会发现文件有内容了\n\n");system("pause");//暂停,这时可以打开文件,发现文件内出现内容,表明fflush刷新缓冲区fclose(pf);//实际上,fclose也会刷新缓冲区pf = NULL;return 0;
}
运行结果:
相关文章:

C语言——文件缓冲区
一、用户缓冲区和系统缓冲区 缓冲区的概念确实可以分为多个层次,其中最常见的两个层次是用户缓冲区和系统缓冲区。 这里的用户缓冲区和系统缓冲区都包括输入输出缓冲区。 1、用户缓冲区(User-space Buffer) 用户缓冲区是指由用户程序&…...

如何快速检测原理图中的元器件与PLM系统的一致性,提高原理图设计准确性
背景介绍 保证原理图中的元器件来源于公司的PLM系统、ERP系统的,是输出有效BOM的根源,初始BOM的准确率,能大大降低ECN的数量,提高生产备料的时效,缩短采购周期。 然而,原理图设计过程中,由于…...

英特尔处理器排行
英特尔的处理器性能排行通常是根据其发布的不同代数和型号来划分的,以下是一些高性能的英特尔处理器: Intel 酷睿 i9 14900K:这是目前英特尔桌面平台中的旗舰处理器之一,提供了极高的性能,适合高端游戏和专业工作负载…...

【日志革新】在ThinkPHP5中实现高效TraceId集成,打造可靠的日志追踪系统
问题背景 最近接手了一个骨灰级的项目,然而在项目中遇到了一个普遍的挑战:由于公司采用 ELK(Elasticsearch、Logstash、Kibana)作为日志收集和分析工具,追踪生产问题成为了一大难题。尽管 ELK 提供了强大的日志分析功…...
英译汉早操练-(二十)
hello大家好,这篇跟随十九,继续真题学习。如果想看全部请返回到第十九篇。 英译汉早操练-(十九)-CSDN博客 The political upheaval in Libya and elsewhere in North Africa has opened the way for thousands of new migrants to…...

Go-Zero自定义goctl实战:定制化模板,加速你的微服务开发效率(四)
前言 上一篇文章带你实现了Go-Zero和goctl:解锁微服务开发的神器,快速上手指南,本文将继续深入探讨Go-Zero的强大之处,并介绍如何使用goctl工具实现模板定制化,并根据实际项目业务需求进行模板定制化实现。 通过本文…...

(五)STM32F407 cubemx IIC驱动OLED(1)IIC协议篇
(五)STM32F407 cubemx IIC驱动OLED(1)IIC协议篇 这篇文章主要是个人的学习经验,想分享出来供大家提供思路,如果其中有不足之处请批评指正哈。 废话不多说直接开始主题,本人是基于STM32F407V…...
OpenCV特征匹配总结
1.概述 在深度学习出现之前,图像中的特征匹配方法主要有 2.理论对比 3.代码实现 #include <iostream> #include <opencv2/opencv.hpp>int main(int argc, char** argv) {if(argc ! 3) {std::cerr << "Usage: " << argv[0] <…...

二叉树的四种遍历代码实现
二叉树的遍历大致能分为以下几种 1.前序:根 左 右 2.中序:左 根 右 3.后序:左 右 根 4.层序:从根开始一层一层的向下 如上图访问顺序: 前序:1 2 3 N N N 4 5 N N 6 N N 中序:N 3 N 2 N 1 N 5 N 4 N …...
系统和功能测试:确保软件的功能和易用性
目录 概述 功能测试 LOSED 模型 用例的设计 等价类划分 边界值分析 循环结构测试的综合方法 因果图 决策表 功能图 正交实验设计 易用性测试 内部易用性测试 外部易用性测试 功能性测试 正向功能性测试 负向功能性测试 功能性测试工具 结语 概述 在软件开发…...

关于服务端接口知识的汇总
大家好,今天给大家分享一下之前整理的关于接口知识的汇总,对于测试人员来说,深入了解接口知识能带来诸多显著的好处。 一、为什么要了解接口知识? 接口是系统不同模块之间交互的关键通道。只有充分掌握接口知识,才能…...

树(数据结构)
树的定义 一个根结点,其余结点分为 m 个不相交的集合, 其中每个集合本身又是一棵树,并且称为根的子树。 树的根结点没有前驱,其他结点有且仅有一个前驱。 所有结点可以有0个或多个后继。 基本术语 结点的度 树的度 : 树…...

Spring底层入门(十一)
1、条件装配 在上一篇中,我们介绍了Spring,Spring MVC常见类的自动装配,在源码中可见许多以Conditional...开头的注解: Conditional 注解是Spring 框架提供的一种条件化装配的机制,它可以根据特定的条件来控制 Bean 的…...

优质资料:大型制造企业等级保护安全建设整改依据,系统现状分析,网络安全风险分析
第1章 项目概述 XX 大型制造型企业是国内一家大型从事制造型出口贸易的大型综合企业集团,为了落实国家及集团的信息安全等级保护制度,提高信息系统的安全防护水平,细化各项信息网络安全工作措施,提升网络与信息系统工作的效率&am…...
几种监控工具学习
在Linux上有很多监控工具,比如Zabbix、Prometheus、APM和ELK 监控工具是确保系统稳定运行的关键组件之一,它可以帮助系统管理员和开发人员及时发现并解决问题。 以下是几种流行的监控工具的简要介绍: Zabbix: Zabbix 是一个企…...

树莓派python开发
树莓派自带thonny 点亮LED灯 import RPi.GPIO as GPIO import time# 设置GPIO模式为BCM GPIO.setmode(GPIO.BCM)# 设置LED引脚 led_pin 18# 设置LED引脚为输出 GPIO.setup(led_pin, GPIO.OUT)# 点亮LED GPIO.output(led_pin, GPIO.HIGH)# 延时2秒 time.sleep(2)# 关闭LED GPI…...

纯血鸿蒙APP实战开发——首页下拉进入二楼效果案例
介绍 本示例主要介绍了利用position和onTouch来实现首页下拉进入二楼、二楼上划进入首页的效果场景,利用translate和opacity实现动效的移动和缩放,并将界面沉浸式(全屏)显示。 效果图预览 使用说明 向下滑动首页页面超过触发距…...

苹果cms:开启高速缓存加快访问速度
由于苹果cms采集的影片数据过多,如果不设置缓存,可能会造成网站访问缓慢,或者CPU消耗过高。随着用户访问量的上升,添加缓存设置是有这个必要的。目前cms提供了四种缓存方式 1)file:以文件形式,通俗说直接访问Mysql,要达…...
实时数据推送——长轮询,短轮询,长连接
短轮询 短轮询是最简单的一种数据推送方式,客户端在固定的时间间隔(例如每隔5秒)向服务器发送请求,询问是否有更新的数据。服务器立即处理请求并返回数据,不论数据是否真的已经更新。 长轮询 长轮询是对短轮询的改进…...
七.音视频编辑-创建视频过渡-应用
引言 在上一篇博客中,我们已经介绍了创建视频过渡的实现方案,步骤非常繁琐,在生成AVMutableVideoCompositionInstruction和AVMutableVideoCompositionLayerInstruction的计算也十分复杂,但其实还有一个创建视频组合的捷径。不过我…...

测试微信模版消息推送
进入“开发接口管理”--“公众平台测试账号”,无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。 获取access_token: 自定义模版消息: 关注测试号:扫二维码关注测试号。 发送模版消息: import requests da…...
vscode里如何用git
打开vs终端执行如下: 1 初始化 Git 仓库(如果尚未初始化) git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来
一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...
【Linux】C语言执行shell指令
在C语言中执行Shell指令 在C语言中,有几种方法可以执行Shell指令: 1. 使用system()函数 这是最简单的方法,包含在stdlib.h头文件中: #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

【网络安全产品大调研系列】2. 体验漏洞扫描
前言 2023 年漏洞扫描服务市场规模预计为 3.06(十亿美元)。漏洞扫描服务市场行业预计将从 2024 年的 3.48(十亿美元)增长到 2032 年的 9.54(十亿美元)。预测期内漏洞扫描服务市场 CAGR(增长率&…...

CentOS下的分布式内存计算Spark环境部署
一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍,多层嵌套定位示例
文章目录 ★ position 的五种类型及基本用法 ★ 一、position 属性概述 二、position 的五种类型详解(初学者版) 1. static(默认值) 2. relative(相对定位) 3. absolute(绝对定位) 4. fixed(固定定位) 5. sticky(粘性定位) 三、定位元素的层级关系(z-i…...
第25节 Node.js 断言测试
Node.js的assert模块主要用于编写程序的单元测试时使用,通过断言可以提早发现和排查出错误。 稳定性: 5 - 锁定 这个模块可用于应用的单元测试,通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...
Spring Boot+Neo4j知识图谱实战:3步搭建智能关系网络!
一、引言 在数据驱动的背景下,知识图谱凭借其高效的信息组织能力,正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合,探讨知识图谱开发的实现细节,帮助读者掌握该技术栈在实际项目中的落地方法。 …...

AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...