Linux_内核缓冲区
目录
1、用户缓冲区概念
2、用户缓冲区刷新策略
3、用户缓冲区的好处
4、内核缓冲区
5、验证内核缓冲区
6、用户缓冲区存放的位置
7、全缓冲
结语
前言:
Linux下的内核缓冲区存在于系统中,该缓冲区和用户层面的缓冲区不过同一个概念,用户层面的缓冲区称之为用户缓冲区,而系统中也有自己的缓冲区即内核缓冲区,两者虽然同为缓冲区却差之毫厘谬以千里,了解内核缓冲区前先谈谈用户缓冲区。
1、用户缓冲区概念
用户缓冲区是用户空间的标准库(stdio.h)缓冲区的缩写,也就是说标准库会提供一个缓冲区用来存放用户调用文件操作相关的库函数所产生或者接收到的数据,用户缓冲区是程序员在调用库函数时接触最频繁的,比如调用scanf、printf以及其他与文件流相关的函数,并不是直接把数据输入到目的地,中途先把数据放到用户缓冲区内,然后通过刷新缓冲区才能把数据送到目的地,示意图如下:

2、用户缓冲区刷新策略
有三种刷新用户缓冲区的策略:
1、无缓冲:只要把数据写到缓冲区内就会自动刷新缓冲区,比如系统函数write和read。
2、行缓冲:遇到\n时自动刷新缓冲区,打印到屏幕上时用行缓冲。
3、全缓冲:缓冲区满了才会自动刷新,比如将数据写入磁盘文件。
补充:进程结束时会自动刷新缓冲区。
3、用户缓冲区的好处
1、提高效率,有了缓冲区后,数据就不必频繁的传输,也不必频繁的进行系统调用,因为处理少量的数据可以先把数据放到缓冲区内,然后统一进行传输,减少了小块数据的传输次数,以至于提高系统效率。
2、同一格式化,意思是所有的int类型、float类型都需要转换成字符串的形式存放到缓冲区内,接收方只需要采用字符串形式的处理方式统一处理。
4、内核缓冲区
上述说到printf以及其他各种文件流函数会经过用户缓冲区然后再到硬件文件(显示器就是一个硬件文件),其实经过了用户缓冲区后还要调用系统函数wrtie,通过wrtie将用户缓冲区的内容写到内核缓冲区内,最后由系统自动刷新内核缓冲区,才把内容写进硬件文件中,很明显这个内核缓冲区是在系统里的,并且因为库函数接口自动帮助我们调用底层函数,所以这些细节上层并不是关系,因此完整的流程图如下:

只有当最后一步把数据写到磁盘上的显示器文件时,才算是真正的在屏幕上打印出来。注意:刷新内核缓冲区由系统自动完成。
5、验证内核缓冲区
通过上图可以发现printf库函数和用户缓冲区“打交道”,wrtie系统函数和内核缓冲区“打交道”,所以通过下面测试代码,可以证明内核缓冲区和用户缓冲区是两个缓冲区,示例代码如下:
#include <stdio.h>
#include <string.h>
#include <unistd.h>int main()
{const char *fstr = "hello fwrite";const char *str = "hello write";// Cprintf("hello printf"); // stdout -> 1sleep(1);fprintf(stdout, "hello fprintf"); // stdout -> 1sleep(1);fwrite(fstr, strlen(fstr), 1, stdout); // fwrite, stdout->1sleep(1);// 操作提供的系统函数write(1, str, strlen(str)); // 1close(1); //关闭该进程的显示器文件sleep(2);//fork();return 0;
}
运行结果:

从运行结果可以发现,只有调用wrtie的数据被打印出来了,前面的三句话都没被打印出来,原因就是close(1)这句代码,并且细心观察会发现所有字符串内容都没加‘\n’,这就导致写入用户缓冲区时不会立刻刷新用户缓冲区,错过了这次的刷新,下次刷新只能等该进程结束时才会自动刷新用户缓冲区了,但是在该进程结束前就关闭了1号文件描述符(即显示器文件),导致之前堆积在用户缓冲区里的数据刷新后找不到对应的内核缓冲区了,因此最终的现象就是用户缓冲区的内容全部没打印在屏幕上。
但是write的数据却正常打印了,原因就是write跳过了用户缓冲区,直接往内核缓冲区里写,并且在close关闭前会自动刷新内核缓冲区,所以close虽然关闭了1号文件描述符,但是write的数据已经写到显示器文件里了,因此可以正常打印write负责的数据。
6、用户缓冲区存放的位置
我们使用的用户缓冲区存放在c语言标准库为我们封装好的指针FILE* fp所指向的结构体里,示意图如下:

该结构体里包含了大量的文件相关信息,其中就包括文件描述符以及用户缓冲区,因为printf是默认使用stdout文件流指针的,所以即使不传文件指针给printf也可以在屏幕上打印。
7、全缓冲
当进程里的文件描述符1被重定向至文件中,这时候stdout打印方式从行缓冲变成了全缓冲,即遇到\n后不会刷新用户缓冲区了,只有把用户缓冲区写满才会刷新,或者当进程结束的时候才会刷新缓冲区,让缓冲区里的内容读进文件里。
示例代码如下:
#include <stdio.h>
#include <string.h>
#include <unistd.h>int main()
{const char *fstr = "hello fwrite\n";const char *str = "hello write\n";// Cprintf("hello printf\n"); // stdout -> 1sleep(1);fprintf(stdout, "hello fprintf\n"); // stdout -> 1sleep(1);fwrite(fstr, strlen(fstr), 1, stdout); // fread, stdout->1sleep(1);// 操作提供的systemcallwrite(1, str, strlen(str)); // 1sleep(2);//close(1);fork();return 0;
}
运行结果:

从结果发现调用库函数打印的数据在文件中写了两份,而调用系统函数打印的数据只写了一份,根本原因很简单,就是因为程序的末尾使用fork创建了子进程,但是具体为什么创建子进程后会让有些数据打印两份有些数据打印一份呢?
原因如下:
1、文件是全缓冲,所以数据会在缓冲区内堆积。
2、进程退出的时候会刷新缓冲区,会引发写时拷贝,因此会给另一个进程拷贝一份缓冲区的内容。
3、write负责的数据没有写两份的原因是write是系统调用接口(一个struct file只有一个内核缓冲区),他跳过用户缓冲区,并把数据写到内核缓冲区内,所以不会引发写时拷贝。
示意图如下:

结语
以上就是关于内核缓冲区以及用户缓冲区的全部讲解,理解内核缓冲区的前提是了解文件流流向的整个过程,因此必须了解c标准库提供给用户的标准库缓冲区又称用户缓冲区的概念,并且若想拿到缓冲区里的内容给到“下一站”,则必须刷新缓冲区。
相关文章:
Linux_内核缓冲区
目录 1、用户缓冲区概念 2、用户缓冲区刷新策略 3、用户缓冲区的好处 4、内核缓冲区 5、验证内核缓冲区 6、用户缓冲区存放的位置 7、全缓冲 结语 前言: Linux下的内核缓冲区存在于系统中,该缓冲区和用户层面的缓冲区不过同一个概念&#x…...
步步精:连接器领域的卓越品牌
自1987年成立以来,步步精坐落于美丽的旅游城市——温州市乐清虹桥镇,被誉为“国家电子主体生产基地”、“国家精密模具制造基地”。公司拥有7大厂区、9大事业部,800名专职员工,致力于提供高品质的连接器解决方案。注册商标“BBJCO…...
【Linux】基础IO_3
文章目录 六、基础I/O3. 软硬链接4. 动静态库 未完待续 六、基础I/O 3. 软硬链接 使用 ln 就可以创建链接,使用 ln -s 可以创建软链接,直接使用 ln 则是硬链接。 我们对硬链接进行测试一下: 根据测试,我们知道了 硬链接就像一…...
ffmpeg音视频开发从入门到精通——ffmpeg实现音频抽取
文章目录 FFmpeg 实现音频流抽取1. 包含FFmpeg头文件与命名空间声明2. 主函数与参数处理3. 打开输入文件4. 获取文件信息5. 查找音频流6. 分配输出文件上下文7. 猜测输出文件格式8. 创建新的音频流9. 打开输出文件10. 写入文件头信息11. 读取并写入音频数据12. 写入文件尾部信息…...
计算机系统基础实训七-MallocLab实验
实验目的与要求 1、让学生理解动态内存分配的工作原理; 2、让学生应用指针、系统级编程的相关知识; 3、让学生应用各种动态内存分配器的实现方法; 实验原理与内容 (1)动态内存分配器基本原理 动态内存分配器维护…...
周末总结(2024/06/22)
工作 人际关系核心实践: 要学会随时回应别人的善意,执行时间控制在5分钟以内 坚持每天早会打招呼 遇到接不住的话题时拉低自己,抬高别人(无阴阳气息) 工作上的要点 现状(接受破烂现状,改变状态) - 这周没…...
2024.06.22【读书笔记】丨生物信息学与功能基因组学(第十七章 人类基因组 第二部分)【AI测试版】
第二部分:人类基因组的主要结论与网络资源 摘要: 第二部分深入总结了人类基因组计划的关键发现,并介绍了用于探索人类基因组的网络资源。这些结论不仅为我们理解人类生物学提供了新的视角,而且揭示了人类基因组的复杂性和动态性。 学习目标: 掌握人类基因组计划的主要科…...
SpringCloud-nacos基础
SpringCloud-nacos nacos在微服务种有两大作用: 配置中心服务注册中心 配置中心 维度管理 nacos配置中心可以在三个维度进行管理: spring.profiles.active dev/prod/test,通过这个属性可以配置不同环境下的配置文件。 配置的文件名应该为${spring…...
git的Cherry pick
Cherry pick Git Cherry Pick详解 https://blog.csdn.net/jam_yin/article/details/131594716 目标: 将开发分支A中提交的部分内容合并到B分支(可能是测试分支) 步骤: vscode安装 点击下图标进入graph...
LLC开关电源开发:第四节,LLC软件设计报告
LLC源代码链接 数控全桥LLC开发板软件设计报告 1. LLC硬件及软件框架2. LLC软件设计2.1 工程文件说明2.2 LLC中断设计2.2.1 20us中断2.2.2 5ms中断 2.3 LLC状态机设计2.3.1 初始化状态2.3.2 空闲状态2.3.3 软启动状态2.3.4 正常运行状态2.3.5 故障状态 2.4 环路设计2.4.1 环路…...
力扣85.最大矩形
力扣85.最大矩形 遍历所有行作为底边 做求矩形面积(84. class Solution {public:int maximalRectangle(vector<vector<char>>& matrix) {if (matrix.empty()) return 0;int n matrix.size(),m matrix[0].size();int res0;vector<int> li…...
和琪宝的厦门之旅~
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。 本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权。 引言 承接去年国庆的遗憾,我们将这次的旅行城市定为厦门。 琪宝是下午四点左右到…...
4、MFC:菜单栏、工具栏与状态栏
菜单栏、工具栏与状态栏 1、菜单栏1.1 简介1.2 创建属性设置菜单消息成员函数 1.3 实例 2、工具栏2.1 简介工具栏属性2.2 创建消息CToolBar类的主要成员函数 2.3 实例 3、状态栏3.1 简介3.2 创建CStatusBar类状态栏创建 3.3 实例 1、菜单栏 1.1 简介 菜单在界面设计中是经常使…...
Java中的动态代理:原理与应用
Java中的动态代理:原理与应用 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Java开发中,动态代理是一种强大且灵活的技术ÿ…...
DataWhale - 吃瓜教程学习笔记(二)
学习视频:第3章-一元线性回归_哔哩哔哩_bilibili 西瓜书对应章节: 3.1 - 3.2 一元线性回归 - 最小二乘法 - 极大似然估计 - 梯度 多元函数的一阶导数 - 海塞矩阵 多元函数的二阶导数 - 机器学习三要素...
[保姆级教程]uniapp自定义标签页切换组件
文章目录 导文样式改成动态列表切换点击效果加上点击自动滑动scroll-view加上切换组件效果 导文 unaipp自带的标签页和ui设计相差太大,直接修改组件比手写一个还麻烦,下面手写一个。 样式 先用scroll-view做一个滑动,不然多的话滑动不了。 &l…...
4种典型家庭教育方式,无论开始是哪一种,都会过渡到最后一种
家庭教育,是孩子教育的一个重要组成部分,事实上是对孩子影响最大的一种教育方式,绝大部分家庭教育都是由孩子的父母来完成的。 家庭教育的特点 家庭教育具有很明显的启蒙性、长期性、全面性。 1.启蒙性。我们的孩子对外部世界的认识和了解&am…...
[Django学习]查询过滤器(lookup types)
1.exact exact用于精确匹配字段的值。适用于需要精确查找某个字段值的场景。 Book.objects.filter(title__exactHarry Potter) 上面的查询会查找标题完全为“Harry Potter”的书籍。 2.iexact iexact忽略大小写地精确匹配字段的值。适用于需要忽略大小写进行精确匹配的场…...
异步开发的终极答案—协程
我们在之前的文章中讲过,在并发场景下,传统的基于多线程的命令式开发模型虽然比较简单,但并发数高了之后资源占用较高,大量线程会阻塞;而响应式编程模式我们可以通过异步化处理提升系统资源的利用效率,但异步开发有违人的直觉,门槛比较高。作为成年人,我们肯定希望全都…...
构建高效的大数据量延迟任务调度平台
目录 引言系统需求分析系统架构设计 总体架构任务调度模块任务存储模块任务执行模块 任务调度算法 时间轮算法优先级队列分布式锁 数据存储方案 关系型数据库NoSQL数据库混合存储方案 容错和高可用性 主从复制数据备份与恢复故障转移 性能优化 水平扩展缓存机制异步处理 监控与…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
golang循环变量捕获问题
在 Go 语言中,当在循环中启动协程(goroutine)时,如果在协程闭包中直接引用循环变量,可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下: 问题背景 看这个代码片段: fo…...
转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
Linux云原生安全:零信任架构与机密计算
Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...
linux 下常用变更-8
1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行,YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID: YW3…...
微信小程序云开发平台MySQL的连接方式
注:微信小程序云开发平台指的是腾讯云开发 先给结论:微信小程序云开发平台的MySQL,无法通过获取数据库连接信息的方式进行连接,连接只能通过云开发的SDK连接,具体要参考官方文档: 为什么? 因为…...
关于 WASM:1. WASM 基础原理
一、WASM 简介 1.1 WebAssembly 是什么? WebAssembly(WASM) 是一种能在现代浏览器中高效运行的二进制指令格式,它不是传统的编程语言,而是一种 低级字节码格式,可由高级语言(如 C、C、Rust&am…...
Python ROS2【机器人中间件框架】 简介
销量过万TEEIS德国护膝夏天用薄款 优惠券冠生园 百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选 鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒 优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友 热卖妙洁棉…...
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...
C++使用 new 来创建动态数组
问题: 不能使用变量定义数组大小 原因: 这是因为数组在内存中是连续存储的,编译器需要在编译阶段就确定数组的大小,以便正确地分配内存空间。如果允许使用变量来定义数组的大小,那么编译器就无法在编译时确定数组的大…...
