当前位置：首页 > news >正文

[Linux] 逐层深入理解文件系统（1）—— 进程操作文件

news 2026/2/9 13:30:27

标题：[Linux] 文件系统（1）—— 进程操作文件

个人主页@水墨不写bug

（图片来源于网络）

一、进程与打开的文件

二、文件的系统调用与库函数的关系

1.系统调用open()

三、内存中的文件描述符表

四、缓冲区的理解

五、俯瞰IO

正文开始：

一、进程与打开的文件

C/C++都提供了对文件进行操作的函数接口，想要对文件操作：无论是往文件中写入，还是从文件中读出，都需要满足一个前提条件：文件被打开。

文件被打开，意味着文件被从磁盘中加载到内存中。进程是我们写的C/C++指令编译行成的运行起来的程序，本质是我们想要完成想要某一个任务。于是，我们不得不考虑加载到内存中的文件与进程之间的关系。

文件是在磁盘中存储的，磁盘是一个硬件外设，对文件操作本质就是对磁盘这个硬件操作。但是用户没有权利直接向硬件写入。想要完成对硬件操作，需要软硬件资源的管理者——操作系统的帮助。但是操作系统不相信如何用户，于是需要用操作系统提供的安全的访问操作系统数据的方式——系统调用。

于是，我们通过分析可以推测——我们使用的

fopen/fwrite/fread/fprintf/scanf/printf/cin/cout

等一系列的C/C++的文件操作的库函数，本质都是对系统调用的封装！

这样一来，为了搞清楚封装的细节，我们需要先知道如何使用系统调用。

二、文件的系统调用与库函数的关系

1.系统调用open()

open()函数原型：

参数：

pathname：想要打开的文件的名称;

flags：打开的文件的方式选项，常见的选项有：

O_WRONLY: 以写的方式打开文件。

O_CREAT: 如果不存在就创建文件。

O_TRUNC: 每一次打开清空文件内容。

O_APPEND:打开文件之后不清空文件内容，而在后面追加。

mode：如果成功创建了文件，文件被创建出来的默认权限设置。

返回值：

一个整数int，被称为文件描述符（file descriptor）。

其实，C语言的fopen函数在的不同打开方式，都对应一种flags的组合。C语言对文件打开方式有"w" "r"等等的区分，由于C语言fopen函数底层调用的还是open系统调用，所以自然会发现这样的对应关系：

这两个调用本质都是对第一个系统调用函数open的调用，只不过第二种C语言式的函数调用对第一种系统调用进行了封装，在函数内部增加了语言级别的缓冲区等的操作，并且对返回值也进行了封装，把int类型的返回值封装成了FILE结构体指针类型的返回值。

为什么C语言要这样做呢？别急，接下来我们对文件有了深入的理解认识之后，你就会体会到C语言的良苦用心了。

三、内存中的文件描述符表

在上面的理解中，我们发现系统调用open()函数的返回值是一个整形int，对应的，我们发现系统调用close() 函数也是通过一个int整数来关闭文件的，这非常令人费解，为什么仅仅凭借一个整数就可以操作整个文件的开关？

在操作系统中，运行有成百上千的进程，每时每刻都有进程的创建，消亡。每一个进程都可以打开文件，并且一个进程可以打开不止一个文件！这就意味着操作系统必须要有一个高效的管理打卡的文件的方式，这个方式就是：

先描述，再组织！

在内存中，不止有进程的PCB（task_struct），还有描述文件的数据结构：文件描述符表

我们可以暂时把文件描述符表抽象理解成一个数组，这个数组存储文件的数据。磁盘中的文件被加载到内存中，就是通过这个数组来维护的。

而open的返回值，就是打开的文件在这个数组中对应的下标！！

如上图，一个个的文件被加载到内存中后，会被存储在files_struct这个结构体数组中，这个数组就是文件描述符表！

不同的文件存储在不同下标位置：

于是每一个文件就有了一个对应的下标：fd；这也就解释了为什么操作系统为什么可以拿着一个整数来对文件进行操作：因为操作系统可以通过一个整数下标来标识一个文件。

当我们一次性打开并关闭多个文件，重复几次，会发现fd的分配规则：

1）fd的0,1,2被默认提前分配为标准输入（键盘），标准输出（显示器），标准错误（显示器）。（C语言的stdin，stdout，stderr本质也是对这三个文件的封装）

2）fd的分配机制是按照从小到大的顺序分配fd下标。

四、缓冲区的理解

语言有语言的缓冲区，系统有系统的缓冲区，这两个缓冲区存在的目的都是为了提高IO效率：

1）因为访问外设与CPU的速度相比非常慢，所以系统缓冲区存在的意义就是尽量减少对外设的访问，当向缓冲区写入一定量的数据之后，操作系统会一次性把数据刷新到磁盘中。

2）系统调用的使用成本比库函数要高的多，因为操作系统太忙了，每一次调用系统调用都是请求操作系统配合用户一次，频繁调用会导致效率损失。所以语言缓从区存在的意义就是尽量少调用系统调用，当我们向语言级缓冲区写入一定的数据之后，C语言函数会一次性把数据刷新到系统级缓冲区。

五、俯瞰IO

这时，我们整体俯瞰io的过程：

当我们打开一个文件，操作系统会调用open：

1）创建file结构体；

2）开辟文件缓冲区内容，加载问价数据（延后）

3）查进程的文件描述符表

4）file地址，填入对应的表的下标中

5）返回下标

当我们调用fopen库函数，会在上面操作的基础上创建语言级缓冲区等操作，本质是为了改善用户体验，提高效率。

为什么C语言要封装系统调用？

1）提高效率，改善用户体验

2）C语言有多个不同的在不同的平台上实现的版本，具有跨平台性。但是我们所讲的系统调用，仅仅是Linux的，对于其他操作系统就不适用了。

完·~

未经作者同意禁止转载

[Linux] 逐层深入理解文件系统（1）—— 进程操作文件

标题：[Linux] 文件系统 （1）—— 进程操作文件个人主页水墨不写bug （图片来源于网络） 目录一、进程与打开的文件二、文件的系统调用与库函数的关系 1.系统调用open() 三、内存中的文件描述符表四、缓冲区…...

编程日记 2024/10/18 6:22:34

RT-Thread 互斥量的概念

目录概述 1 互斥量定义 1.1 概念介绍 1.2 线程优先级翻转问题 2 互斥量管理 2.1 结构体定义 2.2 函数接口介绍 2.2.1 rt_mutex_create函数 2.2.2 rt_mutex_delete 函数 2.2.3 初始化和脱离互斥量概述本文主要介绍互斥量的概念，实现原理。还介绍RT-Thre…...

编程日记 2024/10/18 6:21:33

6.计算机网络_UDP

UDP的主要特点： 无连接，发送数据之前不需要建立连接。不保证可靠交付。面向报文。应用层给UDP报文后，UDP并不会抽象为一个一个的字节，而是整个报文一起发送。没有拥塞控制。网络拥堵时，发送端并不会降低发送速率。可以…...

编程日记 2024/10/18 6:20:32

Windows应急响蓝安服面试

Windows应急响应蓝队溯源流程学习Windows应急首先要站在攻击者的角度去学习一些权限维持和权限提升的方法.,文章中的方法其实和内网攻防笔记有类似l红队教你怎么利用蓝队教你怎么排查攻防一体,应急响应排查这些项目就可以端口/服务/进程/后门文件都是为了权限维持,得到s…...

编程日记 2024/10/18 6:18:29

PCL 点云配准-4PCS算法（粗配准）

目录一、概述 1.1原理 1.2实现步骤 1.3应用场景二、代码实现 2.1关键函数 2.1.1 加载点云数据 2.1.2 执行4PCS粗配准 2.1.3 可视化源点云、目标点云和配准结果 2.2完整代码三、实现效果 3.1原始点云 3.2配准后点云 PCL点云算法汇总及实战案例汇总的目录地址链接…...

编程日记 2024/10/18 6:16:28

12、论文阅读：利用生成对抗网络实现无监督深度图像增强

Towards Unsupervised Deep Image Enhancement With Generative Adversarial Network 摘要介绍相关工作传统图像增强基于学习的图像增强论文中提出的方法动机和目标网络架构损失函数1) 质量损失2) 保真损失3）身份损失4）Total Loss 实验摘要提高图像的…...

编程日记 2024/10/18 6:15:27

Axure重要元件三——中继器表单制作

亲爱的小伙伴，在您浏览之前，烦请关注一下，在此深表感谢！ 本节课：中继器表单制作课程内容：利用中继器制作表单应用场景：台账、表单案例展示： 步骤一：建立一个背景区…...

编程日记 2024/10/18 6:14:26

DMAIC赋能智能家居：解锁未来生活新篇章！

从清晨自动拉开的窗帘，到夜晚自动调暗的灯光，每一处细节都透露着科技的温度与智慧的光芒。而在这场智能革命的浪潮中，DMAIC（定义Define、测量Measure、分析Analyze、改进Improve、控制Control）作为六西格玛管理的核心方…...

编程日记 2024/10/18 6:12:24

代码随想录算法训练营第二天| 209.长度最小的子数组 59.螺旋矩阵II 区间和开发商购买土地

209. 长度最小的子数组题目： 给定一个包含正整数的数组 nums 和一个正整数 target ，找出该数组中满足其和 ≥ target 的长度最小的连续子数组 ，并返回其长度。如果不存在符合条件的子数组，返回 0。示例： 示例 1…...

编程日记 2024/10/18 6:11:23

mysql隐藏索引

1. 什么是隐藏索引？ 在 MySQL 8 中，隐藏索引（Invisible Indexes）是指一种特殊类型的索引，它并不真正被删除，而是被标记为“不可见”。当索引被标记为不可见时，查询优化器在生成查询计划时将忽略…...

编程日记 2024/10/18 6:09:21

etcd入门到实战

概述：本文将介绍etcd特性、使用场景、基本原理以及Linux环境下的实战操作入门什么是etcd？ etcd是一个分布式键值存储数据库关键字解析： 键值存储：存储协议是 key—value 的形式，类似于redis分布式：…...

编程日记 2024/10/18 6:08:19

Build an Android project and get a `.apk` file on a Debian 11 command line

You can build an Android project and get a .apk file on a Debian 11 command line without using Android Studio. The process involves using the Android SDK command-line tools (sdkmanager, adb, and gradle). Here’s a step-by-step guide to building the ???…...

编程日记 2024/10/18 6:07:18

解读 Java 经典巨著《Effective Java》90条编程法则，第4条：通过私有构造器强化不可实例化的能力

文章目录【前言】欢迎订阅【解读《Effective Java》】系列专栏java.lang.Math 类的设计经验总结【前言】欢迎订阅【解读《Effective Java》】系列专栏《Effective Java》是 Java 开发领域的经典著作，作者 Joshua Bloch 以丰富的经验和深入的知识，全面…...

编程日记 2024/10/18 6:05:16

Vivado HLS学习

视频链接: 6课：数据类型的转换_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1bt41187RW?spm_id_from333.788.videopod.episodes&vd_sourcea75d5585c5297210add71187236ec90b&p6 目录 1.数据类型的转换 2.自动类型转换 2.1隐式数据转换 2.2…...

编程日记 2024/10/18 6:04:15

一款AutoXJS现代化美观的日志模块AxpLogger

简介 Axp Logger是一款基于autox.js的现代化日志模块，具备窗口事件穿透、拖拽和缩放功能。 Axp Logger文档特性现代化的UI设计支持点击穿透模式（不影响脚本运行）监听音量-键切换模式支持窗口操作模式窗口拖拽移动窗口自由缩放清空日志关闭日…...

编程日记 2024/10/18 6:03:14

成都睿明智科技有限公司共创抖音电商新篇章

在当今这个数字化浪潮汹涌的时代，抖音电商以其独特的魅力迅速崛起，成为众多商家竞相追逐的新蓝海。在这片充满机遇与挑战的领域中，成都睿明智科技有限公司凭借其专业的服务、创新的策略和敏锐的市场洞察力，成为了众多商家信赖的合…...

编程日记 2024/10/18 6:01:12

Spark的安装配置及集群搭建

Spark的本地安装配置： 我们用scala语言编写和操作spark，所以先要完成scala的环境配置 1、先完成Scala的环境搭建下载Scala插件，创建一个Maven项目，导入Scala依赖和插件 scala依赖 <dependency><groupId>org.scal…...

编程日记 2024/10/18 6:00:11

网络编程基础-IO模型深入理解

一、IO的基本概念什么是IO？ I/O就是计算机内存与外部设备之间拷贝数据的过程什么是网络IO？ 网络IO是指在计算机网络环境中进行的输入和输出操作，涉及数据在网络设备之间的传输。网络IO操作可以是发送请求、接收响应、下载文件、传输数…...

编程日记 2024/10/18 5:55:08

go 语言学习路线图（一）

1. Go语言简介 Go语言的历史背景和设计理念Go的优势：简洁、高效、并发支持强Go的应用场景：微服务、云计算、系统编程 2. 开发环境设置安装Go语言开发环境在Windows、macOS、Linux系统上的安装方法配置环境变量：GOROOT 和 GOPATH验证安装…...

编程日记 2024/10/18 5:54:07

前端自动化部署，Netlify免费满足你

1 Netlify 介绍为什么推荐 Netliy ， 主要还是穷，Netlify 免费太香了 Netlify you优势100GB 内免费 ，满足个人日常需求，操作,兼容性绑定代码仓库，提交代码自动部署支持 github , gitlab 等大多常用代码仓库易操作只…...

编程日记 2024/10/18 5:53:06

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/11/30 15:33:36

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

在如今就业市场竞争日益激烈的背景下，越来越多的求职者将目光投向了日本及中日双语岗位。但是，一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧？面对生疏的日语交流环境，即便提前恶补了…...

编程新知 2026/2/8 4:37:01

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

遍历 Map 类型集合的方法汇总

1 方法一先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

编程新知 2026/1/24 15:08:45

深入理解JavaScript设计模式之单例模式

目录什么是单例模式为什么需要单例模式常见应用场景包括单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量惰性单例通用的惰性单例结语什么是单例模式单例模式（Singleton Pattern&#…...

编程新知 2026/1/31 17:09:43

【论文笔记】若干矿井粉尘检测算法概述

总的来说，传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度，通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

编程新知 2025/10/14 10:52:24

Nginx server_name 配置说明

Nginx 是一个高性能的反向代理和负载均衡服务器，其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机（Virtual Host）。 1. 简介 Nginx 使用 server_name 指令来确定…...

编程新知 2025/9/6 16:47:17

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统实现kefu123登录，不允许匿名访问，kefu只能访问/data/kefu目录，不能查看其他目录创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...

编程新知 2026/1/25 9:03:19

手机平板能效生态设计指令EU 2023/1670标准解读

手机平板能效生态设计指令EU 2023/1670标准解读以下是针对欧盟《手机和平板电脑生态设计法规》(EU) 2023/1670 的核心解读，综合法规核心要求、最新修正及企业合规要点： 一、法规背景与目标生效与强制时间发布于2023年8月31日（OJ公报&…...

编程新知 2026/2/2 11:58:16

一、进程与打开的文件

二、文件的系统调用与库函数的关系

1.系统调用open()

三、内存中的文件描述符表

四、缓冲区的理解

五、俯瞰IO

相关文章：