当前位置：首页 > news >正文

【操作系统和计网从入门到深入】（四）基础IO和文件系统

news 2026/2/9 16:16:56

前言

在这里插入图片描述
这个专栏其实是博主在复习操作系统和计算机网络时候的笔记，所以如果是博主比较熟悉的知识点，博主可能就直接跳过了，但是所有重要的知识点，在这个专栏里面都会提到！而且我也一定会保证这个专栏知识点的完整性，大家可以放心订阅～# 基础IO

1. 文件描述符预备工作

Linux系统下一切皆文件

1.1 复习C文件接口相关细节

#include <stdio.h>
#include <stdlib.h>
// 复习C语言文件接口
int main()
{FILE *fp = fopen("log.txt", "w");if (fp == NULL){perror("fopen");return 1;}// 文件操作fclose(fp);return 0;
}

这个文件在哪里创建？

我们实验发现，程序在哪里被执行，log.txt就会在哪里被创建，log.txt是相对路径。

就是在工作目录下创建。

1.2 用C语言相关文件接口模拟实现一个`cat`命令

// 模拟实现一个cat命令
int main(int argc, char *argv[])
{if (argc != 2){printf("args error!\n");return 1;}FILE *fp = fopen(argv[1], "r"); // 打开这个文件if (fp == NULL){perror("fopen");return 2;}// 读取文件里面的内容char line[64];while (fgets(line, sizeof(line), fp) != NULL) // 按照行读取{fprintf(stdout, "%s", line);}fclose(fp);return 0;
}

三个自动打开的文件描述符，很熟悉了，不再赘述。

1.3 学习系统调用

open

如果打开成功 — 返回文件描述符，如果打开失败，返回-1。

O_WRONLY只负责写，如果没有这个文件，是打不开的！

我们带上O_CREAT就能创建了

但是我们发现，创建出来的这个文件的权限怎么是个奇怪的东西呢？所以，不像我们C接口创建出来的那么整齐

所以，光光创建是不够的！

一般涉及到文件的创建的时候，我们会传递第三个参数，表示权限。

如果这个文件已经有了

我们就使用两个参数的open就行了不需要三个参数的，带上O_RDONLY选项 — read only

关闭文件：fclose

int close(int fd);

现在想要往里面写东西了。

用write函数！

如果我们往已经有东西的文件里面，再写入一个短一点的字符串。

所以这个是不会帮我们清空文件的。

想要系统帮我们清空还要带上一个选项O_TRUNC。

int fd = open("test.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);

这样才会帮我们清空。

那如果我想要往文件中追加呢？

把O_TRUNC换成O_APPEND。

现在，我们来认识一下读文件的接口 read

read 的返回值我们到进程通信再说现在我们先不关心

read是不会给我们加 \0 的

1.4 文件描述符这个`int`和`FILE*`的关系

FILE是一个结构体，是C语言提供的。

C中文件相关库函数内部一定会调用系统调用! 那么在系统角度，认FILE，还是认 fd ? 系统只认fd

FILE结构体里面必定封装了fd！

// 文件描述符和FILE*
int main()
{printf("stdin: %d\n", stdin->_fileno);printf("stdout: %d\n", stdout->_fileno);printf("stderr: %d\n", stderr->_fileno);return 0;
}

yufc@ALiCentos7:~/Src/Review/operatingSys/Unit4$ ./test
stdin: 0
stdout: 1
stderr: 2
yufc@ALiCentos7:~/Src/Review/operatingSys/Unit4$

同样！先描述再组织！在内核中，OS内部要为了管理每一个被打开的文件，构建struct file{}。

1.5 struct file{}

用双链表组织起来。

struct file
{struct file* next;struct file* prev;// 后面的字段 ...// 包含了一个被打开的文件的几乎所有的内容, 不仅仅包含属性
};

所以本质是存在一个数组的！

struct file* array[32]

所以fd的本质就是一个数组下标。

2. 正式开始学习文件描述符

fd的分配规则是，最小的，没有被占用的文件描述符。

然后012是被打开的，这个很熟，所以下一个打开的文件就是3。

2.1 输入重定向和输出重定向

如果我把1文件描述符关了，然后打开一个文件，那么这个新打开的文件的fd就是1，这个很好理解。

所以原本要打印到stdout的东西会打印到新打开的文件中去。

// 输出重定向
int main()
{close(1);int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC);assert(fd >= 0);printf("fd: %d\n", fd);printf("hello world!\n");fflush(stdout); // 不加这个是没有输出的close(fd);return 0;
}

这里fflush(stdout)其实没有刷新屏幕，其实刷新的是log.txt，因为里面文件描述符是1，而现在1不是显示器，而是log.txt。

至于这个代码里面，为什么如果不加fflush(stdout);，会没有输出

因为重定向到文件里面，磁盘文件是全缓冲的（第三节复习缓冲区的时候会讲），所以printf之后在缓冲区里面，所以没有输出，然后按道理来说，程序结束会自动刷新，但是你都close了，肯定就刷新不了了。

所以要不不加close，不用fflush也能有结果

加了close，那么fflush也要加，不然结果被close清理掉了

输入重定向也是一个道理。

当然，重定向不是这样实现的!我们这种方式仅仅只是利用了文件描述符的特点而已。有没有一种方式，可以让我们的不用关闭别人的，也能完成重定向呢？肯定是有的！

2.2 dup2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

记住：最终想要输出到哪里，哪里的fd就是第一个参数。

如果oldfd不是有效的文件描述符，则调用失败，并且newfd未关闭
如果oldfd是有效的文件描述符，而newfd的值与oldfd相同，则dup2()不执行任何操作，并且
返回newfd。

至于为什么，我们上面那种先close的重定向方法，最后close之后，就不能成功重定向，而左边代码的方法没问题。
这其实是dup2的一个特性，涉及到缓冲区的概念。

2.3 如何理解一切皆文件（VFS）

3. 缓冲区

缓冲区在哪里？我们写一个代码看看。

这个代码分别调用了C语言的输出函数和系统的输出函数，打印一句话。

// 缓冲区
int main()
{// C语言printf("hello printf\n");fprintf(stdout, "hello fprintf\n");const char *s = "hello fputs\n";fputs(s, stdout);// 系统调用const char *ss = "hello write\n";write(1, ss, strlen(ss)); // 写到fd=1的文件上->stdoutfork();return 0;
}

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们先把现象解释一下:

首先

write 只打印了一次其他的打印了两次

为什么？我们下节课再讲！讲清楚之后，我们可以也可以回答一些尚未解答的现象了！

为什么会这样，我们现在来解释！

关于缓冲区的认识:

一般而言，行缓冲的设备文件 – 显示器
一般而言，全换从的设备文件 – 磁盘文件
所有设备，永远都倾向于全缓冲！缓冲区满了才刷新->需要更少的IO操作->更少次的外设访问->提高效率！

当和外部设备进行IO的时候，数据量的大小不是主要矛盾，和外设预备IO的过程才是最耗费时间的

其他刷新策略是，结合具体情况做的妥协！

为什么fork()之后拷贝一份？

如果向显示器打印，刷新策略是行刷新，那么最后执行 fork的时候，一定一定是函数执行完了 && 数据已经刷新了
如果对应的程序做了重定向，本质是向磁盘文件打印 — 隐性的刷新策略变成了全缓冲！此时代码的已经没有意

义了，所以fork的时候，函数执行完了，但是数据没有刷新！现在数据在，当前进程的C标准库中！
这部分数据，属不属于父进程的数据?肯定是的！fork之后，父子各自执行自己的退出。进程退出是需要刷新缓冲区的！
那么现在的一个问题，刷新这个动作，算不算“写”？算的，从缓冲区刷新出去，相当于写到显示器里
此时会有写时拷贝！
所以！C的接口会出现两份的数据！

4. 文件系统和inode

4.1 背景知识1

int main()
{// Cprintf("hello printf\n");fprintf(stdout, "hello fprintf\n");perror("hello perror"); // stderr// 系统调用const char* s1 = "hello write(stdout)\n";const char* s2 = "hello write(stderr)\n";write(1, s1, strlen(s1));write(2, s2, strlen(s2));// C++std::cout << "hello cout" << std::endl;std::cerr << "hello cerr" << std::endl;return 0;
}

这个代码直接运行，肯定是这样的。

但是如果重定向一下呢？

1，2都是显示器文件，但是他们两个是不同的显示器文件! 我们可以认为，同一个显示器文件，被打开了两次!

一般而言，如果程序运行有可能有问题的话，建议使用stderr来打印! 如果是常规打印，建议用stdout 打印。

然后区分之后，我们可以这么运行，可以把正确的和错误的分开打印到文件里面去。

可以理解成，把fd为2的放到err.txt里面去。

另外cat还有一个用法：

cat < log.txt > back.txt

这个表示，把log.txt的内容交给cat，cat准备向显示器打印，但是此时再次重定向到back.txt上，所以最终就是，log.txt的内容完成一次拷贝到back.txt上！

4.2 背景知识2

学习文件系统要掌握的背景知识：

我们以前学习的都是被打开的文件，那们有没有没有被打开的文件?当然存在，在磁盘里 2. 我们学习磁盘级别的文件，我们侧重点在哪里呢？

单个文件的角度 — 这个文件在哪里？这个文件多大?这个文件的其他属性是什么? 站在系统的角度，一共有多少个文件？各自属性在哪里?如何快速找到？我还可以存储多少个文件?如何快速找到制定的文件？

如何进行对磁盘文件进行分门别类的存储，又来支持更好的存取？

所以，我们先要了解磁盘

磁盘具体构造，寻址方式，可以看看以前的课件/ppt。

一个重要概念：虽然磁盘的基本单位是扇区(512字节) 但是操作系统(文件系统)和磁盘进行IO的基本单位是：4kb

为什么?

太小了，有可能会导致多次的IO，进而导致效率降低
如果OS使用和磁盘一样的大小，万一磁盘基本大小变了的话，OS的源代码要不要改呢? 所以硬件和软件(OS)进行解耦。

4.3 文件系统构造

4.4 如果文件特别大怎么办

一个block放不下怎么办？

在data block中，不是所有的datablock只能存文件数据，也可以存其他块的块号！

我们通过索引找到一个块之后，可以通过这个块继续找到下面的块这样就解决了要存大文件的问题

找到一个文件的步骤：inode 编号 -> 分区特定的bg -> inode -> 属性 -> 内容

现在的问题是，inode编号是怎么得到的？

在Linux文件属性中国呢，是没有文件名这个东西的。

在一个目录下，可以保存很多文件，但是这些文件名是不能重复的！
目录是文件吗？是 -> 所以目录也有自己的inode，也有自己的datablock！

一个文件的文件名，是存在datablock里面存的！

datablock里面存了：文件名和inode编号的映射关系！

下面我们要回答三个问题：

创建文件，系统做了什么
删除文件，系统做了什么?
查看文件，系统做了什么?

为什么删除总比拷贝快很多？因为删除的时候，不用把内容这部分东西真的删掉，只需要把位图标记改了就行了。

所以，删了的东西能恢复吗？肯定是可以的，只是我们不会而已我们只要找到原来的inode，找到磁盘的位置（删除日志）只要它还没被覆盖就一定能找到。

一道面试题:

为什么还有空间，但是一直不能创建文件呢？可能就是因为inode申请不下来文件无法创建。

如果创建出来，也只有个文件名没有inode这个时候一写就会失败，一写就会失败的，无法写入。

【操作系统和计网从入门到深入】（四）基础IO和文件系统

前言这个专栏其实是博主在复习操作系统和计算机网络时候的笔记，所以如果是博主比较熟悉的知识点，博主可能就直接跳过了，但是所有重要的知识点，在这个专栏里面都会提到！而且我也一定会保证这个专栏知识点的完整性&…...

编程日记 2024/1/22 8:32:40

四.Winform使用Webview2加载本地HTML页面并互相通信

Winform使用Webview2加载本地HTML页面并互相通信往期目录本节目标核心代码实现HTML代码实现的窗体Demo2代码效果图往期目录往期相关文章目录专栏目录本节目标实现刷新按钮点击 C# winform按钮可以调用C# winform代码显示到html上点击HTML按钮可以调用C# winform代码更…...

编程日记 2024/1/22 8:31:39

如何有效清理您的Python环境：清除Pip缓存

Python是一个广泛使用的高级编程语言，以其强大的库和框架而闻名。然而，随着时间的推移和不断安装新的包，Python环境可能会变得混乱不堪，尤其是pip缓存可能占用大量的磁盘空间。本文将向您展示如何有效地清理pip缓存，保…...

编程日记 2024/1/22 8:30:38

Jira 母公司全面停服 Server 产品，用户如何迁移至极狐GitLab

Jira 母公司即将全面停服旗下部分 Server 端产品的销售和服务支持！ Jira 母公司 Atlassian 在几年前确定了公司的战略为“全面上云”，为此做出了停止 Server 产品的销售和支持。整个时间线从 2021 年 2 月 2 日开始，直到今年 2 月 15 日&…...

编程日记 2024/1/22 8:29:36

Docker安装配置OnlyOffice

OnlyOffice 是一款强大的办公套件，你可以通过 Docker 轻松安装和部署它。本文将指导你完成安装过程。步骤 1：拉取 OnlyOffice Docker 镜像首先，使用以下命令从 Docker Hub 拉取 OnlyOffice Document Server 镜像： sudo docke…...

编程日记 2024/1/22 8:24:32

启动低轨道卫星LEO通讯产业与6G 3GPP NTN标准

通讯技术10年一个大跃进，从1990年的2G至2000年的3G网路，2010年的4G到近期2020年蓬勃发展的5G，当通讯技术迈入融合网路，当前的 5G 技术不仅可提供高频宽、低延迟，同时可针对企业与特殊需求以 5G 专网的模式提供各式服务…...

编程日记 2024/1/22 8:23:31

PICO Developer Center 创建和调试 ADB 命令

PICO 开发者中心概览 ADB 是一个轻量级的 Android 调试桥(Android Debug Bridge，简称 ADB)，用于与 Android 设备进行通信和调试。ADB提供了许多有用的功能，使开发人员能够轻松地管理和调试设备上的应用程序。你可以使用 PDC 工具来调试系统…...

编程日记 2024/1/22 8:21:30

【VRTK】【PICO】如何快速创建一个用VRTK开发的PICO项目

【背景】每次新建一个VRTK的PICO项目总是做一些重复工作，于是就想着搞成一个基本的包，把基本的设置都放进去，今后新做项目直接导这个包就行了。完整资源包请见本篇博客的绑定资源。【内容简介】这个包是我为了快速开发基于VRTK的PICO应用设置的基础项目包。每次开发…...

编程日记 2024/1/22 8:16:23

国产操作系统：VirtualBox安装openKylin-1.0.1虚拟机并配置网络

国产操作系统：VirtualBox安装openKylin-1.0.1虚拟机并配置网络 openKylin 操作系统目前适配支持X86、ARM、RISC-V三个架构的个人电脑、平板电脑及教育开发板，可以满足绝大多数个人用户及开发者的使用需求。适用于在VirtualBox平台上安装openKylin-1.0.1…...

编程日记 2024/1/22 8:11:18

本地git切换地区后，无法使用ssh访问github 22端口解决方案

问题由于放假回家，发现之前一直使用正常的git，与github无法通讯，pull和push都无法连接。报错如下： connect to host github.com port 22: Connection timed out fatal: Could not read from remote repository. 原因可能是所…...

编程日记 2024/1/22 8:09:16

Chat2DB：AI赋能的多数据库客户端工具，开源领航未来数据库管理

Chat2DB：开源多数据库客户端的AI革新 Chat2DB使用教程:Chat2DB使用教程_哔哩哔哩_bilibili 引言： 随着企业数据的快速膨胀，数据库管理的复杂性也在增加。此时，一个能够跨越数据库边界、并且集成先进的AI功能的工具，不…...

编程日记 2024/1/22 8:07:14

SQL Server修改数据字段名的方法

1. ALTER TABLE语句修改这是一种最常用的数据库更改字段的方法，使用Alter Table语句来更改数据库字段的名称。一般格式如下： ALTER TABLE 表名 RENAME COLUMN 原字段名 TO 新字段名; 例如，修改字段名字段名从UserName到Uname：…...

编程日记 2024/1/22 8:03:09

Flutter编译报错Connection timed out: connect

背景：用Android Studo 创建了Flutter项目，编译运行报错java.net.ConnectException: Connection timed out: connect 我自己的环境： windows11 Android Studio Flutter 截图如下： 将错误日志展开之后： Exception…...

编程日记 2024/1/22 7:57:04

PG DBA培训26：PostgreSQL运维诊断与监控分析

本课程由风哥发布的基于PostgreSQL数据库的系列课程，本课程属于PostgreSQL Diagnosis and monitoring analysis，学完本课程可以掌握PostgreSQL日常运维检查-风哥PGSQL工具箱，风哥专用PGSQL工具箱介绍，风哥专用PGSQL工具箱使用&…...

编程日记 2024/1/22 7:47:52

运维之道—生产环境安装Redis

目录 1.前言 2.环境准备 2.1 安装gcc依赖 3.部署安装 3.1 下载redis安装包 3.2 解压并编译安装redis 3.3 配置redis 编辑3.4 启动redis并测试 4. 总结 1.前言大家好，运维之道的系列文章继续进行，我们今天整理的是Redis生产环境的安装，Redis的安装以及生产环境的…...

编程日记 2024/1/22 7:46:51

人工智能数学验证工具LEAN4【入门介绍3】乘法世界-证明乘法的所有运算律

视频链接，创作不易记得投币哦： import Game.Levels.Multiplication.L08add_mul World "Multiplication" Level 9 Title "mul_assoc" namespace MyNat Introduction " We now have enough to prove that multiplication is a…...

编程日记 2024/1/22 7:42:46

Armv8-M的TrustZone技术简介

TrustZone技术是适用于Armv8-M的可选安全扩展，旨在为各种嵌入式应用提供改进的系统安全基础。 TrustZone技术的概念并不新鲜。该技术已经在Arm Cortex-A系列处理器上使用了几年，现在已经扩展到Armv8-M处理器。在high level上，TrustZone技术适用于Armv8-M的概念与Arm Cort…...

编程日记 2024/1/22 7:39:42

ctfshow-反序列化(web267-web270)

目录 web267 web268 web269 web270 总结 web267 页面用的什么框架不知道看源码看一下框架就是一种软件工具，它提供了一些基础功能和规范，可以帮助开发者更快地构建应用程序。比如Yii框架和ThinkPHP框架就是两个流行的PHP框架，它们提供…...

编程日记 2024/1/22 7:38:42

决策树的分类

概念决策树是一种树形结构树中每个内部节点表示一个特征上的判断，每个分支代表一个判断结果的输出，每个叶子节点代表一种分类结果决策树的建立过程 1.特征选择：选取有较强分类能力的特征。 2.决策树生成：根据选择的特征生…...

编程日记 2024/1/22 7:35:39

LateX--插入伪代码类型详解

文章目录 1.算法伪代码流程图----循环带范围1.1.算法伪代码示例图11.2.算法伪代码示例图2 2.算法伪代码流程图----循环不带范围3.算法伪代码流程图---不带行数数字4.参考文献 1.算法伪代码流程图----循环带范围 #需要插入这个宏包 \usepackage[ruled,linesnumbered]{algorithm…...

编程日记 2024/1/22 7:30:35

AI-调查研究-01-正念冥想有用吗？对健康的影响及科学指南

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2026/2/8 5:11:39

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2026/1/14 22:12:47

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

day52 ResNet18 CBAM

在深度学习的旅程中，我们不断探索如何提升模型的性能。今天，我将分享我在 ResNet18 模型中插入 CBAM（Convolutional Block Attention Module）模块，并采用分阶段微调策略的实践过程。通过这个过程，我不仅提升…...

编程新知 2025/11/9 1:27:18

1688商品列表API与其他数据源的对接思路

将1688商品列表API与其他数据源对接时，需结合业务场景设计数据流转链路，重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点： 一、核心对接场景与目标商品数据同步场景：将1688商品信息…...

编程新知 2025/11/30 16:55:32

el-switch文字内置

el-switch文字内置效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

编程新知 2026/1/26 10:00:16

Java多线程实现之Thread类深度解析

Java多线程实现之Thread类深度解析一、多线程基础概念1.1 什么是线程1.2 多线程的优势1.3 Java多线程模型二、Thread类的基本结构与构造函数2.1 Thread类的继承关系2.2 构造函数三、创建和启动线程3.1 继承Thread类创建线程3.2 实现Runnable接口创建线程四、Thread类的核心…...

编程新知 2025/8/28 21:52:02

C# 求圆面积的程序（Program to find area of a circle）

给定半径r，求圆的面积。圆的面积应精确到小数点后5位。例子： 输入：r 5 输出：78.53982 解释：由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982，因为我们只保留小数点后 5 位数字。输…...

编程新知 2026/2/8 9:34:11

在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的？

uni-app 中 Web-view 与 Vue 页面的通讯机制详解一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件，用于在原生应用中加载 HTML 页面： 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...

编程新知 2025/8/6 2:19:46

SiFli 52把Imagie图片，Font字体资源放在指定位置，编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍： img 属性指定分区存放的 image 名称，指定的 image 名称必须是当前工程生成的 binary 。如果 binary 有多个文件，则以 proj_name:binary_name 格式指定文件名， proj_name 为工程名&…...

编程新知 2026/1/23 10:51:19

前言