当前位置: 首页 > news >正文

Linux->文件系统初识

目录

前言:

 1 认识文件

2 文件使用

2.1 文件加载

2.2 外设文件使用

3 文件接口和文件描述符

3.1 文件系统调用接口

open:

3.2 文件描述符

4 缓冲区


前言:

        在大家看这篇文章之前,我得提出几个问题:

1. 我们有多种对于文件的操作方式,不同的语言有不同的方式,但是对于我们的操作系统来说,它真的认识这么多语言提供的方式吗?

2. 操作文件时,都需要打开文件,但为什么打开文件?

3. 文件在操作时,文件处在什么位置?

4. 当系统中存在大量的被打开的文件,应该如何管理?

 1 认识文件

        所谓对于文件的操作究其本质,其实它并不关于任何一门语言,而是所有的语言都尊崇同样的接口,并且对这些接口封装,从而实现我们看到了语言的各种各样的不同的文件操作方式。这些操作在后方为大家介绍。

        文件本身就是内容加上属性,所以对于文件的操作就是对于内容的操作和对其属性的操作,当我们没有使用文件时,它是安静的呆在磁盘当中。一旦我们对文件操作时,他就会从磁盘加载到内存当中,这一点相信大家了解冯诺依曼体系一定能明白。

        我们在对文件进行操作的时候,文件需要内加载到内存当中,但是是否只有我们一个人在使用呢?也就是这个文件是否有多个人在对其进行打开操作?答案肯定是不可能只有一个人也就是一个进程在使用的,因为就连我们平时操作Linux时,我都能对一个文件进行多次打开。而且我在一个程序当中是可以打开多个文件的,那么我们可以得到一个结论:进程和文件的对应关系是1:n。

        并且,在Liunx下,一切皆文件。

       综上,系统会打开多个进程,而一个进程又会操作多个文件,那么系统中会充斥非常多的文件,这些文件是如何被管理的呢?下面就会讲解文件的加载过程和文件的管理操作

2 文件使用

2.1 文件加载

       首先,我们了解文件在没有被操作时是呆在磁盘当中的,只有在被调度时才会从磁盘加载到内存当中,然后呢?如果所有文件的操作都是到这里就戛然而止了,那么内存当中必然到处都是乱七八糟的文件,此时就必须得有一个管理的操作。

        看到管理大家必须的像是触发了关键词一样,那就是先描述,再组织。没错操作系统对于文件的管理如同进程管理那般,都是先描述再组织,那么它同样是有自己抽象出来的结构体用于装载自己的信息

struct file
{

        //属性

        //各种链接关系
}

        看到我们结构体当中存有的数据是属性和各种链接关系,那么证明了什么?也就是说我们的文件内容与我们的管理并没有太多的关系,那么我们就让他乖乖的呆在内存当中,甚至在刚准备打开文件的时候只需要将文件的各种属性告知操作系统都行,内容慢慢的加载

        文件是由操作系统打开的,但是是我们也就是进程让操作系统打开的,那么这样我们的对于文件的操作也就变为了进程与文件的操作。

        在系统当中,进程和文件都是被组织起来的数据结构,那么他们之间的交互就变成了两个结构体的操作------struct tast_struct和struct file

        所以整个文件加载到内存当中的过程就如下图:

         相信看到了这一张图大家是能够将我前面所讲的内容联系起来的,当然真实的图比我这要复杂很多。这里我们将文件管理和内存管理分开来看,文件结构体里面只存有文件在内存当中的地址,也就是整个文件管理和内存管理的关系只有这样的联系,并且这个联系是随时能够被更改的。具体如何更改呢?我之后讲解。那么这样做之后有什么好处呢?实现了文件管理和内存管理的解耦操作,也就是两者都互相并不关心彼此是如何操作的,彼此都只需要一个固定的方式进行交互

2.2 外设文件使用

         操作系统想要显示内容到显示器上面,或者想要获取键盘上的信息从本质而言都是对于文件的操作,但是这样想是否有一些抽象?它怎么就能使用外设文件的信息,它是怎么搞的?但是我们可以换一个角度去想象我们的外设,如果外设是一个进程代码呢?那么它里面是不是就有了什么?代码,而代码里面有什么?函数,也就是每一个外设都是有提供自己的操作方式的,例如键盘就会有一个输入内容的操作方式,显示器就有显示内容的操作方式

        那么因为是一个函数,我们就可以做一件什么事情呢?那就是调用这个函数实现对应的功能,不过说起来简单,具体应该怎么操作呢?如下图:

         请问,我们在file结构体当中定义了一个什么样的变量?函数指针,我们都知道Linux是用C语言写的,而C语言不支持在结构体里面写成员函数,所以操作系统也不会支持写成员函数,但是函数的什么是可以写在结构体当中的呢?那就是函数指针,只要有了函数指针找到对应的函数还不简单

        那么上图也就表示了,任何一个外设都有属于自己的文件,并且每一个文件都被抽象成为了一个结构体,所有信息都被记录了起来,通过函数指针调用外设本身为我们提供的操作函数。这样做就能实现对所有不同的外设做出统一的管理执行方式了。要问如果外设不按照这个规则来写呢?那我之只能说那是外设的问题,不是系统的问题。

        至于上面为什么键盘只有读函数,显示器只有写函数的原因,也不是这两个没有对应的写和读函数,只是都被置位空了,调用了没有任何意义,我们总不能从键盘上写信息吧,难道让它的某个按键跳起来打人?这也太奇怪了。

3 文件接口和文件描述符

3.1 文件系统调用接口

        博主在最开始的时候就已经为大家声明了,任何语言对于文件的操作都源自于封装系统给我们提供的系统调用函数,那么函数有哪些呢?

  • fcntl  文件控制  
  • open  打开文件  
  • creat  创建新文件  
  • close  关闭文件描述字  
  • read  读文件  
  • write  写文件  
  • readv  从文件读入数据到缓冲数组中  
  • writev  将缓冲数组里的数据写入文件  
  • pread 对文件随机读  
  • pwrite  对文件随机写

        博主这里也就主要使用open、close、write、read函数,主要是想要让大家了解这些接口的操作方式。

open:

         文件系统调用的所有接口都在这三个文件当中,重点讲解的是它的参数,第一个参数const char* pathname,相信大家通过变量名也能够知道这是个什么参数,没错,这就是文件的位置加名字,通过字符串表示,这个没什么难的,我也不需要多讲。

        第二个参数int flags,这是干嘛的?你们可能得说了,这不就是一个整数嘛,有啥,并不是,他是一个有32位的位图数据结构。什么意思?看下代码。

  1 #include<stdio.h>2 3 #define ONE    0x014 #define TWO    0x025 #define THREE  0x046 #define FOUR   0x087 #define FIVE   0x108 9 void Print(int flags)                                                                                                         10 {11   if(flags & ONE) printf("ONE\n");12   if(flags & TWO) printf("TWO\n");13   if(flags & THREE) printf("THREE\n");14   if(flags & FOUR) printf("FOUR\n");15   if(flags & FIVE) printf("FIVE\n");16 }17 18 int main()19 {20   Print(ONE);21   printf("*******************************\n");22   Print(ONE | TWO);23   printf("*******************************\n");24   Print(ONE | TWO | THREE);25   printf("*******************************\n");26 }

输出:

         看到了什么现象?我们通过不同的位然后输出了不同的结果,这也就是位图的作用。

        而我们的open函数里面的flags也是同样的作用,只不过它提供了更多的接口罢了。如下:

         除了以上接口外,还有很多接口,不过博主认为初次学习认识这些接口就行了。

O_APPEND:追加内容

O_CREAT:没有文件时创建文件

O_TRUNC:清空之前文件数据

O_RDONLY:只读

O_WRONLY:只写

O_RDWR:可读可写

操作方式: 

         大家可能会主要到0666,这是什么?很简单,这就是权限的意思,表示所有人都是可读可写,那么创建的log.txt的权限表示应该是-rw-rw-rw-这样才对,但是看界面:

         是我们说的那样嘛?很明显不是,为什么那是因为有一个权限掩码的东西在作祟,也就是umask。怎么改呢?很简单只需要在主程序当中加一句umask(0)即可。

         上述就是open函数的操作了,其余函数我也不讲解了,有兴趣的大家可以自行了解,本篇文章重点不再这里,而是open函数的返回值int fd

3.2 文件描述符

        所谓文件描述符其实也不是什么很牛逼的东西,就是一个数字,也可以说是一个数组下标,还记得我开始画的那一张图嘛?

         就是这一张图,它的里面就应该有文件描述符,只不过我没有画出来罢了,如果加上就变成了如下:

         我们的每一个进程里面都有自己专属的struct file结构体,这个结构体变量里面会存储大量的被打开的文件的地址,但是,我们这些文件的时候却不是通过地址去匹配,而是通过下标实现,也就是我们的文件描述符fd。

        在C封装代码当中我们也是能够找到文件标识符的:

        我们每打开一个进程,操作系统都会自动为我们打开三个文件分别是标准输入、标准输出、标准错误,分别对应了文件描述符0、1、2这三个位置。通过代码可以查看:

         当然这都不是重点,重点是当我们知道了这三个文件的文件描述符我们就能干一件什么事情呢?那就是偷偷给他把里面的地址换了,换成我们自己的文件地址,怎么说呢?也就是重定向功能,比如本来应该输出到显示器上的代码,现在却跑到了我自己的文件中去了。如下:

         当我们没有关闭1号文件,那么这个时候的1号文件就是stdout对应的文件,那么输出的方式就是在显示器上表示出来,看结果:

         和我们预想的一模一样,那么我们将1号文件关闭,再自己在后面打开一个文件,请看发生了什么。

 

         看到了吗?我们的输出跑到了log.txt文件当中去了,整个过程我就关闭了1号文件,然后创建了一个文件,而且创建的文件的文件标识符又变成了1,这说明了什么?

        这证明了,文件描述符的存储方式根据顺序排列,如果前面有小的描述符,那么这个文件就会去占据哪一个位置。

         此时,咱们就实现了流的重定向功能,但是这样做有点太挫了,看不下去,还要先去关闭一个文件才能重新指向一个新的文件,所以还有一个接口dup(),就是用来替换这种无语的操作的,看下方:

         当然,一般来说我们都是用dup2()来替换的,其中的两个参数表示,将oldfd去指向newfd,表示了关闭原来的newfd,成为现在的oldfd。这样讲有点绕,图解:

         看到了吗?我们并没有改变log.txt的指向,也没有关闭1号文件,但是我们输出内容时,都会被存到log.txt文件当中,还可以看到log.txt的文件描述符不是1而是3,这就表明了,我们将1号位置的文件地址变为了log.txt,3号还是三号。

4 缓冲区

        对于缓冲区,博主不想说过多,不过基础的知识可以提及一些,缓冲区在系统当中是没有这个玩意的,缓冲区的实现和我们平时写的代码是一个级别的东西,都是用户层代码。平时我们看不到它,但是它却存在的原因是因为有库文件为我们维护了,它的实现很复杂也很牛逼,博主也不明白,可能以后会明白,但是我知道缓冲区有三种刷新方式。

无缓冲:内容直接刷新

行缓冲:遇到一个\n刷新

全缓冲:缓冲区满了或者程序结束了刷新

         对于这个的理解我用一段奇怪的代码,大家就能够理解了:

         这没什么,不就是把数据输出嘛,也没什么不对,但是请看下面:

         我们重定向到log.txt文件当中发生了什么?先输出的write,然后在输出了两个printf,这很奇怪不是吗?其实不然,如果我们知道了缓冲区就知道了怎么回事。

        write是系统调用,所以没有缓冲区,但是printf呢,有缓冲区,并且因为有fork()创建了一个子进程,那么这个时候缓冲区的内容同时被父子进程都获取到了,但是程序结束需要刷新缓冲区,这个时候就会发生什么?父进程或者子进程都会区刷新缓冲区,但是缓冲区只有一个数据,怎么办呢?那么这个时候就会出现写时拷贝的这个过程,也就表示了会出现两个hello printf。

        出现这个现象,究其原因其实就是我们的文件重定向之后,将缓冲区刷新方式冲行缓冲变为了什么?全缓冲。


        以上,就是我对文件初认识的全部理解,希望能对大家有帮助。

相关文章:

Linux->文件系统初识

目录 前言&#xff1a; 1 认识文件 2 文件使用 2.1 文件加载 2.2 外设文件使用 3 文件接口和文件描述符 3.1 文件系统调用接口 open&#xff1a; 3.2 文件描述符 4 缓冲区 前言&#xff1a; 在大家看这篇文章之前&#xff0c;我得提出几个问题&#xff1a; 1. 我们有多…...

InfluxDB和IotDB介绍与性能对比

InfluxDB简介 InfluxDB 是用Go语言编写的一个开源分布式时序、事件和指标数据库&#xff0c;无需外部依赖。用于存储和分析时间序列数据的开源数据库。 适合存储设备性能、日志、物联网传感器等带时间戳的数据,其设计目标是实现分布式和水平伸缩扩展。 InfluxDB 包括用于存储和…...

计算机体系结构(校验码+总线)

校验码计算机系统运行时&#xff0c;为了确保数据在传送过程中正确无误&#xff0c;一是提高硬件电路的可靠性&#xff1b;二就是是提高代码的校验能力&#xff0c;包括查错和纠错。通常使用校验码的方法检测传送的数据是否出错。这里的校验码主要是指循环冗余校验码&#xff0…...

JavaWeb《三》Request请求转发与Response响应

&#x1f34e;道阻且长&#xff0c;行则将至。&#x1f353; 本文是javaweb的第三篇&#xff0c;介绍了Request请求转发与Response响应。 上一篇&#xff1a;JavaWeb《二》Servlet、Request请求 下一篇&#xff1a;敬请期待 目录一、Request请求转发&#x1f34f;二、Response对…...

断言assert

assert作用&#xff1a;我们使用assert这个宏来调试代码语法&#xff1a;assert&#xff08;bool表达式&#xff09;如果表达式为false&#xff0c;会调用std::cout<<abort函数&#xff0c;弹出对话框&#xff0c;#include<iostream> #include<cassert> void…...

【Java项目】完善基于Java+MySQL+Tomcat+maven+Servlet的博客系统

目录一、准备工作二、引入依赖三、创建必要的目录四、编写代码五/六、打包部署(直接基于 smart tomcat)七、验证代码正式编写服务器代码编写数据库相关的操作代码创建数据库/表结构(数据库设计)数据库代码封装数据库操作封装针对数据的增删改查&#xff01;博客列表页约定前后端…...

详解结构体内存对齐

目录 前言 一、内存大小的计算 1.规则 2.练习 二、为什么要有内存对齐 1.移植原因 2.性能原因 三、修改默认对齐数 总结 前言 本文针对结构体大小的计算进行深度剖析。结构体的大小要遵守内存对齐&#xff0c;在绝大数情况下&#xff0c;会浪费空间。但是有其的价值&…...

指针:程序员的望远镜

指针&#xff1a;程序员的望远镜一、什么是指针1.1 指针的定义1.2 指针和普通变量的区别1.3 指针的作用1.4 指针的优点和缺点二、指针的基本操作2.1 取地址运算符"&"2.2 指针的声明与定义2.3 指针的初始化2.4 指针的解引用2.5 指针的赋值2.6 指针的运算2.7 指针的…...

【python实现学生选课系统】

一、要求&#xff1a; 选课系统 管理员&#xff1a; 创建老师&#xff1a;姓名、性别、年龄、资产 创建课程&#xff1a;课程名称、上课时间、课时费、关联老师 使用pickle保存在文件 学生&#xff1a; 学生&#xff1a;用户名、密码、性别、年龄、选课列表[]、上课记录{课程…...

备受青睐的4D毫米波成像雷达,何以助力高阶自动驾驶落地?

近日&#xff0c;海外媒体曝出特斯拉已向欧洲监管机构提交车辆变更申请&#xff0c;并猜测特斯拉最新的自动驾驶硬件HW4.0或将很快量产上车。据爆料&#xff0c;HW4.0最大的变化是马斯克放弃的毫米波雷达又加了回来&#xff0c;根据国外知名博主Greentheonly的拆解分析&#xf…...

3.20算法题(一) LeetCode 合并两个有序数组

题目链接&#xff1a;算法面试题汇总 - LeetBook - 力扣&#xff08;LeetCode&#xff09;全球极客挚爱的技术成长平台 题目描述&#xff1a;给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2&#xff0c;另有两个整数 m 和 n &#xff0c;分别表示 nums1 和 nums2 中的元…...

QT | 编写一个简单的上位机

QT | 编写一个简单的上位机 时间&#xff1a;2023-03-19 参考&#xff1a; 1.易懂 | 手把手教你编写你的第一个上位机 2.QT中修改窗口的标题和图标 3.图标下载 1.打开QT Creator 2.新建工程 Qt Creator 可以创建多种项目&#xff0c;在最左侧的列表框中单击“Application”&am…...

DirectX12(D3D12)基础教程(二十一)—— PBR:IBL 的数学原理(2/5)

目录3、IBL 数学原理3.1、基于微平面理论的 “Cook-Torrance” 模型回顾3.2、 ksk_sks​ 项与菲涅尔项等价消除3.3、拆分“漫反射项”和“镜面反射项”3、IBL 数学原理 接下来&#xff0c;就让我们正式进入整个 IBL 的数学原理的旅程。请注意&#xff0c;前方高能&#xff01; …...

嵌入式学习笔记——SysTick(系统滴答)

系统滴答前言SysTick概述SysTick是个啥SysTick结构框图1. 时钟选择2.计数器部分3.中断部分工作一个计数周期&#xff08;从重装载值减到0&#xff09;的最大延时时间工作流程SysTick寄存器1.控制和状态寄存器SysTick->CTRL2.重装载值寄存器SysTick->LOAD3.当前值寄存器Sy…...

Linux实操之服务管理

文章目录一、服务(service)管理介绍:service管理指令查看服务名服务的运行级别(runlevel):CentOS7后运行级别说明chkconfig指令介绍一、服务(service)管理介绍: 服务(service)本质就是进程&#xff0c;但是是运行在后台的&#xff0c;通常都会监听某个端口&#xff0c;等待其它…...

基于Java+SpringBoot+vue的毕业生信息招聘平台设计和实现【源码+论文+演示视频+包运行成功】

博主介绍&#xff1a;专注于Java技术领域和毕业项目实战 &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&#x1f3fb; 不然下次找不到哟 Java项目精品实战案例&#xff08;200套&#xff09; 目录 一、效果演示 二、…...

智能生活垃圾检测与分类系统(UI界面+YOLOv5+训练数据集)

摘要&#xff1a;智能生活垃圾检测与分类系统用于日常生活垃圾的智能监测与分类&#xff0c;通过图片、视频和摄像头识别生活垃圾&#xff0c;对常见的可降解、纸板、玻璃、金属、纸质和塑料等类别垃圾进行检测和计数&#xff0c;以协助垃圾环保分类处理。本文详细介绍基于YOLO…...

建立农村污水处理设施已经成为了当务之急!

在现代社会中&#xff0c;随着城市化进程的加速和人口的增长&#xff0c;选择农村污水处理设备进行污水处理已经成为了一个非常重要的问题。虽然城市中的污水处理设施得到了很好的发展&#xff0c;但是农村地区的污水处理还存在很多问题。 在农村地区&#xff0c;由于缺乏污水…...

【Matlab算法】粒子群算法求解一维线性函数问题(附MATLAB代码)

MATLAB求解一维线性函数问题前言正文函数实现可视化处理可视化结果前言 一维线性函数&#xff0c;也称为一次函数&#xff0c;是指只有一个自变量xxx的函数&#xff0c;且函数表达式可以写成yaxbyaxbyaxb的形式&#xff0c;其中aaa和bbb是常数。具体来说&#xff0c;aaa称为斜…...

【JavaEE】Thread 类及常用方法

一、Thread 类Thread 类我们可以理解为是 java 用于管理线程的一个类&#xff0c;里面封装了操作系统提供的线程管理这一方面的 API &#xff08;Thread 是优化后的结果&#xff09;, Java 代码创建的每一个线程&#xff0c;可以理解为为 Thread 实例化的对象&#xff0c;Threa…...

C语言数据结构初阶(7)----队列

CSDN的uu们&#xff0c;大家好。这里是C语言数据结构的第七讲。 目标&#xff1a;前路坎坷&#xff0c;披荆斩棘&#xff0c;扶摇直上。 博客主页&#xff1a;姬如祎队列的基础知识队列&#xff08;queue&#xff09;是只允许在一端进行插入操作&#xff0c;而在另一端进行删除…...

代码随想录二刷 day01 | 704. 二分查找 27. 移除元素 977. 有序数组的平方

代码随想录二刷day01704. 二分查找27. 移除元素977. 有序数组的平方704. 二分查找 题目链接 做这种题最好现在纸上写一写&#xff0c;如果在大脑中想&#xff0c;可能一会就晕了。 二刷的时候发现了一个新的知识点 即&#xff1a; >>的作用 二分法第二种写法&#xff1a…...

Linux 终端、进程组、会话、守护进程

文章目录一、终端概念终端概念控制终端二、进程组概念进程组概述进程组相关 API会话会话概念会话相关 API创建会话注意事项守护进程守护进程介绍守护进程模型守护进程参考代码守护进程相关 API参考文章一、终端概念 终端概念 1、终端&#xff08;Terminal&#xff09; 终端是…...

你是否有潜质成为谷歌开发者专家?加入 GDE 成长计划,释放潜力!

谷歌开发者专家 (Google Developer Experts&#xff0c;GDE)&#xff0c;又称谷歌开发者专家项目&#xff0c;是由一群经验丰富的技术专家、具有社交影响力的开发者和思想领袖组成的全球性社区。通过在各项活动演讲以及各个平台上发布优质内容来积极助力开发者、企业和技术社区…...

安全防御之防火墙篇(二)

目录 1.防火墙如何处理双通道协议&#xff1f; 2.防火墙如何处理NAT&#xff1f; 3.防火墙支持哪些NAT技术&#xff0c;主要应用的场景是什么&#xff1f; 4.当内网PC通过公网域名解析访问内网服务器的时候&#xff0c;会存在什么问题&#xff0c;如何解决&#xff1f;请详细…...

设计必备,5个png免抠素材网站,建议收藏

做设计、PPT都需要用到大量的免抠素材&#xff0c;职场中熟练使用Photoshop的人毕竟是少数&#xff0c;也很少有人愿意花费时间去精细抠图。那这5个免抠素材网站一定要收藏好&#xff0c;可以有效帮你节省时间&#xff0c;提高工作效率。 1、菜鸟图库 https://www.sucai999.co…...

shell 脚本expect

expect 是什么 expect - programmed dialogue with interactive programs&#xff08;与互动程序进行程序对话&#xff09; 定义脚本执行的 shell #!/usr/bin/expect -f 定义的是执行 expect 可执行文件的链接路径&#xff08;或真实路径&#xff09;&#xff0c;功能类似于bas…...

第十九天 Maven总结

目录 Maven 1. 前言 2. 概述 2.1 介绍 2.2 安装 3. IDEA集成Maven 3.1 集成Maven环境 3.2 创建Maven项目 3.3 Maven坐标详解 3.4 导入maven项目 4. 依赖管理 4.1 依赖配置 4.2 依赖传递 4.3 依赖范围 4.4 生命周期 4.5 插件 Maven 1. 前言 1). 什么是Maven? …...

ESP8266-NodeMCU开发板-------开发板介绍(1)

目录 认识ESP8266-NodeMCU开发板​编辑 GPIO编号与NodeMCU开发板引脚名的区别&#xff1a; ESP8266 GPIO编号与NodeMCU开发板引脚名的对应关系 可用引脚 电压电流限制 特殊引脚情况说明 上拉电阻/下拉电阻 模拟输入 通讯 认识ESP8266-NodeMCU开发板 初识NodeMCU开发板 (第1章-第…...

【测试开发篇3】软件测试的常用概念

目录 一、软件测试的生命周期(5个步骤) ①需求分析(两个角度) 用户角度&#xff1a; 开发人员的角度&#xff1a; ②测试计划 ③测试设计、测试开发 ④执行测试 ⑤测试评估 二、软件测试贯穿项目的整个生命周期的体现 需求分析阶段 计划阶段 设计阶段 编码阶段 …...