当前位置: 首页 > article >正文

Linux:基础IO---文件描述符

文章目录

      • 1. 前言
        • 1.1 C语言文件知识回顾
      • 2. 文件
        • 2.1 文件基础知识
      • 3. 被打开的文件
        • 3.1 以C语言为主,先回忆一下C文件接口
        • 3.2 过渡到系统,认识文件系统调用
        • 3.3 访问文件的本质
        • 3.4 重定向&&缓冲区

  • 序:在深入了解了进程的内容后,我们对于进程的学习将会告一个段落,现在我将对Linux中的基础IO部分的内容进行一个梳理,本章节将围绕文件描述符来走进文件的部分,进而了解对于基础IO这个宏观的理解。

1. 前言

1.1 C语言文件知识回顾

文件分为程序文件和数据文件
文件名 == 文件路径+文件名主干+文件后缀

数据文件:

  • 文本文件
  • 二进制文件

流:

我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。

C程序针对文件、画面、键盘等的数据输⼊输出操作都是通过流操作的。

⼀般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。

标准流:

那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?

那是因为C语言程序在启动的时候,默认打开了3个流:

stdin - 标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
stdout - 标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出
流中。

stderr - 标准错误流,⼤多数环境中输出到显⽰器界⾯。

这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。

stdin、stdout、stderr 三个流的类型是: FILE * ,通常称为文件指针。

C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。

C语言提供的一些有关文件操作的接口函数:

在这里插入图片描述

scanf:从标准输入流上读取格式化的数据
fscanf:从指定的输入流上读取格式化的数据
sscanf:在字符串中读取格式化的数据

printf:把数据以格式化的形式打印在标准输出流上
fprintf:把数据以格式化的形式打印在指定的输出流上
sprintf:把格式化的数据转化成字符串

2. 文件

2.1 文件基础知识

共识原理:

1. 文件 == 内容+属性

2. 文件分为打开的文件和没打开的文件

3. 打开的文件----->谁打开的?自然是进程。(本质是研究进程和文件的关系)

4. 没打开的文件----->在哪里放着呢?在磁盘上放着。我们最关心什么问题呢?没有被打开的文件非常多。文件如何被分门别类的放置好----->我们要快速的进行增删查改(快速找到文件)

问题一:文件是如何存储的呢?

1. 文件被打开必须先被加载到内存里
2. 进程:打开的文件=1:n
基于上面两点,操作系统内部一定存在大量的被打开的文件!

问题二:那么OS要不要管理这些被打开的文件呢?怎么管理呢???

一定是先描述,再组织!!!-----在内核中,一个被打开的文件都必须有自己的文件打开对象,该对象包含了文件的很多属性struct XXX(文件属性)

3. 被打开的文件

首先,确认我们的研究对象是被打开的文件

3.1 以C语言为主,先回忆一下C文件接口

问题一:当前路径是什么?

当前路径,就是当前进程的当前路径cwd(current work direction)

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>int main(){printf("pid:%d\n",getpid());int fd=open("loggggg.txt",O_WRONLY|O_CREAT|O_TRUNC,0666);if(fd<0){perror("open");return -1;}close(fd);sleep(1000);return 0;
}

当我们执行完后,发现我们在当前路径下,创建了loggggg.txt文件。
在这里插入图片描述
在这里插入图片描述

int main()
{printf("pid:%d\n",getpid());chdir("/home/zby/");int fd=open("loggggg.txt",O_WRONLY|O_CREAT|O_TRUNC,0666);if(fd<0){perror("open");return -1;}close(fd);sleep(1000);return 0;
}

问题二:如果我更改了当前进程的cwd,是不是就可以把文件新建到其他目录?

事实确实是如此的!!!

当我调用系统接口,改变当前进程的路径的时候,再去创建文件,发现创建文件的路径也随之改变
在这里插入图片描述
在这里插入图片描述

C程序启动的时候会默认打开三个标准输入输出文件
实际上,默认打开这三个标准输入输出流不是c语言的特性,是操作系统的特性,进程会默认打开键盘,显示器,显示器!!!

在这里插入图片描述

3.2 过渡到系统,认识文件系统调用

文件其实是在磁盘上,磁盘是外部设备,访问磁盘文件其实就是在访问硬件!

几乎所有的库,只要是访问硬件设备,必定要封装系统调用!(printf/fprintf/fscanf/fwrite/fread/fgets/gets/…----库函数系统调用接口)

open( )函数

在这里插入图片描述

#define ONE_FLAG 000000001<<0
#define TWO_FLAG 000000001<<1
#define THREE_FLAG 000000001<<2
#define FOUR_FLAG 000000001<<3void flag(int flag)
{if(flag&ONE_FLAG){printf("ONE_FLAG ");}if(flag&TWO_FLAG){printf("TWO_FLAG ");}if(flag&THREE_FLAG){printf("THREE_FLAG ");}if(flag&FOUR_FLAG){printf("FOUR_FLAG ");}printf("\n");
}int main()
{flag(ONE_FLAG);flag(ONE_FLAG|TWO_FLAG);flag(ONE_FLAG|TWO_FLAG|THREE_FLAG);flag(ONE_FLAG|TWO_FLAG|THREE_FLAG|FOUR_FLAG);return 0;
}

上面的代码演示结果如下:

在这里插入图片描述

这里强调一下位图的使用,open的第二个参数也是如此。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这里只展示了常用的几个宏。

3.3 访问文件的本质

文件描述符:

文件描述符0 1 2分别表述标准输入(stdin)、标准输出(stdout)、标准错误(stderr)。
在OS接口层面,只认fd ,即文件描述符。

FILE * fopen( )中的FILE是C语言提供的一个结构体,既然操作系统只认文件描述符,那么该结构体中一定封装了文件描述符fd。
例如: stdin -> _ fileno(stdin的fd)

close:将该文件描述符所对应的数组下标所指向的对象置空,并且引用计数减一。(一个文件是可以被多个用户使用的,如:stdout和stderr都是指向显示器文件。)

在这里插入图片描述

上面的代码是用户层,下面的组织形式是OS层。

当我们访问一个文件时,系统是通过该进程的task_struct结构体内的file_struct * file的结构体指针指向的文件描述符表,用该下标fd访问对应文件的PCB结构体,然后对磁盘将内容存放到文件缓冲区内,当我们要访问时,就将文件缓存区的文件内容拿出来用!!!

其中,read的本质是拷贝文件缓冲区的内容。

fd文件描述符的本质也是文件指针数组的下标

对文件内容,做任何操作,都必须把文件先加载(磁盘------>内存的拷贝)到内核对应的文件缓冲区内!!!

3.4 重定向&&缓冲区

文件描述符的的分配原则:从下标0开始,最小的,没有被使用的数组位置作为最新的fd文件描述符给用户

重定向:更改文件描述符的指针指向----->(数组下标不变)
dup2:进行重定向的系统调用
重定向:打开文件的方式+dup2

进程历史打开的文件与进行各种重定向关系都和未来进行程序替换无关!!!
程序替换不影响文件访问

问题一:问题一:stdout和stderr都是指向显示屏,有什么区别,为什么有了“1”,还要有“2”???

让我们看下面一段代码:

#include<stdio.h>
int main(){fprintf(stdout,"i am normal\n");fprintf(stdout,"i am normal\n");fprintf(stdout,"i am normal\n");fprintf(stdout,"i am normal\n");fprintf(stdout,"i am normal\n");fprintf(stderr,"i am error\n");fprintf(stderr,"i am error\n");fprintf(stderr,"i am error\n");fprintf(stderr,"i am error\n");fprintf(stderr,"i am error\n");return 0;
}

演示结果如下:
在这里插入图片描述

此时我们没看出什么,但当我们将这些内容都输入到一个文件中就会发生变化
在这里插入图片描述

这是为什么呢?让我们接着看!!!
当运行该段代码的时候在这里插入图片描述

发现两个分离了在这里插入图片描述

当我们直接将结果输入到log.txt文件当中时,默认是将文件描述符1所指向的文件内容传到log.txt中,所以打印到stderr文件中的内容不会打印到log.txt中去,而为什么stderr和stdout都指向显示器,是因为,当程序运行后的显示中可能会有错误信息,而当打印的信息很繁杂的时候,就需要将这些错误信息统一起来!!!所以,结论:是为了将错误信息单独拉出来。

问题二:如何理解“一切皆文件”?

在这里插入图片描述

当我们的使用系统调用接口read时,传一个文件描述符fd,操作系统就会通过该进程teak_struct内的files指针找到一个文件描述符表,找到对应的文件的PCB结构,调用里面的f_ops指针,指向operationfunc的结果体,然后调用里面的函数指针int(&readp)(),该函数指针指向对应的硬件设备,不同的硬件设备提供不同的read和write接口,但在operationfunc里面都是统一的接口,从而调用对应的read接口!!!
(用统一的文件接口来访问不同的硬件设备 == 一切皆文件)

其中的各种struct file就是虚拟文件系统(VFS),所以不同的硬件对应的读写方式肯定是不一样的,但是它们都有自己的 read 和 write 方法。也就是说,这里的硬件可以统一看作成一种特殊的文件。比如这里设计一种结构:struct file,它包括文件的属性、文件的操作或方法等,Linux 说一切皆文件,Linux 操作系统就必须要能够保证这点。在 C 语言中,怎么让一个结构体既有属性又有方法呢?函数指针。此时每一个硬件都对应这样一个结构,硬件一旦数量很多,操作系统就需要对它们进行管理 —— 先描述,再组织。所谓的描述就是 struct file;而组织就是要把每一个硬件对应的结构体关联起来,并用 file header 指向。所以在操作系统的角度,它所看到的就是一切皆文件,也就是说所有硬件的差异经过描述就变成了同一种东西,只不过当具体访问某种设备时,使用函数指针执行不同的方法达到了不同的行为。现在就能理解为什么可以把键盘、显示器这些设备当作文件,因为本质不同,设备的读写方法是有差异的,但我们可以通过函数指针让不同的硬件包括普通文件在操作系统看来是同样的方法、同样的文件。所以,一切皆文件。

总结:

本篇文章从C语言入手,从C语言的文件接口出发,逐渐过渡到系统对于文件的调用,本文的研究对象是已经被打开的文件,我们用先描述,再组织6个字,创建文件结构体对文件进行管理,然后通过几个细致的例子和对问题的讲解,说出我对重定向和缓冲区的理解!!!

相关文章:

Linux:基础IO---文件描述符

文章目录 1. 前言1.1 C语言文件知识回顾 2. 文件2.1 文件基础知识 3. 被打开的文件3.1 以C语言为主&#xff0c;先回忆一下C文件接口3.2 过渡到系统&#xff0c;认识文件系统调用3.3 访问文件的本质3.4 重定向&&缓冲区 序&#xff1a;在深入了解了进程的内容后&#xf…...

15:视图

1. 什么是视图&#xff1f; 视图是sql查询的虚拟表&#xff0c;他并不直接存储数据&#xff0c;而是基于单表/多表查询的结果创建的一张虚拟表&#xff0c;主要是为了提高查询速率、简化复杂查询。 视图的数据基于原始表&#xff0c;如果原始表中的数据发生了改变&#xff0c;…...

附——教6

审核较严格&#xff01;审核较严格&#xff01;审核较严格&#xff01; 完整内容参见&#xff1a; https://zhuanlan.zhihu.com/p/32050040665 注解&#xff1a; 1. 投机本质论&#xff1a;市场本质是投机&#xff0c;投资仅是表象&#xff1b; 2. 安全G点法则&#xff1a;精…...

使用 CA 证书进行签名的步骤

使用 CA 证书进行签名通常涉及以下步骤&#xff1a; 生成私钥和证书签名请求&#xff08;CSR&#xff09;&#xff1a;你需要生成一个私钥&#xff0c;并基于该私钥创建一个 CSR 文件。使用 CA 证书签名 CSR&#xff1a;使用 CA 的私钥对 CSR 进行签名&#xff0c;生成最终的证…...

LINUX基础 [二] - 进程概念

目录 前言 什么是进程 如何管理进程 描述进程 组织进程 如何查看进程 通过 ps 命令查看进程 通过 ls / proc 命令查看进程 通过系统调用 获取进程标示符 前言 在学习了【Linux系统编程】中的 ​ 操作系统 和 冯诺依曼体系结构 之后&#xff0c;我们已经对系统应该有…...

浏览器自动携带cookie注意事项

文章目录 浏览器自动携带与目标域相关的 cookie 是由 HTTP 协议规范和浏览器设计共同决定的一、Cookie 携带的基本规则同源策略下的自动携带跨域请求的受限携带一、服务器端配置二、客户端配置三、 常见错误及注意事项 二、Cookie 属性的筛选逻辑 三、浏览器携带cookie的准则1.…...

同旺科技USB to I2C 适配器 ---- 指令循环发送功能

所需设备&#xff1a; 内附链接 1、同旺科技USB to I2C 适配器 1、周期性的指令一次输入&#xff0c;即可以使用 “单次发送” 功能&#xff0c;也可以使用 “循环发送” 功能&#xff0c;大大减轻发送指令的编辑效率&#xff1b; 2、 “单次发送” 功能&#xff0c;“发送数据…...

算法及数据结构系列 - 滑动窗口

系列文章目录 算法及数据结构系列 - 二分查找 算法及数据结构系列 - BFS算法 算法及数据结构系列 - 动态规划 算法及数据结构系列 - 双指针 算法及数据结构系列 - 回溯算法 算法及数据结构系列 - 树 文章目录 滑动窗口框架思路经典题型76. 最小覆盖子串567. 字符串的排列438. …...

AI密码学

嗯&#xff0c;用户给了一个需要破译的密码文档&#xff1a;“Uif qjh jt po uif usff.”&#xff0c;提示是用字母往前推移1的凯撒密码。首先&#xff0c;我得确认自己是否正确理解提示。凯撒密码通常是将字母按照一定位移来替换&#xff0c;这里的提示是往前推1位&#xff0c…...

关于VSCode使用过程中的一些问题记录(持续更新)

1. VSCode更新拒绝访问 VSCode安装更新的时候出现&#xff1a; D:\Program Files\Microsoft VS Code\tools\inno_updater.exe 尝试在目标目录创建文件时发生一个错误&#xff1a;拒绝访问。 解决方法&#xff1a; 1. 禁止VSCode的自动检查更新&#xff0c;操作方法&#xff…...

重新复活的(手机端)一站式应用管理与下载平台

应用乐园&#xff08;安卓&#xff09; 应用乐园作者去年3月表示&#xff0c;由于精力问题&#xff0c;要停止维护奇妙搜索、应用乐园、奇妙影视这些软件了。 然而最近&#xff0c;令人意外的是&#xff0c;应用乐园竟然“复活”了&#xff01;更准确地说&#xff0c;它进行了…...

Vue3前端开发:组件化设计与状态管理

Vue3前端开发&#xff1a;组件化设计与状态管理 一、Vue3组件化设计 组件基本概念与特点 是一款流行的JavaScript框架&#xff0c;它支持组件化设计&#xff0c;这意味着我们可以将页面分解成多个独立的组件&#xff0c;每个组件负责一部分功能&#xff0c;通过组件的嵌套和复用…...

失物招领|校园失物招领系统|基于Springboot的校园失物招领系统设计与实现(源码+数据库+文档)

校园失物招领系统目录 目录 基于Springboot的校园失物招领系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、 管理员功能实现 (1) 失物招领管理 (2) 寻物启事管理 (3) 公告管理 (4) 公告类型管理 2、用户功能实现 (1) 失物招领 (2) 寻物启事 (3) 公告 …...

嵌入式硬件工程师从小白到入门-原理图(三)

原理图绘制从小白到入门&#xff1a;知识点速通与注意事项 一、原理图绘制基础概念 什么是原理图&#xff1f; 原理图&#xff08;Schematic&#xff09;是电子电路的图形化表示&#xff0c;展示元器件之间的电气连接关系&#xff0c;是硬件设计的蓝图。 核心元素 元器件符号&…...

Pear Admin Flask 开发问题

下载代码请复制以下命令到终端执行 git clone https://gitee.com/pear-admin/pear-admin-flask 于是我下载git 完成安装后&#xff1a; 安装 Git 后出现的页面是 “Git for Windows 的版本发布说明&#xff08;Release Notes&#xff09;”&#xff0c;通常会在安装完成后自动弹…...

Collectors.toMap / list 转 map

前言 略 Collectors.toMap List<User> userList ...; Map<Long, User> userMap userList.stream().collect(Collectors.toMap(User::getUserId, Function.identity()));假如id存在重复值&#xff0c;则会报错Duplicate key xxx, 解决方案 两个重复id中&#…...

1996-2023年各省公路里程数据(无缺失)

1996-2023年各省公路里程数据&#xff08;无缺失&#xff09; 1、时间&#xff1a;1996-2023年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;公路里程&#xff08;万公里&#xff09; 4、范围&#xff1a;31省 5、指标解释&#xff1a;公路里程指报告期末…...

量化研究---可转债量化交易系统上线快速服务器

现在可转债交易系统使用的人多&#xff0c;服务器比较小&#xff0c;今天对服务器进行了升级&#xff0c;提供快速的数据支持&#xff0c;同时我也给了服务器的源代码&#xff0c;支持自定义服务器数据支持&#xff0c;不通过我服务器&#xff0c;可以挂在服务器上面24小时快速…...

用ArcGIS做一张符合环评要求的植被类型图

植被类型图是环境影响评价&#xff08;环评&#xff09;中的重要图件&#xff0c;需满足数据准确性、制图规范性和信息完整性等要求。本教程将基于ArcMap平台&#xff0c;从数据准备到成果输出&#xff0c;详细讲解如何制作符合环评技术规范的植被类型图。 ArcGIS遥感解译土地…...

Java 双端队列实战 实现滑动窗口 用LinkedList的基类双端队列Deque实现 洛谷[P1886]

集合 关系 介绍 Deque 是一个接口 LinkedList 是这个接口的实现类 题目 输入输出 滑动窗口 基于双端队列实现 Deque<Integer> deque new LinkedList<>(); 滑动窗口代码 洛谷 public static List<Integer> maxSlidingWindow(int[] nums, int k) {List&l…...

【商城实战(54)】解锁商城国际化密码:内容管理全攻略

【商城实战】专栏重磅来袭&#xff01;这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建&#xff0c;运用 uniapp、Element Plus、SpringBoot 搭建商城框架&#xff0c;到用户、商品、订单等核心模块开发&#xff0c;再到性能优化、安全加固、多端适配&#xf…...

AI代码编辑器:Cursor和Trae

Cursor 定义&#xff1a;Cursor 是一款基于AI的代码编辑器&#xff0c;它继承了VS Code的核心功能&#xff0c;并在此基础上增加了深度AI支持。它支持代码生成、优化、重构以及调试等功能&#xff0c;提供直观的Diff视图和自动补全功能&#xff0c;是一款功能强大的编程工具。…...

[学习笔记] VM虚拟机安装Ubuntu系统

前言 我现在装的Ubuntu总是死机&#xff0c;经常黑屏&#xff0c;所以我决定换个版本&#xff0c;顺便写一下笔记&#xff0c;给大家分享如何安装虚拟机 下载 这里我选择的是Ubuntu 22.04.5 LTS&#xff0c;下载链接&#xff1a;Ubuntu 22.04.5 LTS 如果访问不了网站的话&…...

统计学重要概念:自由度

在统计学中&#xff0c;自由度&#xff08;degrees of freedom&#xff0c;简称df&#xff09;是一个重要的概念&#xff0c;它表示在计算某个统计量时可以自由变化的值的数量。对于一个样本量为n的样本&#xff0c;自由度通常为n-1&#xff0c;这是因为我们需要用样本数据来估…...

3.22模拟面试

前端模拟面试&#xff08;1 年经验&#xff09; 面试时长&#xff1a;40-60 分钟 面试难度&#xff1a;初中级 技术栈&#xff1a;Vue 3、TypeScript、微前端&#xff08;qiankun&#xff09;、Webpack/Rspack、Ant Design、组件库迁移 一、基础知识 HTML & CSS 介绍一下…...

汇编语言习题笔记——第1章 汇编语言基础

第1章 汇编语言基础 1. IA-32处理器有哪三类基本段,各是什么用途? 段类型寄存器主要用途特点代码段 (CS)CS存储可执行指令执行权限,通常只读,与 IP/EIP/RIP 配合,确定指令地址数据段 (DS, ES, FS, GS)DS, ES, FS, GS存储程序数据 (变量, 数据结构等)读写权限,多个寄存器…...

为扣子智能体接入 DeepSeek

扣子现已推出满血版 DeepSeek 全家桶&#xff0c;支持免费体验 R1、V3 模型。除此之外&#xff0c;扣子支持 DeepSeek 思维链&#xff08;Chain-of-Thought&#xff0c;CoT&#xff09;和 Function Calling 能力&#xff0c;为你的智能体添加私有知识和多种技能&#xff0c;拓展…...

3.22日西南竞篮,NBA勇士VS老鹰,赛前数据前瞻

3.22日NBA勇士VS老鹰赛前数据前瞻 关键要点 明天&#xff08;3月22日&#xff09;的NBA比赛是金州勇士对阵亚特兰大老鹰&#xff0c;盘口为勇士让2.5分&#xff0c;大小分预设为230.5。 勇士目前战绩41胜29负&#xff0c;西部第六&#xff1b;老鹰战绩33胜36负&#xff0c;东部…...

C语言:循环控制结构习题

1水仙花数是指各个位数的立方和等于本身的三位数。例如&#xff1a;153是水仙花数&#xff0c;因为1531的立方5的立方3的立方。 编程计算并输出所有的水仙花数。 第一种做法 思路&#xff1a; 1三位数&#xff1a;百位&#xff0c;十位和个位&#xff0c;除了百位是1-9&#…...

Dear ImGui for Unity 常见问题解决方案

Dear ImGui for Unity 常见问题解决方案 dear-imgui-unity Unity package for Dear ImGui 项目地址: https://gitcode.com/gh_mirrors/de/dear-imgui-unity 1. 项目基础介绍 Dear ImGui for Unity 是一个开源项目&#xff0c;旨在将Dear ImGui库整合到Unity游戏引擎中。…...