Linux文件原生操作
Linux 中一切皆文件,那么 Linux 文件是什么?
在 Linux 中的文件
可以是:传统意义上的有序数据集合,即:文件系统中的物理文件
也可以是:设备,管道,内存。。。(Linux 管理的一切对象)

Linux 中的文件描述符
文件描述符是一个整数值,他在内核中被用于标识打开的文件或其它 I/O 资源
当打开一个文件时,系统会分配一个文件描述符来唯一标识该文件
文件描述符的范围通常是 0 到 1023
- 0、1、2 被系统占用,分别代表标准输入、标准输出和标准错误
- 进程中可用的文件描述符范围是 3 到 1023
Linux 原生文件编程接口



示例 -- 文件复制

文件复制实现
test1.c
#define _LARGEFILE_SOURCE
#define _LARGEFILE64_SOURCE
#define _FILE_OFFSET_BITS 64#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>static int copy(int src, int des)
{int ret = 0;char buf[256] = {0};do{ret = read(src, buf, sizeof(buf));ret = (ret > 0) ? write(des, buf, ret) : ret;} while( ret == sizeof(buf) );return (ret >= 0);
}int main(int argc, char* argv[])
{int src = 0;int des = 0;if( argc == 3 ){if( (src = open(argv[1], O_RDONLY)) == -1 ){printf("source: open error...\n");exit(-1);}if( (des = open(argv[2], O_CREAT | O_WRONLY, 0777)) == -1 ){printf("dest: open error...\n");exit(-1);}if( copy(src, des) ){printf("succeed: %s ==> %s\n", argv[1], argv[2]);}else{printf("failed...\n");}close(src);close(des);}else{printf("invalid parameters...\n");}return 0;
}
第 1 - 3 行的宏定义是为了可以拷贝更大的文件
第 19 - 22 行,一直不断的从源文件读取 256 字节,写入到目的文件,直到最后写入的字节不足256字节,就认为是拷贝结束了
程序运行结果如下图所示:

示例 -- 外存数组
需求:
- 创建一个可以存储 "无限" 个元素的数组
- 数组大小可动态扩大,即:动态向数组中追加元素
- 提供统一访问数据元素的方式,即:以 0 下标作为起始位置
解决方案 => 时间换空间
C 语言中的数组将数据存储于内存中,使用数组前必须定义大小
- 优点:访问速度快 缺点:大小必须固定
若要实现可 "无限追加" 的数组,则需要将数据存储于外存中
- 将数组元素存储于文件中 (不必预先定义大小,可实时拓展)
- 根据数组元素大小实时定位文件读写位置,并读写固定大小的数据
- 优点:数组大小不受限制 缺点:访问速度较慢
外存数组接口设计

关键代码设计

外存数组应用示例

外存数组实现
ext_array.h
#ifndef _EXT_ARRAY_H_
#define _EXT_ARRAY_H_typedef void EArray;#define EArray_Init(n, type) EArray_Init_(n, sizeof(type)) #define EArray_Get(type, arr, index) ({ \type ret = {0}; \EArray_Get_(arr, index, &ret); \ret; \
})#define EArray_Set(type, arr, index, v) ({ \type val = v; \EArray_Set_(arr, index, &val); \
})#define EArray_Append(type, arr, v) ({ \type val = v; \EArray_Append_(arr, &val); \
})EArray* EArray_Init_(unsigned int n, unsigned int esize);int EArray_Get_(EArray* arr, unsigned int index, void* e);
int EArray_Set_(EArray* arr, unsigned int index, const void* e);int EArray_Append_(EArray* arr, const void* e);unsigned int EArray_Length(EArray* arr);void EArray_Release(EArray* arr);#endif
ext_array.c
#define _LARGEFILE_SOURCE
#define _LARGEFILE64_SOURCE
#define _FILE_OFFSET_BITS 64#include <time.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include "ext_array.h"typedef struct _ext_array_
{int fd;char name[128];unsigned int esize;unsigned int length;
}ExtArray;EArray* EArray_Init_(unsigned int n, unsigned int esize)
{ExtArray* ret = malloc(sizeof(ExtArray));if( ret ){time_t t = {0};time(&t);sprintf(ret->name, "./%ld", t);if( (ret->fd = open(ret->name, O_CREAT | O_RDWR, 0777)) != -1 ){int i = 0;for(i=0; i<n*esize; i++){char c = 0;write(ret->fd, &c, 1);}ret->esize = esize;ret->length = n;}else{free(ret);ret = NULL;}}return ret;
}int EArray_Get_(EArray* arr, unsigned int index, void* e)
{int ret = -1;ExtArray* ea = arr;if( ea && e && (index < ea->length) ){lseek(ea->fd, index * ea->esize, SEEK_SET);ret = read(ea->fd, e, ea->esize);}return ret;
}int EArray_Set_(EArray* arr, unsigned int index, const void* e)
{int ret = -1;ExtArray* ea = arr;if( ea && e && (index < ea->length) ){lseek(ea->fd, index * ea->esize, SEEK_SET);ret = write(ea->fd, e, ea->esize);}return ret;
}int EArray_Append_(EArray* arr, const void* e)
{int ret = -1;ExtArray* ea = arr;if( ea && e ){lseek(ea->fd, 0, SEEK_END);ret = write(ea->fd, e, ea->esize);if( ret != -1 ){ea->length += 1;}}return ret;
}unsigned int EArray_Length(EArray* arr)
{int ret = -1;ExtArray* ea = arr;if( ea ){ret = ea->length;}return ret;
}void EArray_Release(EArray* arr)
{ExtArray* ea = arr;if( ea ){close(ea->fd);unlink(ea->name);free(ea);}
}
test2.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>#include "ext_array.h"int main(int argc, char* argv[])
{EArray* arr = EArray_Init(5, int);int i = 0;printf("length = %d\n", EArray_Length(arr));for(i=0; i<EArray_Length(arr); i++){EArray_Set(int, arr, i, i + 1);}EArray_Append(int, arr, 1000);printf("length = %d\n", EArray_Length(arr));for(i=0; i<EArray_Length(arr); i++){int val = EArray_Get(int, arr, i);printf("val = %d\n", val);}EArray_Release(arr);return 0;
}
EArray_Init_(...) 函数用于创建一个随机文件名的文件,用于存储数组的内容,将这片预定义的空间先写为0
EArray_Get_(...) 和 EArray_Set_(...) 函数通过 lseek(...) 定位到要读写元素的位置,然后进行读写
EArray_Append_(...) 函数通过 lseek(...) 定位到文件的末尾,然后再进行写入操作
我们定义 EArray_Get、EArray_Set 和 EArray_Append 这三个宏,是因为这三个函数末尾带下划线的版本需要传入元素的地址而不是数据,而传入地址,我们每次调用的时候都必须先定义出一个变量出来,再传入这个变量的地址,这样使用很不方便,所以才定义这三个宏,可以直接传入数据
Linux 一切皆文件?
ASCII C 文件操作:
- stdin => 标准输入流,stdout => 标准输出流,stderr => 标准错误输出
Linux 原生文件操作:
- 1 => 显示设备,0 => 输入设备,2 => 错误设备

以文件的方式操作设备

通过 ASCII C 文件操作 => 输入 / 输出

通过 Linux 文件操作 => 输入 / 输出

设备文件操作
test3.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <memory.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>static void ascii_file_io()
{char buf[16] = {0};int i = 0;char c = 0;do{fread(&c, sizeof(c), 1, stdin);if( c == '\n' )break;elsebuf[i++] = c;} while( i < 16);fwrite("output: ", 1, 8, stdout);fwrite(buf, 1, i, stdout);fwrite("\n", 1, 1, stdout);
}static void linux_file_io()
{char buf[16] = {0};int i = 0;/*do{char c = 0;read(0, &c, 1);if( c == '\n' )break;elsebuf[i++] = c;} while( i < 16);*/i = read(0, buf, sizeof(buf));write(1, "output: ", 8);write(1, buf, i);write(1, "\n", 1);
}
int main(int argc, char* argv[])
{// ascii_file_io();linux_file_io();return 0;
}
第 50 行,我们读取文件描述符 0(标准输入),标准输入默认为行缓冲,所以我们在键盘上输入换行符,read 才会返回
程序运行结果如下图所示:

相关文章:
Linux文件原生操作
Linux 中一切皆文件,那么 Linux 文件是什么? 在 Linux 中的文件 可以是:传统意义上的有序数据集合,即:文件系统中的物理文件 也可以是:设备,管道,内存。。。(Linux 管理的一切对象…...
(undone) MIT6.S081 2023 学习笔记 (Day7: LAB6 Multithreading)
网页:https://pdos.csail.mit.edu/6.S081/2023/labs/thread.html 任务1:Uthread: switching between threads (moderate) (doing) 在这个练习中,你将设计一个用户级线程系统中的上下文切换机制,并实现它。为了帮助你开始…...
doris:导入时实现数据转换
Doris 在数据导入时提供了强大的数据转换能力,可以简化部分数据处理流程,减少对额外 ETL 工具的依赖。主要支持以下四种转换方式: 列映射:将源数据列映射到目标表的不同列。 列变换:使用函数和表达式对源数据进行实时…...
2021版小程序开发4——基础加强
2021版小程序开发4——基础加强 学习笔记 2025 自定义组件组件中behaviors的作用安装和使用vant-weapp组件库使用MobX实现全局数据共享对小程序的API进行Promise化 具体的内容还包括:使用npm包、全局数据共享、分包和自定义tabBar的案例; 1 自定义组件 …...
Zookeeper入门部署(单点与集群)
本篇文章基于docker方式部署zookeeper集群,请先安装docker 目录 1. docker初期准备 2.启动zookeeper 2.1 单点部署 2.2 集群部署 3. Linux脚本实现快速切换启动关闭 1. docker初期准备 拉取zookeeper镜像 docker pull zookeeper:3.5.6 如果拉取时间过长…...
【AI非常道】二零二五年一月(二),AI非常道
经常在社区看到一些非常有启发或者有收获的话语,但是,往往看过就成为过眼云烟,有时再想去找又找不到。索性,今年开始,看到好的言语,就记录下来,一月一发布,亦供大家参考。 有关AI非…...
jQuery小游戏(二)
jQuery小游戏(二) 今天是新年的第二天,本人在这里祝大家,新年快乐,万事胜意💕 紧接jQuery小游戏(一)的内容,我们开始继续往下咯😜 游戏中使用到的方法 key…...
【硬件测试】基于FPGA的QPSK+帧同步系统开发与硬件片内测试,包含高斯信道,误码统计,可设置SNR
目录 1.算法仿真效果 2.算法涉及理论知识概要 2.1QPSK 2.2 帧同步 3.Verilog核心程序 4.开发板使用说明和如何移植不同的开发板 5.完整算法代码文件获得 1.算法仿真效果 本文是之前写的文章 《基于FPGA的QPSK帧同步系统verilog开发,包含testbench,高斯信道,误码统计,可…...
NVIDIA GPU介绍:概念、序列、核心、A100、H100
概述 入职一家大模型领域创业公司,恶补相关知识。 概念 一些概念: HPC:High Performance Computing,高性能计算SoC:System on Chip,单片系统FLOPS:Floating Point Operations Per Second&am…...
LINUX部署微服务项目步骤
项目简介技术栈 主体技术:SpringCloud,SpringBoot,VUE2, 中间件:RabbitMQ、Redis 创建用户 在linux服务器home下创建用户qshh,用于后续本项目需要的环境进行安装配置 #创建用户 useradd 用户名 #设置登录密…...
C++ list 容器用法
C list 容器用法 C 标准库提供了丰富的功能,其中 <list> 是一个非常重要的容器类,用于存储元素集合,支持双向迭代器。<list> 是 C 标准模板库(STL)中的一个序列容器,它允许在容器的任意位置快速…...
解密全同态加密中的自举(Bootstrapping)
摘要 自举(Bootstrapping)是全同态加密(Fully Homomorphic Encryption, FHE)中经常使用的术语。熟悉 FHE 的人都知道,自举是 FHE 方案中最复杂且计算密集的部分。然而,只有极少数非 FHE 专家真正理解自举操…...
C#方法(练习)
1.定义一个函数,输入三个值,找出三个数中的最小值 2.定义一个函数,输入三个值,找出三个数中的最大值 3.定义一个函数,输入三个值,找出三个数中的平均值 4.定义一个函数,计算一个数的 N 次方 Pow(2, 3)返回8 5.传入十一…...
显示当前绑定变量
来自v$sql中的信息 测试两个变量的情况(实际可以看6个,可根据需要修改) DROP TABLE T1 PURGE; CREATE TABLE T1 AS SELECT A.*,SYSDATE RIQI FROM DBA_USERS A ORDER BY 1;var mc char(3); var id number; exec :mc:SYS; exec :id:50;set li…...
随机森林例子
完整代码: # 导入必要的库 from sklearn.datasets import load_iris from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import numpy as np# 加载鸢尾花数…...
2025年1月个人工作生活总结
本文为 2025年1月工作生活总结。 研发编码 使用sqlite3命令行查询表数据 可以直接使用sqlite3查询数据表,不需进入命令行模式。示例如下: sqlite3 database_name.db "SELECT * FROM table_name;"linux shell使用read超时一例 先前有个编译…...
arm-linux-gnueabihf安装
Linaro Releases windows下打开wsl2中的ubuntu,资源管理器中输入: \\wsl$gcc-linaro-4.9.4-2017.01-x86_64_arm-linux-gnueabihf.tar.xz 复制到/home/ark01/tool 在 Ubuntu 中创建目录: /usr/local/arm,命令如下: …...
vscode和pycharm的区别
VSCode(Visual Studio Code)和 PyCharm 是两款常用的 Python 开发工具,它们在功能和使用体验上有一些关键区别: 1. 核心定位 VSCode:轻量级、多语言支持的代码编辑器,依靠插件扩展 Python 开发能力。PyCh…...
宝塔面板SSL加密访问设置教程
参考:https://www.bt.cn/bbs/thread-117246-1-1.html 如何快速使用证书加密访问面板 因早期默认未开启https访问所以没有相关的风险提醒,现面板默认已开启https加密访问、提升安全性 由于采用的是服务器内部本身签发证书,不被公网浏览器信任请参考以下步…...
Baklib在知识管理创新中的价值体现与其他产品的优势比较分析
内容概要 在当前的数字化时代,知识管理成为企业成功的重要组成部分。有效的知识管理不仅有助于提升内部沟通效率,还能促进创新与决策的科学化。尤其是Baklib作为一种知识中台,具有独特的价值,它能够融合企业内外的知识资源&#…...
Python 数据分析 - 初识 Pandas
Python 数据分析 - 初识 Pandas 简介SeriesDataFrame创建基本操作添加删除 简介 Pandas 基于 NumPy 开发,它提供了快速、灵活、明确的数据结构,旨在简单、直观地处理数据。 Pandas 适用于处理以下类型的数据: 有序和无序的时间序列数据带行…...
力扣【416. 分割等和子集】详细Java题解(背包问题)
首先我们可以求出数组和,当我们找到一个子集中元素的和为数组和的一半时,该就说明可以分割等和子集。 对于该问题我们可以转换成背包问题,求 数组里的元素 装入 数组和的一半大小的背包 能取得的最大值。 然后注意可以剪枝的地方。 代码&…...
机器学习周报-文献阅读
文章目录 摘要Abstract 1 相关知识1.1 WDN建模1.2 掩码操作(Masking Operation) 2 论文内容2.1 WDN信息的数据处理2.2 使用所收集的数据构造模型2.2.1 Gated graph neural network2.2.2 Masking operation2.2.3 Training loss2.2.4 Evaluation metrics 2…...
【Linux】Linux C判断两个IPv6地址是否有包含关系
功能说明 要判断两个 IPv6 地址是否具有包含关系,包括前缀的比较,可以通过以下步骤实现: 解析 IPv6 地址和前缀:将两个 IPv6 地址和它们的前缀长度解析为二进制形式。生成掩码:根据前缀长度生成掩码。按位比较&#…...
【Linux】列出所有连接的 WiFi 网络的密码
【Linux】列出所有连接的 WiFi 网络的密码 终端输入 sudo grep psk /etc/NetworkManager/system-connections/*会列出所有连接过 Wifi 的信息,格式类似 /etc/NetworkManager/system-connections/AAAAA.nmconnection:pskBBBBBAAAAA 是 SSID,BBBBB 是对…...
C语言连接Mysql
目录 C语言连接Mysql下载 mysql 开发库 方法介绍mysql_init()mysql_real_connect()mysql_query()mysql_store_result()mysql_num_fields()mysql_fetch_fields()mysql_fetch_row()mysql_free_result()mysql_close() 完整代码 C语言连接Mysql 下载 mysql 开发库 方法一…...
Synology 群辉NAS安装(6)安装mssql
Synology 群辉NAS安装(6)安装mssql 写在前面mssql 2019:成功安装说明,这个最终成功了 mssql 2022没有成功1. pull image2.启动mssql docker container 远程连接 写在前面 mssq是一个重要节点。 这是因为我对mysql没有一丝好感。虽然接触了许…...
WEB集群1-5天
文章目录 第一天、1、初始化配置1. 编写的初始化的脚本 init_env.sh2. 远程拷贝初始化脚本到mysql服务器里3.在mysql这台服务器上执行脚本 2、总结 第二天1、yumyum介绍yum操作将冯老师提供的网站的源码包上传到web服务器 2、部署网站1、解压文件2、epel源:可以提供…...
“AI视频智能分析系统:让每一帧视频都充满智慧
嘿,大家好!今天咱们来聊聊一个特别厉害的东西——AI视频智能分析系统。想象一下,如果你有一个超级聪明的“视频助手”,它不仅能自动识别视频中的各种元素,还能根据内容生成详细的分析报告,是不是感觉特别酷…...
oracle中使用in 和 not in 查询效率分析
在Oracle数据库中,IN和NOT IN的查询效率受多种因素影响,以下是关键点总结和优化建议: 1. IN 的效率 优化方式: IN 通常会被优化为 OR条件 或 半连接(Semi-Join),如果子查询关联到外部表&#x…...
