Linux文件管理知识:文本处理
上篇文章详细介绍了Linux系统中查找文件的工具或者命令程序的相关操作内容介绍。那么,今天呢,这篇文章围绕Linux系统中文本处理来阐述。

众所周知,所有Linux操作系统都离不开一个核心原则,那就是它是由很多种文件组成的,那么,Linux系统的任何操作就离不开文本文件的处理。所以,它有很多命令工具用来处理文本的。在这篇文章中我们主要介绍下用于文本格式化输出及其它常用的命令工具。
常见的命令工具如下:
| 命令(工具)名称 | 描述 |
| cat | 用于连接文件并且打印到标准输出 |
| sort | 用于给文本行排序 |
| uniq | 用于报告或者省略重复行 |
| cut | 用于从每行中删除文本区域 |
| paste | 用于合并文件文本行 |
| join | 用于基于某个共享字段来联合两个文件的文本行 |
| comm | 用于逐行比较两个有序的文件 |
| diff | 用于逐行比较文件 |
| patch | 用于给原始文件打补丁 |
| tr | 用于翻译或删除字符 |
| sed | 用于筛选和转换文本的流编辑器 |
| aspell | 用于交互式拼写检查器 |
接下来,我们先回顾下Linux系统文本处理工具。
Linux文本处理工具
说到Linux文本处理工具或者程序,我相信大家首先提到就是vim了。是的,没错!但是文本还可以用来做什么呢?这个值得大家思考!
在这里列举一些用途:
- 通过纯文本格式形式编写文档;
- 另一种文本文档格式就是网页,目前最常见的就是通过超文本标记语言HTML或可扩展的标记语言XML作为标记语言来实现的;
- 基于文本的电子邮件email;
- 纯文本格式格式化输出;
- 软件开发里的程序源码;.
cat-A命令程序
cat-A命令程序,可将文本非打印字符(比如说控制字符tab、空格、回车字符等)显示出来。
实例1:
第一步:创建测试文件或者实例
[root@linuxprobe ~]$ cat > test1.txt
The food is delicious.
[root@linuxprobe ~]$
备注:
创建测试文件test1.txt,输入cat命令指定了用于重定向输出的文件test1.txt,随后输入文本内容“ The food is delicious. ”,最后回车Enter 键;使用Ctrl+D组合键指示cat命令。
需要注意的是测试文件test1.txt文本内容的开头和末尾分别使用了一个tab 字符以及一些空格。
第二步:刚刚创建的测试文件test1.txt文本内容通过cat-A命令显示出来:
[root@linuxprobe ~]$ cat -A test1.txt
^IThe food is delicious.. $
[root@linuxprobe ~]$
结论:
在输出的显示结果中我们可以分析:
文本中的tab 字符由ˆI 字符来显示出来。
文本末尾的空格由$ 字符来显示出来。
实例2:
第一步:创建测试文件或者实例
[root@linuxprobe ~]$ cat > test2.txt
It tastes delicious,
and makes one run at the mouth.
[root@linuxprobe ~]$
[root@linuxprobe ~]$ cat -ns test2.txt //-n:给文本行添加行号
-s:禁止输出多个空白行
1 It tastes delicious,
2
3 and makes one run at the mouth.
[root@linuxprobe ~]$
备注:
重新创建了一个新的测试文件test2.txt,其文本内容为It tastes delicious,
and makes one run at the mouth.并由两个空白行区分开。经过cat -ns命令程序执行处理(给文本行添加行号,并将禁止输出多个空白行输出)输出显示出来。
sort命令程序
sort 命令程序针对指定的文本内容或命令行中指定的一个或多个内容进行排序,并将排序结果标准输出显示出来。
sort 程序来处理标准输入实例:
[root@linuxprobe ~]$ sort test3.txt
2
3
1
[root@linuxprobe ~]$ ccat test3.txt
将test1.txt test2.txt test3.txt三个文本文件合并为一个有序的文件sorted _test_list.txt。
Sort命令程序的常见选项参数如下表:
| 选项 | 长选项 | 描述 |
| -b | --ignore-leading-blanks | 默认情况下,对整行进行排序,从每行的第一个字符开始。这个选项导致sort 程序忽略每行开头的空格,从第一个非空白字符开始排序。 |
| -f | --ignore-case | 让排序不区分大小写。 |
| -n | --numeric-sort | 基于字符串的数值来排序。使用此选项允许根据数字值执行排序,而不是字母值。 |
| -r | --reverse | 按相反顺序排序。结果按照降序排列,而不是升序。 |
| -k | --key=field1[,field2] | 对从field1 到field2 之间的字符排序,而不是整个文本行。看下面的讨论。 |
| -m | --merge | 把每个参数看作是一个预先排好序的文件。把多个文件合并成一个排好序的文件,而没有执行额外的排序。 |
| -o | --output=file | 把排好序的输出结果发送到文件,而不是标准输出。 |
| -t | --field-separator=char | 定义域分隔字符。默认情况下,域由空格或制表符分隔。 |
这篇文章主要介绍了cat及sort命令程序,它们是如何被用来执行文本处理操作的。
Linux系统知识博大精深,所以我在此强烈建议大家可以参考下《linux就该这么学》这本书,对于linux系统文本处理层面的介绍很详细!那么关于Linux系统中文本处理命令的操作及运用介绍先告一段落了,后期文章会一一补发。
相关文章:
Linux文件管理知识:文本处理
上篇文章详细介绍了Linux系统中查找文件的工具或者命令程序的相关操作内容介绍。那么,今天呢,这篇文章围绕Linux系统中文本处理来阐述。 众所周知,所有Linux操作系统都离不开一个核心原则,那就是它是由很多种文件组成的࿰…...
flink的带状态的RichFlatMapFunction函数使用
背景 使用RichFlatMapFunction可以带状态来决定如何对数据流进行转换,而且这种用法非常常见,根据之前遇到过的某个key的状态来决定再次遇到同样的key时要如何进行数据转换,本文就来简单举个例子说明下RichFlatMapFunction的使用方法 RichFl…...
MySQL的安装使用(入学篇)
目录 1 MySQL安装 1.1 安装epel源 1.2 安装MySQL Repository 1.3 安装MySQL官方yum源 1.4 安装服务端、客户端 1.5 启动MySQL服务 2 MySQL 使用 2.1 获取初始登录密码 2.2 登录MySQL数据库 2.3 修改密码 2.4 退出数据库 2.5 使用新密码登录数据库 2.6 重启数据库 2.7 创建数据…...
面试复习整理
redis持久化方式和原理 Redis持久化是指将Redis内存中的数据以某种形式保存到磁盘上,以保证在Redis重启后数据不会丢失。Redis支持两种持久化方式:RDB(Redis DataBase)和AOF(Append Only File)。 RDB持久…...
第四章 :Spring Boot 配置文件指南
第四章 :Spring Boot 配置文件 前言 本章知识重点:作者结合开发实际经验与应用场景结合,整理了5种获取配置属性的方式。配置文件中获取属性应该是SpringBoot开发中最为常用的功能之一,但是常用的功能,仍然有很多开发者在这个方面踩坑。通过本章节学习在实际中避免一些坑,…...
常用中间件分类
常见的中间件包括: 消息中间件:用于处理应用程序之间的异步消息传递,常见的消息中间件包括 RabbitMQ、Apache Kafka、ActiveMQ 等。 缓存中间件:用于缓存数据以加快访问速度,常见的缓存中间件包括 Redis、Memcached 等…...
中文编程软件视频推荐,自学编程电脑推荐,中文编程开发语言工具下载
中文编程软件视频推荐,自学编程电脑推荐,中文编程开发语言工具下载 给大家分享一款中文编程工具,零基础轻松学编程,不需英语基础,编程工具可下载。 这款工具不但可以连接部分硬件,而且可以开发大型的软件…...
Spring Boot 启动加速
一、简介 本文将带你了解如何通过调整 Spring 应用的配置、JVM 参数和使用 GraalVM 原生镜像来缩短 Spring Boot 的启动时间。 二、调整 Spring 应用 首先,创建一个 Spring Boot(2.5.4)应用,添加 Spring Web、Spring Actuator …...
UDP数据报文格式
...
软考-系统架构-2023-反思
2023年11月4日,参加了软考的高级架构设计考试。针对于这次考试做一些总结和反思。 我的考试准备周期非常长,但是实际的时间非常少。差不多一年前我就开始有这个计划和想法准备考试了,但是前期基本上就是翻翻书,跟没有开始区别并不…...
day52
今日内容概要 web应用程序 手写web框架(帮助我们理解别人写好的成熟框架、重点在于思路的理解、代码无需掌握) Django框架的学习 Python中得主流框架 框架的下载、安装、版本、怎么启动、怎么使用等 三板斧问题 web应用程序 Django框架是一款专门用来开发web应用的框架 …...
Mysql关联查询
Mysql关联查询 1、数据准备 # 班级表 create table class(id int primary key auto_increment,name varchar(20),description varchar(100) );# 学生表 create table student(id int primary key auto_increment,sn varchar(20),name varchar(20),email varchar(20),class_id…...
MOSFET和IGBT栅极驱动器TLP250H(D4-TP1,F)电路的基本原理
TLP250H,TLP250H(D4-TP1,F)是SOP8封装中的光电耦合器,由GaA组成ℓ作为红外发光二极管(LED)光学耦合到集成的高增益、高速光电探测器IC芯片。它在高达125℃的温度下提供有保证的性能和规格. TLP250H具有内部法拉第屏蔽,…...
Vue - Syntax Error: TypeError: this.getOptions is not a function 项目运行时报错,详细解决方案
报错问题 关于此问题网上的教程都无法解决,如果您的报错与本文相似,本文即可 100% 完美解决。 在 vue2.js 项目中,执行 npm run serve 运行时出现如下报错信息, Syntax Error: TypeError: this.getOptions is not a function 解决方案 按照以下步骤,即可完美解决。 这个错…...
C 语言类型转换
C 语言类型转换 类型转换允许我们将一种数据类型转换为另一种数据类型。在C语言中,我们使用强制转换运算符进行类型转换,用(type)表示。 语法: (type)value;注意:始终建议将较低的值转换为较高的值&…...
数据结构-链表的简单操作实现
目录 0.链表前序工作 1.构建出一个链表 2.展示链表中的所有存储数据 3.查找关键字key是否在链表中 4.求链表的长度 5.头插法 6.尾插法 7.插入任意位置(规定第一个元素位置为0下标) 8.删除第一次出现的值为key的关键字 9.删除所有值为key的关键字…...
竞赛选题 深度学习手势识别 - yolo python opencv cnn 机器视觉
文章目录 0 前言1 课题背景2 卷积神经网络2.1卷积层2.2 池化层2.3 激活函数2.4 全连接层2.5 使用tensorflow中keras模块实现卷积神经网络 3 YOLOV53.1 网络架构图3.2 输入端3.3 基准网络3.4 Neck网络3.5 Head输出层 4 数据集准备4.1 数据标注简介4.2 数据保存 5 模型训练5.1 修…...
【算法练习Day42】买卖股票的最佳时机 III买卖股票的最佳时机 IV
📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:练题 🎯长路漫漫浩浩,万事皆有期待 文章目录 买卖股票的最佳时机 III买卖…...
苹果手机如何备份通讯录?看完这篇就懂了!
如果遇到手机丢失或者出现故障的情况,通讯录备份可以避免联系人信息丢失。另外,当用户更换手机或者进行数据迁移时,提前备份好的通讯录数据可以快速还原到新设备上,避免了手动输入联系人的麻烦。苹果手机如何备份通讯录࿱…...
[yarn]yarn异常
一、运行一下算圆周率的测试代码,看下报错 cd /home/data_warehouse/module/hadoop-3.1.3/share/hadoop/mapreduce hadoop jar hadoop-mapreduce-examples-3.1.3.jar pi 1000 1000 后面2个数字参数的含义: 第1个1000指的是要运行1000次map任务 …...
llama-cpp-python:企业级本地大语言模型部署的Python高性能绑定解决方案
llama-cpp-python:企业级本地大语言模型部署的Python高性能绑定解决方案 【免费下载链接】llama-cpp-python Python bindings for llama.cpp 项目地址: https://gitcode.com/gh_mirrors/ll/llama-cpp-python 在当今AI应用快速发展的时代,如何高效…...
2026年4月:AI史上最疯狂的30天——从GPT-6到DeepSeek V4,大模型竞争进入“干活“时代
4月AI圈连发9款旗舰模型:GPT-6参数破5万亿,DeekSeek V4成本仅GPT的1/700 摘要: 2026年4月的大模型发布密度创历史之最。OpenAI连发GPT-6和GPT-5.5,Anthropic祭出Claude Opus 4.7,但最大的变数来自中国——DeepSeek V4以…...
face-api.js 实战指南:从零构建人脸识别应用的深度解析
face-api.js 实战指南:从零构建人脸识别应用的深度解析 【免费下载链接】face-api.js JavaScript API for face detection and face recognition in the browser and nodejs with tensorflow.js 项目地址: https://gitcode.com/gh_mirrors/fa/face-api.js 你…...
终极暗黑3按键助手:D3KeyHelper专业游戏自动化宏配置完全指南
终极暗黑3按键助手:D3KeyHelper专业游戏自动化宏配置完全指南 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper 你是否厌倦了在《暗黑破坏神…...
避坑指南:YOLOv8转ONNX时遇到‘silu算子不支持’报错?手把手教你修改PyTorch源码解决
YOLOv8模型转ONNX实战:解决silu算子不支持报错的深度优化方案 当我们将YOLOv8模型从PyTorch格式转换为ONNX时,经常会遇到一个令人头疼的错误:"Exporting the operator silu to ONNX opset version 12 is not supported"。这个错误…...
从Apollo自动驾驶代码出发:手把手教你实现C++版二阶巴特沃斯低通滤波器
从Apollo自动驾驶代码实战:C实现二阶巴特沃斯低通滤波器的工程指南 在自动驾驶系统的传感器数据处理中,高频噪声就像不请自来的访客——它们会干扰雷达测距的准确性、扭曲摄像头采集的图像细节,甚至导致控制算法做出错误决策。而二阶巴特沃斯…...
舵机控制避坑指南:PWM占空比算对了,为什么舵机还是抖得厉害?
舵机抖动问题全解析:从PWM信号到硬件设计的深度排错指南 当你按照手册精确计算了PWM占空比,连接线路也反复检查无误,但舵机依然像得了帕金森一样抖动不止——这种挫败感每个硬件开发者都深有体会。本文将从信号完整性、电源设计、机械结构三个…...
如何快速掌握Denoising Diffusion PyTorch:从理论到实践的完整指南
如何快速掌握Denoising Diffusion PyTorch:从理论到实践的完整指南 【免费下载链接】denoising-diffusion-pytorch Implementation of Denoising Diffusion Probabilistic Model in Pytorch 项目地址: https://gitcode.com/gh_mirrors/de/denoising-diffusion-pyt…...
如何用d2s-editor快速打造完美暗黑2存档:新手完整教程
如何用d2s-editor快速打造完美暗黑2存档:新手完整教程 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否厌倦了反复刷怪却始终无法获得心仪的装备?想要尝试新build却不想从头练级?d2s-edi…...
深入 Python 循环引用与垃圾回收:如何应对内存管理的挑战
深入 Python 循环引用与垃圾回收:如何应对内存管理的挑战 在 Python 中,内存管理是一个至关重要的主题,特别是在处理长时间运行的服务和大量数据时。内存泄漏和资源管理不当往往是导致服务性能下降或崩溃的根源之一。一个常见的内存问题就是 …...
