Linux命令更新-sort 和 uniq 命令
简介
sort
和 uniq
都是 Linux 系统中常用的文本处理命令。
-
sort
命令用于对文件内容进行排序。 -
uniq
命令用于去除文件中重复出现的行。
1. sort
命令
命令格式
sort [选项] [文件]
-
选项
: -
-n
: 按照数字进行排序 -
-r
: 反向排序 -
-c
: 统计每个元素出现的次数 -
-t 分隔符
: 指定分隔符,默认为空格 -
-k 列号
: 指定排序列,从左到右从 1 开始计数 -
-u
: 仅显示不重复的行
命令功能
sort
命令可以对文件内容进行排序,支持多种排序方式,包括:
-
按数字排序
-
按字符串排序
-
按自定义列排序
-
正序排序
-
反序排序
命令用法
1. 按数字排序
sort numbers.txt
例如,将文件 numbers.txt
中的内容按数字从小到大排序:
10
2
5
4
3
2. 按字符串排序
sort words.txt
例如,将文件 words.txt
中的内容按字母顺序排序:
apple
banana
cherry
grape
orange
3. 按自定义列排序
sort -k 3 students.txt
例如,将文件 students.txt
中的内容按第三列(成绩)从高到低排序:
张三,15,90
李四,18,80
王五,17,70
赵六,16,60
4. 正序排序
默认情况下,sort
命令会对文件内容进行正序排序。
sort numbers.txt
5. 反向排序
sort -r numbers.txt
例如,将文件 numbers.txt
中的内容按数字从大到小排序:
10
5
4
3
2
6. 统计每个元素出现的次数
sort -c words.txt
例如,统计文件 words.txt
中每个单词出现的次数:
2 apple
1 banana
1 cherry
2 grape
1 orange
7. 指定分隔符
sort -t : students.txt
例如,将文件 students.txt
中的内容按第一列(姓名)排序,并使用冒号作为分隔符:
张三:15:90
李四:18:80
王五:17:70
赵六:16:60
8. 仅显示不重复的行
sort -u words.txt
例如,显示文件 words.txt
中不重复的单词:
apple
banana
cherry
grape
orange
2. uniq
命令
命令格式
uniq [选项] [文件]
-
选项
: -
-c
: 统计每个元素出现的次数 -
-d
: 显示重复的行 -
-u
: 仅显示不重复的行
命令功能
uniq
命令用于去除文件中重复出现的行,支持多种操作,包括:
-
仅显示不重复的行
-
显示重复的行
-
统计每个元素出现的次数
命令用法
1. 仅显示不重复的行
uniq words.txt
例如,显示文件 words.txt
中不重复的单词:
apple
banana
cherry
grape
orange
2. 显示重复的行
uniq -d words.txt
例如,显示文件 words.txt
中重复出现的单词:
apple
banana
3. 统计每个元素出现的次数
uniq -c words.txt
例如,统计文件 words.txt
中每个单词出现的次数:
2 apple
1 banana
1 cherry
2 grape
1 orange
运维案例
案例一:统计网站日志中的访问次数
假设您需要统计网站日志文件 /var/log/nginx/access.log
中每个 IP 地址的访问次数。
步骤:
- 提取 IP 地址:
cat /var/log/nginx/access.log | awk '{print $1}' > ips.txt
- 排序并去除重复的 IP 地址:
sort -u ips.txt > unique_ips.txt
- 统计每个 IP 地址的访问次数:
for ip in $(cat unique_ips.txt); docount=$(grep -c "$ip" /var/log/nginx/access.log)echo "$ip $count"
done > ip_counts.txt
结果:
192.168.1.10 100
192.168.1.11 50
192.168.1.12 20
案例二:比较两个文件的差异并忽略空白行
假设您需要比较两个文件 /file1.txt
和 /file2.txt
的差异,并忽略空白行。
步骤:
- 删除两个文件中的空白行:
sed -i '/^ *$/d' file1.txt
sed -i '/^ *$/d' file2.txt
- 比较两个文件并忽略重复行:
comm -3 file1.txt file2.txt | grep -v '^$'
结果:
+ line1
- line2
案例三:从多个文件中提取唯一内容
假设您需要从多个文件(file1.txt
、file2.txt
、file3.txt
)中提取唯一内容。
步骤:
- 将多个文件的内容合并到一个文件中:
cat file1.txt file2.txt file3.txt > all_lines.txt
- 排序并去除重复行:
sort -u all_lines.txt > unique_lines.txt
结果:
line1
line2
line3
注意:
-
本文档仅介绍了
sort
和uniq
命令的基本使用方法和常见运维案例,并未涵盖所有功能和参数。 -
在使用
sort
和uniq
命令进行实际操作时,请注意备份文件,以免造成数据丢失。 -
可以根据实际需要组合使用
sort
和uniq
命令,实现更复杂的功能。
希望这份文档能够帮助您更好地了解和使用 sort
和 uniq
命令。
相关文章:
Linux命令更新-sort 和 uniq 命令
简介 sort 和 uniq 都是 Linux 系统中常用的文本处理命令。 sort 命令用于对文件内容进行排序。 uniq 命令用于去除文件中重复出现的行。 1. sort 命令 命令格式 sort [选项] [文件]选项: -n: 按照数字进行排序 -r: 反向排序 -c: 统计每个元素出现的次数 -…...
【密码学】密码学数学基础:剩余系
不得不啃的密码学数学基础之剩余系是个啥?数学里面有好多的定义都有前置的数学概念,要想弄懂剩余系还得先说说“同余”。 一、同余 那么“同余”有是个什么呢?在谈论“同余”之前,我们先圈定个讨论的范围。接下来讨论的都是整数集…...

量化发展历史简述,QMT/PTrade+恒生UFT、LDP极速柜台适用哪些情形?
量化发展简述 1.2004年萌发阶段:策略局限在量化择时,量化选股等; 光大保德信量化核 心基金 上投摩根阿尔法基 金 金融危机,海归引入。 2.2010量化元年:中低频交易为主,主要依靠套利、对冲、多因子策略等…...
linux服务器anaconda安装及环境变量配置
1.下载anaconda Index of /可以在此链接中下载所需要的anaconda安装文件。使用一下的命令进行下载: wget https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh2.安装anaconda 进入到下载的目录下,使用下面的的命令进行安装&#…...
如何在 Objective-C 中实现多态性,并且它与其他面向对象编程语言的多态性实现有何差异?
在Objective-C中,多态性可以通过使用父类的指针来调用子类的方法来实现。具体来说,可以定义一个父类的指针,然后将子类的实例赋值给这个指针。这样,即使使用父类的指针来调用方法,实际上会调用子类的方法。 需要注意的…...
阿里云OSS简单应用
前提条件 购买OSS标准存储包之后,就可以使用OSS的各种服务了 1 获取自己的OSS Endpoint OSS访问域名和数据中心_对象存储(OSS)-阿里云帮助中心 在官方的表格上找到自己OSS标准存储包对应的外网Endpoint即可 2 创建自己的阿里云Access Key ID 和 Access Key Secret …...

cleanshot Mac 上的截图工具
笔者闲来无事,最近在找一些mac上好用的工具其中一款就是cleanShot。为什么不用原有的mac自带的呢。因为相对来说编辑功能不算全面,不支持长截图。那有没有一款软件支持关于截图的好用工具呢。 所以笔者找了这款。安装包是直接安装就可使用的。请大家点赞…...

JMeter进行HTTP接口测试的技术要点
参数化 用户定义的变量 用的时候 ${名字} 用户参数 在参数列表中传递 并且也是${} csv数据文件设置 false 不忽略首行 要首行 从第一行读取 true 忽略首行 从第二行开始 请求时的参数设置: 这里的名称是看其接口需要的请求参数的名称 这里的变量名称就是为csv里面…...
基于智能算法的品牌视觉识别系统优化研究
基于智能算法的品牌视觉识别系统优化研究 一、引言 随着人工智能技术的快速发展,智能算法在各个领域的应用日益广泛。在品牌视觉识别系统中,智能算法同样发挥着重要作用。品牌视觉识别系统(Visual Identity System,简称VIS)是企业通过统一的视觉符号系统,将企业的理念、…...
递归锁与普通锁的区别
什么是锁? 在多线程编程中,锁是一种机制,用来确保某些代码块在同一时间只能被一个线程执行。想象一下,你和你的朋友们都想同时进入一个只有一把椅子的房间。为了避免混乱,你们需要一个锁来控制进入的顺序。 普通锁&a…...

FPGA上板项目(二)——PLL测试
目录 实验内容实验原理实验步骤实验结果 实验内容 将差分时钟信号转化为 192MHz 时钟信号作为输出。 实验原理 PLL,即锁相环,一种反馈控制电路,具有时钟倍频、分频、相位偏移和可编程占空比的功能。 实验步骤 添加 clocking wizard IP核&…...

C语言 | Leecode C语言题解之第229题多数元素II
题目: 题解: /*** Note: The returned array must be malloced, assume caller calls free().*//*假定 num1,num2 为出现次数大于 nums.length / 3 的两个数。(最多出现两个)遍历 nums, 若出现 num1、num2…...
mybatis-plus映射mysql的json类型的字段
一、对json里面内容建立实体类 Data AllArgsConstructor NoArgsConstructor public class RouteMetaEntity {private String title;private Boolean affix;private Boolean isAlwaysShow; }二、主类做映射 TableField(typeHandler JacksonTypeHandler.class)private RouteMe…...
20240716 Codeforces题目
A - Split the Multiset 题目 多集是一组数字,其中可以有相等的元素,数字的顺序无关紧要。例如, { 2 , 2 , 4 } \{2,2,4\} {2,2,4} 是一个multiset。 你有一个多集 S S S 。最初,multiset只包含一个正整数 n n n 。即 S {…...

29.【C语言】自定义函数
1、自定义详解 *提示:先看第12,19篇 例:写一个程序交换两个变量的值 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> void swap(int x, int y) {int z 0;z x;x y;y z; } int main() {int a 10;int b 20;swap(a, b);printf("%d…...
C++面向对象编程 基础篇(3)函数基础
3、函数基础 3.1 函数默认参数 在C中,函数的形参列表中的形参是可以有默认值的 注意事项: 如果某个位置已经有了默认参数,往后的形参都要有默认参数 函数声明和函数实现只能有一个有默认参数 示例: //如果自己传入参数&…...

excel有条件提取单元格特定文本(筛选纯文字的单元格或含有数字的单元格、单元格提取不同的文本长度)
实际工作背景 需要对导出的银行流水中的数十个村以及对应的村小组进行分组统计,但是初始的表格中村和小组是混在一起的,如下图所示: 目的:将大树村和大树村小组名称分别筛选出来 1.观察发现,大树村小组的单元格第4…...

HBase 在统一内容平台业务的优化实践
作者:来自 vivo 互联网服务器团队-Leng Jianyu、Huang Haitao HBase是一款开源高可靠性、扩展性、高性能和灵活性的分布式非关系型数据库,本文围绕数据库选型以及使用HBase的痛点展开,从四个方面对HBase的使用进行优化,取得了一些…...

【异常解决】Unable to start embedded Tomcat Nacos 启动报错
Unable to start embedded Tomcat Nacos 启动报错解决方案 一、背景描述二、原因分析三、解决方案 一、背景描述 Windows 本地启动 Nacos(2.2.0) 服务,控制台报错 Unable to start embedded Tomcat。 报错信息:Unable to start …...

【Java面向对象】对象和类
文章目录 1.为对象定义类2.定义类2.1 主类 3.类与对象3.1 构造方法3.2 通过引用变量访问对象3.3 访问对象的数据和方法3.4 引用数据域和 null 值3.5 基本类型变量和引用类型变量的区别 4.常见的类 1.为对象定义类 面向对象程序设计(OOP) 就是使用对象进行程序设计。对象 (obje…...

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)
题目:3442. 奇偶频次间的最大差值 I 思路 :哈希,时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况,哈希表这里用数组即可实现。 C版本: class Solution { public:int maxDifference(string s) {int a[26]…...

MPNet:旋转机械轻量化故障诊断模型详解python代码复现
目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...
synchronized 学习
学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...
Admin.Net中的消息通信SignalR解释
定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...

dedecms 织梦自定义表单留言增加ajax验证码功能
增加ajax功能模块,用户不点击提交按钮,只要输入框失去焦点,就会提前提示验证码是否正确。 一,模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...

DBAPI如何优雅的获取单条数据
API如何优雅的获取单条数据 案例一 对于查询类API,查询的是单条数据,比如根据主键ID查询用户信息,sql如下: select id, name, age from user where id #{id}API默认返回的数据格式是多条的,如下: {&qu…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...