Linux命令更新-sort 和 uniq 命令
简介
sort 和 uniq 都是 Linux 系统中常用的文本处理命令。
-
sort命令用于对文件内容进行排序。 -
uniq命令用于去除文件中重复出现的行。
1. sort 命令
命令格式
sort [选项] [文件]
-
选项: -
-n: 按照数字进行排序 -
-r: 反向排序 -
-c: 统计每个元素出现的次数 -
-t 分隔符: 指定分隔符,默认为空格 -
-k 列号: 指定排序列,从左到右从 1 开始计数 -
-u: 仅显示不重复的行
命令功能
sort 命令可以对文件内容进行排序,支持多种排序方式,包括:
-
按数字排序
-
按字符串排序
-
按自定义列排序
-
正序排序
-
反序排序
命令用法
1. 按数字排序
sort numbers.txt
例如,将文件 numbers.txt 中的内容按数字从小到大排序:
10
2
5
4
3
2. 按字符串排序
sort words.txt
例如,将文件 words.txt 中的内容按字母顺序排序:
apple
banana
cherry
grape
orange
3. 按自定义列排序
sort -k 3 students.txt
例如,将文件 students.txt 中的内容按第三列(成绩)从高到低排序:
张三,15,90
李四,18,80
王五,17,70
赵六,16,60
4. 正序排序
默认情况下,sort 命令会对文件内容进行正序排序。
sort numbers.txt
5. 反向排序
sort -r numbers.txt
例如,将文件 numbers.txt 中的内容按数字从大到小排序:
10
5
4
3
2
6. 统计每个元素出现的次数
sort -c words.txt
例如,统计文件 words.txt 中每个单词出现的次数:
2 apple
1 banana
1 cherry
2 grape
1 orange
7. 指定分隔符
sort -t : students.txt
例如,将文件 students.txt 中的内容按第一列(姓名)排序,并使用冒号作为分隔符:
张三:15:90
李四:18:80
王五:17:70
赵六:16:60
8. 仅显示不重复的行
sort -u words.txt
例如,显示文件 words.txt 中不重复的单词:
apple
banana
cherry
grape
orange
2. uniq 命令
命令格式
uniq [选项] [文件]
-
选项: -
-c: 统计每个元素出现的次数 -
-d: 显示重复的行 -
-u: 仅显示不重复的行
命令功能
uniq 命令用于去除文件中重复出现的行,支持多种操作,包括:
-
仅显示不重复的行
-
显示重复的行
-
统计每个元素出现的次数
命令用法
1. 仅显示不重复的行
uniq words.txt
例如,显示文件 words.txt 中不重复的单词:
apple
banana
cherry
grape
orange
2. 显示重复的行
uniq -d words.txt
例如,显示文件 words.txt 中重复出现的单词:
apple
banana
3. 统计每个元素出现的次数
uniq -c words.txt
例如,统计文件 words.txt 中每个单词出现的次数:
2 apple
1 banana
1 cherry
2 grape
1 orange
运维案例
案例一:统计网站日志中的访问次数
假设您需要统计网站日志文件 /var/log/nginx/access.log 中每个 IP 地址的访问次数。
步骤:
- 提取 IP 地址:
cat /var/log/nginx/access.log | awk '{print $1}' > ips.txt
- 排序并去除重复的 IP 地址:
sort -u ips.txt > unique_ips.txt
- 统计每个 IP 地址的访问次数:
for ip in $(cat unique_ips.txt); docount=$(grep -c "$ip" /var/log/nginx/access.log)echo "$ip $count"
done > ip_counts.txt
结果:
192.168.1.10 100
192.168.1.11 50
192.168.1.12 20
案例二:比较两个文件的差异并忽略空白行
假设您需要比较两个文件 /file1.txt 和 /file2.txt 的差异,并忽略空白行。
步骤:
- 删除两个文件中的空白行:
sed -i '/^ *$/d' file1.txt
sed -i '/^ *$/d' file2.txt
- 比较两个文件并忽略重复行:
comm -3 file1.txt file2.txt | grep -v '^$'
结果:
+ line1
- line2
案例三:从多个文件中提取唯一内容
假设您需要从多个文件(file1.txt、file2.txt、file3.txt)中提取唯一内容。
步骤:
- 将多个文件的内容合并到一个文件中:
cat file1.txt file2.txt file3.txt > all_lines.txt
- 排序并去除重复行:
sort -u all_lines.txt > unique_lines.txt
结果:
line1
line2
line3
注意:
-
本文档仅介绍了
sort和uniq命令的基本使用方法和常见运维案例,并未涵盖所有功能和参数。 -
在使用
sort和uniq命令进行实际操作时,请注意备份文件,以免造成数据丢失。 -
可以根据实际需要组合使用
sort和uniq命令,实现更复杂的功能。
希望这份文档能够帮助您更好地了解和使用 sort 和 uniq 命令。
相关文章:
Linux命令更新-sort 和 uniq 命令
简介 sort 和 uniq 都是 Linux 系统中常用的文本处理命令。 sort 命令用于对文件内容进行排序。 uniq 命令用于去除文件中重复出现的行。 1. sort 命令 命令格式 sort [选项] [文件]选项: -n: 按照数字进行排序 -r: 反向排序 -c: 统计每个元素出现的次数 -…...
【密码学】密码学数学基础:剩余系
不得不啃的密码学数学基础之剩余系是个啥?数学里面有好多的定义都有前置的数学概念,要想弄懂剩余系还得先说说“同余”。 一、同余 那么“同余”有是个什么呢?在谈论“同余”之前,我们先圈定个讨论的范围。接下来讨论的都是整数集…...
量化发展历史简述,QMT/PTrade+恒生UFT、LDP极速柜台适用哪些情形?
量化发展简述 1.2004年萌发阶段:策略局限在量化择时,量化选股等; 光大保德信量化核 心基金 上投摩根阿尔法基 金 金融危机,海归引入。 2.2010量化元年:中低频交易为主,主要依靠套利、对冲、多因子策略等…...
linux服务器anaconda安装及环境变量配置
1.下载anaconda Index of /可以在此链接中下载所需要的anaconda安装文件。使用一下的命令进行下载: wget https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh2.安装anaconda 进入到下载的目录下,使用下面的的命令进行安装&#…...
如何在 Objective-C 中实现多态性,并且它与其他面向对象编程语言的多态性实现有何差异?
在Objective-C中,多态性可以通过使用父类的指针来调用子类的方法来实现。具体来说,可以定义一个父类的指针,然后将子类的实例赋值给这个指针。这样,即使使用父类的指针来调用方法,实际上会调用子类的方法。 需要注意的…...
阿里云OSS简单应用
前提条件 购买OSS标准存储包之后,就可以使用OSS的各种服务了 1 获取自己的OSS Endpoint OSS访问域名和数据中心_对象存储(OSS)-阿里云帮助中心 在官方的表格上找到自己OSS标准存储包对应的外网Endpoint即可 2 创建自己的阿里云Access Key ID 和 Access Key Secret …...
cleanshot Mac 上的截图工具
笔者闲来无事,最近在找一些mac上好用的工具其中一款就是cleanShot。为什么不用原有的mac自带的呢。因为相对来说编辑功能不算全面,不支持长截图。那有没有一款软件支持关于截图的好用工具呢。 所以笔者找了这款。安装包是直接安装就可使用的。请大家点赞…...
JMeter进行HTTP接口测试的技术要点
参数化 用户定义的变量 用的时候 ${名字} 用户参数 在参数列表中传递 并且也是${} csv数据文件设置 false 不忽略首行 要首行 从第一行读取 true 忽略首行 从第二行开始 请求时的参数设置: 这里的名称是看其接口需要的请求参数的名称 这里的变量名称就是为csv里面…...
基于智能算法的品牌视觉识别系统优化研究
基于智能算法的品牌视觉识别系统优化研究 一、引言 随着人工智能技术的快速发展,智能算法在各个领域的应用日益广泛。在品牌视觉识别系统中,智能算法同样发挥着重要作用。品牌视觉识别系统(Visual Identity System,简称VIS)是企业通过统一的视觉符号系统,将企业的理念、…...
递归锁与普通锁的区别
什么是锁? 在多线程编程中,锁是一种机制,用来确保某些代码块在同一时间只能被一个线程执行。想象一下,你和你的朋友们都想同时进入一个只有一把椅子的房间。为了避免混乱,你们需要一个锁来控制进入的顺序。 普通锁&a…...
FPGA上板项目(二)——PLL测试
目录 实验内容实验原理实验步骤实验结果 实验内容 将差分时钟信号转化为 192MHz 时钟信号作为输出。 实验原理 PLL,即锁相环,一种反馈控制电路,具有时钟倍频、分频、相位偏移和可编程占空比的功能。 实验步骤 添加 clocking wizard IP核&…...
C语言 | Leecode C语言题解之第229题多数元素II
题目: 题解: /*** Note: The returned array must be malloced, assume caller calls free().*//*假定 num1,num2 为出现次数大于 nums.length / 3 的两个数。(最多出现两个)遍历 nums, 若出现 num1、num2…...
mybatis-plus映射mysql的json类型的字段
一、对json里面内容建立实体类 Data AllArgsConstructor NoArgsConstructor public class RouteMetaEntity {private String title;private Boolean affix;private Boolean isAlwaysShow; }二、主类做映射 TableField(typeHandler JacksonTypeHandler.class)private RouteMe…...
20240716 Codeforces题目
A - Split the Multiset 题目 多集是一组数字,其中可以有相等的元素,数字的顺序无关紧要。例如, { 2 , 2 , 4 } \{2,2,4\} {2,2,4} 是一个multiset。 你有一个多集 S S S 。最初,multiset只包含一个正整数 n n n 。即 S {…...
29.【C语言】自定义函数
1、自定义详解 *提示:先看第12,19篇 例:写一个程序交换两个变量的值 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> void swap(int x, int y) {int z 0;z x;x y;y z; } int main() {int a 10;int b 20;swap(a, b);printf("%d…...
C++面向对象编程 基础篇(3)函数基础
3、函数基础 3.1 函数默认参数 在C中,函数的形参列表中的形参是可以有默认值的 注意事项: 如果某个位置已经有了默认参数,往后的形参都要有默认参数 函数声明和函数实现只能有一个有默认参数 示例: //如果自己传入参数&…...
excel有条件提取单元格特定文本(筛选纯文字的单元格或含有数字的单元格、单元格提取不同的文本长度)
实际工作背景 需要对导出的银行流水中的数十个村以及对应的村小组进行分组统计,但是初始的表格中村和小组是混在一起的,如下图所示: 目的:将大树村和大树村小组名称分别筛选出来 1.观察发现,大树村小组的单元格第4…...
HBase 在统一内容平台业务的优化实践
作者:来自 vivo 互联网服务器团队-Leng Jianyu、Huang Haitao HBase是一款开源高可靠性、扩展性、高性能和灵活性的分布式非关系型数据库,本文围绕数据库选型以及使用HBase的痛点展开,从四个方面对HBase的使用进行优化,取得了一些…...
【异常解决】Unable to start embedded Tomcat Nacos 启动报错
Unable to start embedded Tomcat Nacos 启动报错解决方案 一、背景描述二、原因分析三、解决方案 一、背景描述 Windows 本地启动 Nacos(2.2.0) 服务,控制台报错 Unable to start embedded Tomcat。 报错信息:Unable to start …...
【Java面向对象】对象和类
文章目录 1.为对象定义类2.定义类2.1 主类 3.类与对象3.1 构造方法3.2 通过引用变量访问对象3.3 访问对象的数据和方法3.4 引用数据域和 null 值3.5 基本类型变量和引用类型变量的区别 4.常见的类 1.为对象定义类 面向对象程序设计(OOP) 就是使用对象进行程序设计。对象 (obje…...
基于PSOC62 CAPSENSE的远程空调遥控器:物联网与红外控制实践
1. 项目概述:当传统遥控器遇上物联网你有没有遇到过这样的场景:大夏天回到家,一身汗,还得在包里翻箱倒柜找空调遥控器;或者冬天窝在被窝里,发现遥控器在客厅茶几上,得鼓起勇气离开温暖的被窝去拿…...
五分钟完成Taotoken的Python SDK配置并调用多模型
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 五分钟完成Taotoken的Python SDK配置并调用多模型 基础教程类,面向刚注册Taotoken的Python开发者,指导其完…...
Taotoken用量看板如何帮助团队清晰掌握各模型消耗与成本分布
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken用量看板如何帮助团队清晰掌握各模型消耗与成本分布 对于项目管理者或团队负责人而言,在引入大模型能力后&…...
从靶场搭建到防御加固:一次Hydra爆破Win7 SMB的完整复盘与安全启示
从攻击到防御:SMB协议安全实战分析与加固指南 当一台运行Windows 7系统的计算机暴露在网络中时,它可能正在无声地发出安全警报。SMB协议作为Windows生态中广泛使用的文件共享服务,常常成为攻击者突破内网的第一道门户。本文将从一个真实的渗透…...
Claude 模型重度用户如何借助 Taotoken 规避官方额度限制并节省费用
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Claude 模型重度用户如何借助 Taotoken 规避官方额度限制并节省费用 1. 问题背景:Claude 重度用户的现实挑战 对于频繁…...
ElevenLabs云南话语音定制化指南(独家披露官方未公开的phoneme alignment bypass技巧)
更多请点击: https://codechina.net 第一章:ElevenLabs云南话语音定制化全景概览 ElevenLabs 作为全球领先的AI语音合成平台,原生支持英语、西班牙语、法语等数十种主流语言,但尚未在官方API中直接开放云南话(属西南…...
免ROOT使用Frida:Android合规调试的底层原理与四条落地路径
1. 这不是“越狱式”调试,而是一条被低估的合规路径 很多人一听到 Frida,第一反应就是“得先 root 手机”“得 patch apk”“得重打包签名”——仿佛不撬开系统大门,就进不了应用内存。我最初也这么想,直到在某次金融类 App 的灰…...
Chrome插件开发实战指南:从入门到发布的完整开发教程
随着浏览器生态不断发展,Chrome插件(Chrome Extension)已经成为提高工作效率、实现自动化操作、数据采集以及浏览器功能增强的重要工具。无论是广告拦截、网页翻译、SEO分析,还是自动化办公,背后几乎都离不开Chrome插件技术。 尤其是在AI时代,Chrome插件已经不仅仅是“浏…...
ConstraintLayout的‘隐藏技巧’:用百分比、比例和GoneMargin搞定复杂UI适配
ConstraintLayout高级适配技巧:百分比、比例与动态隐藏视图的完美解决方案 在Android开发中,ConstraintLayout已经成为构建复杂界面的首选布局方式。但许多开发者仅仅停留在基础使用层面,未能充分发挥其强大的适配能力。本文将深入探讨三个关…...
3分钟学会使用elan:告别Lean版本混乱的智能版本管理器
3分钟学会使用elan:告别Lean版本混乱的智能版本管理器 【免费下载链接】elan The Lean version manager 项目地址: https://gitcode.com/gh_mirrors/el/elan 还在为不同Lean项目需要不同版本而头疼吗?elan作为Lean定理证明器的智能版本管理器&…...
