shell-awk文本处理工具
1、awk概述
[root@localhost~]# which awk
/usr/bin/awk[root@localhost~]# ll /usr/bin/awk
lrwxrwxrwx. 1 root root 4 6月 11 07:19 /usr/bin/awk -> gawk
2、awk工作原理
awk [options] 'BEGIN{ print "start" } ‘pattern{ commands }’ END{ print "end" }'BEGIN END 是 AWK 的关键字部,因此必须大写;这两个部分开始块和结束块是可选的

3、awk执行流程

4、命令格式
awk 选项 ' 模式或条件 { 操作 }' 文件 1 文件 2 ...awk -f 脚本文件 文件 1 文件 2 ..格式: awk 关键字 选项 命令部分 '{xxxx}' 文件名
5、内建变量

[root@localhost ~] #awk '{print}' #把输入内容再 打印一遍

[root@localhost ~] #awk '{print "hello"}' 输入任何内容都打印hello# 字符串需要添加双引号,单引号已被使用

[root@localhost ~] #awk '{print "hello"}' < /etc/passwd把/etc/passwd内容输出到awk,所有/etc/passwd内容显示成hello

[root@localhost ~] # cat /etc/passwd | head -10 > zz #把/etc/passwd前10行输入到zz[root@localhost ~] # awk '{print}' zz #打印文件zz[root@localhost ~] # awk '{print $1}' zz #以默认空格为分隔,打印zz第一列[root@localhost ~] # awk -F: '{print $1}' zz #以:为分隔,打印zz第一列



[root@localhost ~] # awk -F: '{print $5}' zz # 以:为分隔符,打印第五列

[root@localhost ~] # awk -Fx '{print $1}' /etc/passwd #以 x 为分隔符 ,打印第一列

[root@localhost ~] # awk '{print $1 $2}' zz[root@localhost ~] # awk '{print $1" "$2}' zz #双引号中间加一个空格,空格作用[root@localhost ~] # awk '{print $1,$2}' zz # 逗号有空格效果[root@localhost ~] # awk -F: '{print $1"\t"$2}' /etc/passwd #用制表符作为分隔符

[root@localhost ~] # awk -F[:/] '{print $9}' zz// 定义多个分隔符,只要看到其中一个都算作分隔符

6、内置变量
[root@localhost ~] # awk -F: '/root/{print $0}' zz // 打印包含 root 的整行内容

[root@localhost ~] # awk -F: '/root/{print $1}' zz // 打印包含 root 的行的第一列

[root@localhost ~] # awk -F: '/root/{print $1,$6}' zz // 打印包含 root 行的第1列和第6列

[root@localhost ~] # awk '/root/' /etc/passwd //输出包含root的行

[root@localhost ~] # awk -F[:/] '{print NF}' zz // 打印每一行的列数

[root@localhost ~] # awk '{print NR}' zz[root@localhost ~] # awk -F[:/] '{print NR}' zz //显示行号[root@localhost ~] # awk -F: '{print NR}' zz



[root@localhost ~] # awk -F: '{print NR,$0}' pass.txt //显示行号,并打印每一行

[root@localhost ~] # awk 'NR==2' zz //打印第二行 (不加 print 也一样,默认就是打印)[root@localhost ~] # awk 'NR==2{print}' /etc/passwd

[root@localhost ~] # awk 'NR==2{print $1}' /etc/passwd // 打印第二行的第一列

[root@localhost ~] # awk -F: '{print $NF}' /etc/passwd // 打印最后一列

[root@localhost ~] # awk 'END{print NR}' zz // 打印最后一行行号,相当于总行数

[root@localhost ~] # awk 'END{print $0}' zz // 打印文件最后一行

[root@localhost ~] # awk -F: '{print " 当前行有 "NF" 列 "}' zz[root@localhost ~] # awk -F: '{print " 第 "NR" 行有 "NF" 列 "}' zz // 第几行有几 列

[root@localhost ~] # ifconfig ens33 | awk '/netmask/{print " 本机的 ip 地址是 "$4}'打印 ifconfig ens33 包含 netmask 行 的第四列

[root@localhost ~] # ifconfig ens33 | awk '/RX p/{print $5" 字节 "}'打印 ifconfig ens33 包含 RX p 行 的第五列# 根分区的可用量

[root@localhost ~] # df -h | awk 'NR==2{print $4}'打印 df -h 第二行 第四列

7、BEGIN END 运算
[root@localhost ~] # awk 'BEGIN{x=10;print x}'// 如果不用引号 awk 就当作一个变量来输出了,所以不需要加$ 了10[root@localhost ~] # awk 'BEGIN{x=10;print x+1}'//BEGIN 在处理文件之前,所以后面不跟文件名也不影响11[root@localhost ~] # awk 'BEGIN{x=10;x++;print x}'11[root@localhost ~] # awk 'BEGIN{print x+1}'// 不指定初始值,初始值就为 0 ,如果是字符串,则默认为空1

[root@localhost ~] # awk 'BEGIN{print 2.5+3.5}' // 小数也可以运算6[root@localhost ~] # awk 'BEGIN{print 2-1}'1[root@localhost ~] # awk 'BEGIN{print 3*4}'12[root@localhost ~] # awk 'BEGIN{print 3**2}'9[root@localhost ~] # awk 'BEGIN{print 2^3}' //^ 和 ** 都是幂运算8[root@localhost ~] # awk 'BEGIN{print 1/2}'0 .5

[root@localhost ~] # awk -F: '/root/' /etc/passwd //包含 root 的行// 如果后面有具体打印多少列就没法省略print 了

8、模糊匹配(~、!~)
[root@localhost ~] # awk -F: '$1~/root/' zz #第一列包含 root 的行

[root@localhost ~] # awk -F: '$1~/ro/' zz #第一列包含 ro 的行// 模糊匹配,只要有 ro 就匹配上

[root@localhost ~] # awk -F: '$7!~/nologin$/{print $1,$7}' /etc/passwd第七列不包含以 nologin 结尾的行 ,并打印第一列第七列

9、数值与字符串的比较
[root@localhost ~] # awk 'NR==5{print}' zz[root@localhost ~] # awk 'NR==5' zz #打印第5行

[root@localhost ~] # awk 'NR<5' /etc/passwd #打印行号小于5的行

[root@localhost ~] # awk -F: '$3==0' /etc/passwd #打印第3列=0的行

[root@localhost ~] # awk -F: '$1=="root"' /etc/passwd #打印第1列=root的行

[root@localhost ~] # awk -F: '$3>=1000' /etc/passwd #打印带3列uid >= 1000的行uid >=1000 为普通用户

10、逻辑运算 (&& 、||)
[root@localhost ~] # awk -F: '$3<10 || $3>=1000' /etc/passwd 第3列小于10或大于等于1000[root@localhost ~] # awk -F: '$3>10 && $3<1000' /etc/passwd 第3列大于10而且小于1000

[root@localhost ~] # awk -F: 'NR>4 && NR<10' /etc/passwd 行号大于4小于10

打印 1-200 之间所有能被 7 整除并且包含数字 7 的整数数字[root@localhost ~] # seq 200 | awk '$1%7==0 && $1~/7/'

FS、OFS、NR、FNR、RS、ORS
FS:输入字段的分隔符
[root@localhost ~] # awk 'BEGIN{FS=":"}{print $1}' pass.txt以 :为分隔符,打印第一列

OFS:输出字段的分隔符
[root@localhost ~] # awk 'BEGIN{FS=":";OFS="---"}{print $1,$2}' pass.txt以:为分隔符,输出时以 --- 为分隔符 ,打印第1第2列

FNR:一个文件追加到另一个文件,行号不累计
[root@localhost ~] # awk '{print FNR,$0}' /etc/resolv.conf /etc/hosts把 /etc/hosts 追加到 /etc/resolv.conf ,打印行号和内容 FNR行号不追加

NR:一个文件追加到另一个文件,行号累计
[root@localhost ~] # awk '{print NR,$0}' /etc/resolv.conf /etc/hosts把 /etc/hosts 追加到 /etc/resolv.conf ,打印行号和内容 FNR行号追加

RS:一行内容按照分隔符分割 换行输出
[root@localhost ~] # awk 'BEGIN{RS=":"}{print $0}' /etc/passwd把一行内容以 :为分隔符 分割 ,换行输出

ORS:多行合并成一行输出

相关文章:

shell-awk文本处理工具
1、awk概述 AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。 它是专门为文本处理设计的编程语言,也是行处理软件,通常用于扫描、过滤、统计汇总工作 数据可以来自标准输入也可以是管道或文件 在 linux 上常用的是 gawk,awk …...

如何在测试中保护用户隐私!
在当今数据驱动的时代,用户隐私保护成为了企业和开发团队关注的焦点。在软件测试过程中,处理真实用户数据时保护隐私尤为重要。本文将介绍如何在测试中保护用户隐私,并提供具体的方案和实战演练。 用户隐私保护的重要性 用户隐私保护不仅是法…...

ARCGIS PRO DSK GraphicsLayer创建文本要素
一、判断GraphicsLayer层【地块注记】是否存在,如果不存在则新建、如果存在则删除所有要素 Dim GraphicsLayer pmap.GetLayersAsFlattenedList().OfType(Of ArcGIS.Desktop.Mapping.GraphicsLayer).FirstOrDefault() 获取当前map对象中的GetLayer图层 Await Queue…...

看板项目之vue代码分析
目录: Q1、vue项目怎么实现的输入localhost:8080就能自动跳到index页面Q2、组合饼状图如何实现Q3、vue项目如何实现环境的切换Q4、vue怎么实现vue里面去调用js文件里面的函数 Q1、vue项目怎么实现的输入localhost:8080就能自动跳到index页面 …...
lua 游戏架构 之 游戏 AI (七)ai_dead
定义一个名为ai_dead的类,继承自ai_base类。这个类用于处理游戏中AI在死亡状态下的行为逻辑。以下是对代码的具体解释: 1. **引入基类**: - 使用require函数引入ai_base类,作为基础类。 2. **定义ai_dead类**: …...

前端开发知识(一)-html
1.前端开发需掌握的内容: 2.前端开发的三剑客:html、css、javascript Vue可以简化JavaScpript流程。 Element(饿了么开发的) :前端组件库。 Ngix:前端服务器。 3.前端开发工具:vscode 1)按…...
身份证如何查验真伪?C#身份证二要素、三要素接口集成
身份证不仅是我们的身份证明,更是社会生活中的“通行证”,现在人们的衣食住行都离不开身份证。但对于提供服务的平台而言,如何对用户提供的身份信息进行真伪核验便成为了一大难题。别担心,今天小编为服务平台带来了身份证二要素、…...

C++ | Leetcode C++题解之第290题单词规律
题目: 题解: class Solution { public:bool wordPattern(string pattern, string str) {unordered_map<string, char> str2ch;unordered_map<char, string> ch2str;int m str.length();int i 0;for (auto ch : pattern) {if (i > m) {…...

Pytorch使用教学7-张量的广播
PyTorch中的张量具有和NumPy相同的广播特性,允许不同形状的张量之间进行计算。 广播的实质特性,其实是低维向量映射到高维之后,相同位置再进行相加。我们重点要学会的就是低维向量如何向高维向量进行映射。 相同形状的张量计算 虽然我们觉…...

生成式AI:对话系统(Chat)与自主代理(Agent)的和谐共舞
生成式AI:对话与行动的和谐共舞 我们正站在一个令人激动的时代门槛上——生成式AI技术飞速发展,带来了无限的可能性。一个关键问题浮现:AI的未来是对话系统(Chat)的天下,还是自主代理(Agent&am…...

唯众物联网(IOT)全功能综合实训教学解决方案
一、引言 在信息技术日新月异的今天,物联网(IoT)作为推动数字化转型的关键力量,其触角已延伸至我们生活的方方面面,深刻地重塑了工作模式、生活习惯乃至社会结构的每一个角落。面对这一前所未有的变革浪潮,…...

24证券从业考试报名『个人信息表』填写模板❗
24证券从业考试报名『个人信息表』填写模板❗ 1️⃣居住城市、通讯地址:写自己现居住的地址就可以。 2️⃣学历:需要注意的是学历填写的是考生已经取得的学历,在校大学生已经不具有报名资格,选择大专以上,或者是高中学…...

深度学习系列70:模型部署torchserve
1. 流程说明 ts文件夹下, 从launcher.py进入,执行jar文件。 入口为model_server.py的start()函数。内容包含: 读取args,创建pid文件 找到java,启动model-server.jar程序,同时读取log-config文件ÿ…...

算法日记day 20(中序后序遍历序列构造二叉树|最大、合并、搜索二叉树)
一、中序后序序列构造二叉树 题目: 给定两个整数数组 inorder 和 postorder ,其中 inorder 是二叉树的中序遍历, postorder 是同一棵树的后序遍历,请你构造并返回这颗 二叉树 。 示例 1: 输入:inorder [9,3,15,20,…...

【科研】# Taylor Francis 论文 LaTeX template模版 及 Word模版
【科研写论文】系列 文章目录 【科研写论文】系列前言一、Word 模板(附下载网址):二、LaTeX 版本方法1:直接网页端打开(附网址)方法2:直接下载到本地电脑上编辑下载地址说明及注意事项 前言 给…...
Linux网络配置及常见命令!
vim /etc/sysconfig/network-scripsts/ifcfg-ens33(图形界面配置网络) Xshell rz:上传(从Windows到Linux) sz:下载:(从Linux到Windows)(后接文件手工输入)…...

linux之shell脚本实战
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:Linux运维老纪的首页…...

文件上传漏洞(ctfshow web151-161)
Web151 F12修改源代码 exts后面png改为php 这样就可以上传php的文件了 Web152: 考点:后端不能单一校验 就是要传图片格式,抓个包传个png的图片 然后bp抓包修改php后缀解析 然后放包 Web153-web156 在php代码中可以使用“{}”代替“[]” …...

小猪佩奇.js
闲着没事 使用js 画一个小猪佩奇把 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</tit…...

人工智能AI合集:Ollama部署对话语言大模型-网页访问
目录 🍅点击这里查看所有博文 随着人工智能技术的飞速发展,AI已经不再是遥不可及的高科技概念,而是逐渐融入到我们的日常生活中。从智能手机的语音助手到家庭中的智能音箱,再到工业自动化和医疗诊断,AI的应用无处不在…...

调用支付宝接口响应40004 SYSTEM_ERROR问题排查
在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...
【位运算】消失的两个数字(hard)
消失的两个数字(hard) 题⽬描述:解法(位运算):Java 算法代码:更简便代码 题⽬链接:⾯试题 17.19. 消失的两个数字 题⽬描述: 给定⼀个数组,包含从 1 到 N 所有…...

对WWDC 2025 Keynote 内容的预测
借助我们以往对苹果公司发展路径的深入研究经验,以及大语言模型的分析能力,我们系统梳理了多年来苹果 WWDC 主题演讲的规律。在 WWDC 2025 即将揭幕之际,我们让 ChatGPT 对今年的 Keynote 内容进行了一个初步预测,聊作存档。等到明…...
反射获取方法和属性
Java反射获取方法 在Java中,反射(Reflection)是一种强大的机制,允许程序在运行时访问和操作类的内部属性和方法。通过反射,可以动态地创建对象、调用方法、改变属性值,这在很多Java框架中如Spring和Hiberna…...
三体问题详解
从物理学角度,三体问题之所以不稳定,是因为三个天体在万有引力作用下相互作用,形成一个非线性耦合系统。我们可以从牛顿经典力学出发,列出具体的运动方程,并说明为何这个系统本质上是混沌的,无法得到一般解…...

【Java_EE】Spring MVC
目录 Spring Web MVC 编辑注解 RestController RequestMapping RequestParam RequestParam RequestBody PathVariable RequestPart 参数传递 注意事项 编辑参数重命名 RequestParam 编辑编辑传递集合 RequestParam 传递JSON数据 编辑RequestBody …...

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)
目录 一、SQL注入 二、insert注入 三、报错型注入 四、updatexml函数 五、源码审计 六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段 本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关࿰…...
Caliper 配置文件解析:fisco-bcos.json
config.yaml 文件 config.yaml 是 Caliper 的主配置文件,通常包含以下内容: test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...
【WebSocket】SpringBoot项目中使用WebSocket
1. 导入坐标 如果springboot父工程没有加入websocket的起步依赖,添加它的坐标的时候需要带上版本号。 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dep…...

归并排序:分治思想的高效排序
目录 基本原理 流程图解 实现方法 递归实现 非递归实现 演示过程 时间复杂度 基本原理 归并排序(Merge Sort)是一种基于分治思想的排序算法,由约翰冯诺伊曼在1945年提出。其核心思想包括: 分割(Divide):将待排序数组递归地分成两个子…...