当前位置: 首页 > news >正文

AWK语言

   一. awk

  awk:报告生成器,格式化输出。

  在 Linux/UNIX 系统中,awk 是一个功能强大的编辑工具,逐行读取输入文本,默认以空格或tab键作为分隔符作为分隔,并按模式或者条件执行编辑命令。而awk比较倾向于将一行分成多个字段,然后进行处理。

  AWK信息的读入也是逐行指定的匹配模式进行查找,对符合条件的内容进行格式化输出或者过滤处理,可以在无交互 的情况下实现相当复杂的文本操作,被广泛应用于 Shell 脚本,完成各种自动化配置任务。

  其中awk有多种版本:

  • AWK
  • NAWK
  • GAWK(目前使用)

  gawk、vim和awk的区别

    gawk:模式扫描和处理语言,可以实现下面功能

    vim:是将整个文件加载到内存中在加载到你的内存中,但这取决于你的内存文件是否能够容纳文本文件的大小。

    awk(语言):读取一行,处理一行

  工作模式:

    sed命令常用于一整行的处理,而awk比较倾向于一整行的分成多个字段处理,默认情况下字段的分隔符为空格或tab键。awk执行结果可以通过print的功能将字段数据打印出来。

  格式:awk [options]  'program' var=value  file…

  解释说明:

    program是被放在单引号中,通常由三个部分组成:

  • BEGIN语句块
  • 模式匹配的通用语句块
  • END语句块
常用选项功能
-F分隔符指明输入时用到的字符分隔符,默认的字符分隔符是若干个连续的空白符
-vvar=value变量赋值

  program格式:xxxxxxxxxx1 11 1pattern{action statements;..} 

    pattern:决定动作语句何时触发及触发事件。比如:BEGIN、END、正则表达式等

    action statements(行为语句):对数据进行处理 ,放在{}内指明。常见的是:print、printf

  • output statement(输出语句):print、printf
  • expressions(表达式):算术表达式、比较表达式等
  • compound statement(组合语句)
  • control statement(控制语句):if语句、for、while等
  • input statement(输入语句)

  执行过程

第一步:执行BEGIN{action;… }语句块中的语句
第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{ action;… }语句块,它逐行扫描文件,
从第一行到最后一行重复这个过程,直到文件全部被读取完毕。
第三步:当读至输入流末尾时,执行END{action;…}语句块

  解释:
    BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个可选的语句块,比如变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
    END语句块在awk从输入流中读取完所有的行之后即被执行,比如打印所有行的分析结果这类信息汇总都是在END语句块中完成,它也是一个可选语句块
    pattern语句块中的通用命令是最重要的部分,也是可选的。如果没有提供pattern语句块,则默认执行{ print },即打印每一个读取到的行,awk读取的每一行都会执行该语句块

  1.1 基本动作

    print动作

     1.2 BEGIN

    取出已用项--方法一

     取出已用项--方法二

    取出已用项--方法三

    BEGIN{}模式表示,在处理指定的文本前,需要先执行BEGIN模式中的指定动作; awk再处理指定的文本,之后再执行END模式中的指定动作,END{}语句中,一般会放入打印结果等语句。

  1.3 常见的内置变量

    格式:awk 选项 '模式{print }'

选项功能
FS指定每段的字段分隔符,缺省默认认为空格或制表符,与 “-F”作用相同 -v "FS=:"
OFS输出时的分隔符
NF当前处理的行的字段个数
NR当前处理的行的行数(序数)
$0当前处理的行的整个内容
$n当前处理行的第n个字段(第n列)
FILENAME被处理的文件名
RS行分隔符。awk从文件上读取资料时,将根据RS的定义就把资料切割成许多条记录,而awk一次仅读入一条记录进行处理

    FS

    支持变量

       -F和-FS一起使用,-F的优先级更高

    OFS

    RS

      默认是已 /n (换行符)为一条记录的分隔符

    FS

      代表字段的个数

       $NF代表最后一个字段 

       打印倒数第二列

      打印已用项

    NR

      行号

    FNR

    FILENAME

      显示处理文件名

  1.4 模式PATTERN

    格式:awk '模式{处理动作}'

    PATTERN:根据pattern条件,过滤匹配的行,再做处理

  1.4.1 模式为空

    如果模式为空表示每一行都匹配成功,相当于没有额外条件

  1.4.2 正则匹配

     /regular expression/:仅处理能够模式匹配到的行,需要用/ /括起来。举例:awk  '/^UUID/{print $1}'  /etc/fstab

  1.4.3 line range:行范围

    不支持使用行号,但是可以使用变量NR 间接指定行号加上比较操作符 或者逻辑关系

算术操作符
x+y, x-y, x*y, x/y, x^y, x%y
-x:转换为负数
+x:将字符串转换为数值
比较操作符:
==, !=, >, >=, <, <=


逻辑
与:&&,并且关系
或:||,或者关系
非:!,取反关系

  1.4.4 找到10:00到11:00之间的日志

awk '/10/,/11/'  文件名

sed -nr '/10/,/11/p'  文件名

  1.4.5 BEGIN END

    BEGIN{}:仅在开始处理文件中的文本之前执行一次

    END{}:仅在文本处理完成之后执行一次

  1.4.6 关系表达式

    关系表达式结果为“”才会被处理

    真:结果为非0值,非空字符串

    假:结果为空字符串或0值

  1.5 条件判断(扩展)

    格式:awk 选项 '模式 {actions}'

    条件判断写在 actions里

if(condition){statement;…}[else statement]
if(condition1){statement1}else if(condition2){statement2}else if(condition3){statement3}...... else {statementN}

condition1:条件
statement1:语句

if语句:awk的if语句也分为单分支、双分支和多分支
单分支为if(判断条件){执行语句}
双分支为if(判断条件){执行语句}else{执行语句}
多分支为if(判断条件){执行语句}else if(判断条件){执行语句}else if(判断条件){执行语句}else if(判断条件){执行语句} 

  1.6 for  | while

语法:

  for(expr1;expr2;expr3) {statement;…}
  for(variable assignment;condition;iteration process) {for-body}
  for(var in array) {for-body}

  1.7 数组(awk数组) 

    awk数组特性:

  • awk的数组是关联数组(即key/value方式的hash数据结构),索引下标可为数值(甚至是负数、小数等),也可为字符串
  1. 在内部,awk数组的索引全都是字符串,即使是数值索引在使用时内部也会转换成字符串
  2. awk的数组元素的顺序和元素插入时的顺序很可能是不相同的
  • awk数组支持数组的数组

  1.7.1 数组长度

    awk提供了 length() 函数来获取数组的元素个数,它也可以用于获取字符串的字符数量。还可以获取数值转换成字符串后的字符数量。

  1.7.2 遍历数组

    格式:for(var in array) {for-body}

  1.8 脚本

    将awk程序写成脚本,直接调用或执行

  1.9 彩蛋

    1.9.1.提出下面的IP地址和字段

awk
58.87.87.99 - - [09/Jun/2020:03:42:43 +0800] "POST /wp-cron.php?doing_wp_cron=1591645363.2316548824310302734375 HTTP/1.1" ""sendfileon
128.14.209.154 - - [09/Jun/2020:03:42:43 +0800] "GET / HTTP/1.1" ""sendfileon
64.90.40.100 - - [09/Jun/2020:03:43:11 +0800] "GET /wp-login.php HTTP/1.1"""sendfileo

64.90.40.100  09/Jun/2020:03:43:11

 解法1:cat test|sed -nr 's/(.*) - - \[(.*) \+.*/\1 \2/p'

 解法2:cat test|awk -F"[[]" '{print $1,$5}'

 解法3:cat test|awk -F"[[]+" '{print $1,$4}'

    1.9.2.提取host.txt主机名后再放回host.txt文件   >>

vim host.txt

1 www.kgc.com
2 mail.kgc.com
3 ftp.kgc.com
4 linux.kgc.com
5 blog.kgc.com

解法1:cat host.txt awk -F"[ .]" 'print $2' >>host.txt

解法2:cat host.txt | cut -d "." -f1|tr -d "[0-9 ]">>host.txt

解法3:cat host.txt | sed -nr 's/[0-9](.*)\.kgc\.com/\1/p'>>host.txt

    1.9.3.统计/etc/fstab文件中每个文件系统类型出现的次数

cat /etc/fstab | grep -v "^#"|grep -v "^$"|awk '{print $3}'  sort|uniq -c

    1.9.4.统计/etc/fstab文件中每个真单词出现的次数

解法1:cat /etc/fstab | grep -Eo "\b[a-zA-Z]+\b" |wc -l

解法2:cat /etc/fstab | grep -Eo "\b[[:alpha:]]\b" |wc -l

    1.9.5.提取出字符串Yd$C@M05MB%9&Bdh7dq+YVixp3vpw中的所有数字

echo "Yd$C@M05MB%9&Bdh7dq+YVixp3vpw" | grep -o [0-9]

    1.9.6.查出/tmp/的权限,以数字方式显示

stat /tmp|awk -F "[(/]" 'NR=4{print $2}'

    1.9.7.查出用户UID最大值的用户名、UID及shell类型

awk $3>1000{print $3,$1} /etc/passwd |sort -n |uniq -c

相关文章:

AWK语言

一. awk awk&#xff1a;报告生成器&#xff0c;格式化输出。 在 Linux/UNIX 系统中&#xff0c;awk 是一个功能强大的编辑工具&#xff0c;逐行读取输入文本&#xff0c;默认以空格或tab键作为分隔符作为分隔&#xff0c;并按模式或者条件执行编辑命令。而awk比较倾向于将一行…...

精通Nmap:网络扫描与安全的终极武器

一、引言 Nmap&#xff0c;即NetworkMapper&#xff0c;是一款开源的网络探测和安全审计工具。它能帮助您发现网络中的设备&#xff0c;并识别潜在的安全风险。在这个教程中&#xff0c;我们将一步步引导您如何有效地使用Nmap&#xff0c;让您的网络更加安全。 因为Nmap还有图…...

Java 学习和实践笔记(11)

三大神器&#xff1a; 官方网址: http://www.jetbrains.com/idea/ 官方网址: https://code.visualstudio.com/ 官方网址: http://www.eclipse.org 装好了idea社区版&#xff0c;并试运行以下代码&#xff0c;OK&#xff01; //TIP To <b>Run</b> code, press &l…...

开发实体类

开发实体类之间先在pom文件中加入该依赖 <!-- 开发实体类--><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><scope>provided</scope></dependency>我们在实体类中声明各个属…...

人工智能学习与实训笔记(十五):Scikit-learn库的基础与使用

人工智能专栏文章汇总&#xff1a;人工智能学习专栏文章汇总-CSDN博客 本篇目录 一、介绍 1. 1 Scikit-learn的发展历程及定义 1.2 理解算法包、算法库及算法框架之间的区别和联系 二、Scikit-learn官网结构 三、安装与设置 3.1 Python环境的安装与配置 3.2 Scikit-lea…...

插值与拟合算法介绍

在数据处理和科学计算领域,插值与拟合是两种极为重要的数据分析方法。它们被广泛应用于信号处理、图像处理、机器学习、金融分析等多个领域,对于理解和预测数据趋势具有至关重要的作用。本文将深入浅出地介绍这两种算法的基本原理,并结合C语言编程环境探讨如何在CSDN开发者社…...

下一代Windows系统曝光:基于GPT-4V,Agent跨应用调度,代号UFO

下一代Windows操作系统提前曝光了&#xff1f;&#xff1f; 微软首个为Windows而设的智能体&#xff08;Agent&#xff09; 亮相&#xff1a; 基于GPT-4V&#xff0c;一句话就可以在多个应用中无缝切换&#xff0c;完成复杂任务。整个过程无需人为干预&#xff0c;其执行成功…...

二.自定义头文件

一.Worker.h 1.1概述 - 类名&#xff1a;Worker - 继承关系&#xff1a;所有其他类&#xff08;Employee、Manager、Boss&#xff09;都继承自该抽象类 - 头文件保护&#xff1a;使用 pragma once 防止头文件重复包含 - 引入标准库&#xff1a;包含 <iostream> 和 <st…...

【AIGC】Stable Diffusion之模型微调工具

推荐一款好用的模型微调工具&#xff0c;cybertron furnace 是一个lora训练整合包&#xff0c;提供训练 lora 模型的工具集或环境。集成环境包括必要的依赖项和配置文件、预训练脚本&#xff0c;支持人物、二次元、画风、自定义lora的训练&#xff0c;以简化用户训练 lora 模型…...

探索未来科技前沿:深度学习的进展与应用

深度学习的进展 摘要&#xff1a;深度学习作为人工智能领域的重要分支&#xff0c;近年来取得了巨大的进展&#xff0c;并在各个领域展现出惊人的应用潜力。本文将介绍深度学习的发展历程、技术原理以及在图像识别、自然语言处理等领域的应用&#xff0c;展望深度学习在未来的…...

PTA | Wifi密码

下面是微博上流传的一张照片&#xff1a;“各位亲爱的同学们&#xff0c;鉴于大家有时需要使用 wifi&#xff0c;又怕耽误亲们的学习&#xff0c;现将 wifi 密码设置为下列数学题答案&#xff1a;A-1&#xff1b;B-2&#xff1b;C-3&#xff1b;D-4&#xff1b;请同学们自己作答…...

Linux中gdb使用说明书

首先我们要使用gdb&#xff0c;必须明白gdb使用范围&#xff1a; 要使用gdb调试&#xff0c;必须在源代码生成二进制程序的时候, 加上 -g 选项&#xff08;gcc/g) 其次&#xff0c;我们就要来学习gdb使用的一些命令了&#xff1a; list&#xff0f;l 行号&#xff1a;显…...

LInux——开发工具的使用

目录 Linux软件包管理器 yum rzsz Linux编辑器——vim vim的使用 vim的基本操作 命令模式的常见命令 底行模式的常见命令 vim是需要配置的 Linux编译器——gcc/g 预处理 编译 汇编 链接 函数库 Linux项目自动化构建工具 make/makefile make原理 项目清理 Linux调试器g…...

沁恒CH32V30X学习笔记03--64位systick

systick CH32F2x 系列产品Cortex-M3 内核自带了一个 24 位自减型计数器(SysTick timer)。支持 HCLK 或 HCLK/8 作为时基,具有较高优先级别(6)。一般可用于操作系统的时基。 CH32V3x 系列产品内核自带了一个 64 位加减计数器(SysTick),支持 HCLK 或者 HCLK/8 作为时基,…...

【JavaEE】IP协议

作者主页&#xff1a;paper jie_博客 本文作者&#xff1a;大家好&#xff0c;我是paper jie&#xff0c;感谢你阅读本文&#xff0c;欢迎一建三连哦。 本文于《JavaEE》专栏&#xff0c;本专栏是针对于大学生&#xff0c;编程小白精心打造的。笔者用重金(时间和精力)打造&…...

计算机网络-数据通信基础

目录 前言 一、数据通信基本概念 二、数据通信相关知识1 总结 前言 正在学习计算机网络体系&#xff0c;把每日所学的知识梳理出来&#xff0c;既能够当作读书笔记&#xff0c;又能分享出来和大家一同学习讨论。 一、数据通信基本概念 基本概念&#xff1a;信源、信道、信宿&…...

【lesson53】线程控制

文章目录 线程控制 线程控制 线程创建 代码&#xff1a; 运行代码&#xff1a; 强调一点&#xff0c;线程和进程不一样&#xff0c;进程有父进程的概念&#xff0c;但在线程组里面&#xff0c;所有的线程都是对等关系。 错误检查: 传统的一些函数是&#xff0c;成功返回0&…...

TypeScript(一):TypeScript基本理解

TypeScript基本理解 为什么使用TS JavaScript发展至今&#xff0c;没有进行数据类型的验证而我们知道&#xff0c;在编程阶段&#xff0c;错误发现的越早越好而TS就解决了JS的这个问题 认识TypeScript TypeScript是拥有类型的JavaScript超级&#xff0c;它可以编译成普通、…...

C语言—指针

碎碎念:做指针题的时候我仿佛回到了原点&#xff0c;总觉得目的是为了把框架搭建起来&#xff0c;我胡说的哈31 1.利用指针变量将一个数组中的数据反向输出。 /*1.利用指针变量将一个数组中的数据反向输出。*/#include <stdio.h> #include <time.h> #include <…...

c++作业

Shell中的函数&#xff08;先调用后使用的原则&#xff09;&#xff08;没有申明&#xff09; &#xff08;Function&#xff09; 函数名&#xff08;有没有参数根据调用格式&#xff09;&#xff08;不能写任何内容&#xff09; { 函数体 Return 返回值 } 函数名 ----》…...

【NotebookLM新闻传播研究权威指南】:20年传媒技术专家亲授AI驱动的新闻生产新范式

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;NotebookLM新闻传播研究导论 NotebookLM 是 Google 推出的基于大型语言模型的实验性研究助手&#xff0c;专为信息整合、溯源验证与知识重构设计。其核心能力在于对用户上传的文档&#xff08;PDF、TXT、网页…...

粉笔事业单位适合备考资格复审后面试吗?从材料确认、题型训练到岗位表达的评测

更新日期&#xff1a;2026年5月 很多事业单位考生在进入资格复审后&#xff0c;会搜索“粉笔事业单位怎么样”“粉笔事业单位面试适合资格复审后准备吗”“事业单位资格复审后怎么准备面试”。这些问题背后&#xff0c;真正关心的是&#xff1a;资格复审通过后距离面试通常不远…...

别再一行行读DXF了!用C#和netDxf库5分钟搞定CAD数据提取(附完整代码)

用C#和netDxf库高效解析DXF文件的实战指南 在CAD数据处理领域&#xff0c;DXF文件解析一直是开发者面临的常见挑战。传统的手动解析方法不仅耗时费力&#xff0c;还容易出错。本文将带你探索如何利用C#和netDxf库快速实现DXF文件的高效解析&#xff0c;彻底告别逐行读取的原始方…...

个人收款新选择:主流免签支付平台深度评测与避坑指南

1. 个人收款困境与免签支付崛起 做个人站长最头疼的问题是什么&#xff1f;十有八九会提到收款难。我做了5年独立博客&#xff0c;早期靠爱发电&#xff0c;后来想接点广告、卖点电子书&#xff0c;结果发现微信支付和支付宝压根不向个人开放支付接口。去年我的Python教程被疯传…...

3步掌握SMUDebugTool:AMD Ryzen处理器调试完全指南

3步掌握SMUDebugTool&#xff1a;AMD Ryzen处理器调试完全指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitco…...

基于MCP协议实现AI安全访问MongoDB:架构、部署与安全实践

1. 项目概述与核心价值最近在折腾AI应用开发&#xff0c;特别是想让大语言模型&#xff08;LLM&#xff09;能直接操作数据库&#xff0c;比如MongoDB。这听起来很酷&#xff0c;对吧&#xff1f;想象一下&#xff0c;你直接告诉AI助手“帮我查一下上个月销量最高的产品”&…...

ViGEmBus:终极Windows游戏控制器模拟解决方案,彻底改变游戏输入体验

ViGEmBus&#xff1a;终极Windows游戏控制器模拟解决方案&#xff0c;彻底改变游戏输入体验 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 在游戏开发和输入…...

基于电阻分压网络的传感器复用与蓝牙报警系统设计

1. 项目概述 在物联网和智能家居领域&#xff0c;报警系统是一个经典且实用的入门项目。它不仅是学习嵌入式开发的绝佳起点&#xff0c;更能直接解决现实生活中的安防需求。市面上成熟的商业报警系统往往价格不菲且功能固化&#xff0c;而基于开源硬件和软件的自制方案&#xf…...

第一章 微信小程序概述与开发准备

第一章 微信小程序概述与开发准备 &#x1f4da; 系列教程&#xff1a;微信小程序投票系统完整开发 &#x1f517; 上一章&#xff1a;无 &#x1f517; 下一章&#xff1a;第二章 - 小程序目录结构与核心文件详解 1.1 什么是微信小程序 微信小程序&#xff08;Mini Program&a…...

Citra 3DS模拟器:在电脑上重温任天堂掌机经典的完整指南 [特殊字符]

Citra 3DS模拟器&#xff1a;在电脑上重温任天堂掌机经典的完整指南 &#x1f3ae; 【免费下载链接】citra A Nintendo 3DS Emulator 项目地址: https://gitcode.com/GitHub_Trending/ci/citra 想要在Windows、macOS或Linux电脑上体验《精灵宝可梦XY》、《塞尔达传说&am…...