当前位置: 首页 > news >正文

Linux文本处理三剑客:awk(内置函数详解笔记)

Linux系统中,AWK 是一个非常强大的文本处理工具,它的内置函数使得对文本数据进行处理更加高效和便捷。

本文将介绍 AWK 内置函数的几种主要类型:

  • 算数函数
  • 字符串函数
  • 时间函数
  • 位操作函数
  • 其他常用函数

我们将使用一个示例文本文件来演示这些函数的用法,并提供详细的注释说明,继续分享。

基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)

1.算数函数

函数名功能参数示例输出
atan2(y,x)返回正切值 y/x 的角度值,角度以弧度为单位y, xatan2(10, -10) * 180 / PI135
cos(expr)返回 expr 的余弦值,输入参数以弧度为单位exprcos(60 * PI / 180.0)0.5
exp(expr)返回自然数 e 的 expr 次幂exprexp(5)148.413159
int(expr)返回数值 expr 的整数部分exprint(5.12345)5
log(expr)计算 expr 自然对数exprlog(5.5)1.704748
rand返回一个大于等于 0 小于 1 的随机数-rand()0.237788
sin(expr)返回角度 expr 的正弦值,角度以弧度为单位exprsin(30 * PI / 180)0.5
sqrt(expr)计算 expr 的平方根exprsqrt(1024.0)32
srand([expr])使用种子值生成随机数exprsrand(10)1417959587

注释:

  • 以上表格仅列出了 AWK 提供的内置算术函数。
  • 算术函数的参数必须是数值。
  • 算术函数的返回值是数值。
# 反正切函数
awk 'BEGIN {PI = 3.14159265x = -10y = 10result = atan2 (y,x) * 180 / PI;printf "对于 (x=%f, y=%f),反正切值为 %f 度\n", x, y, result
}'# 余弦函数
awk 'BEGIN {PI = 3.14159265param = 60result = cos(param * PI / 180.0);printf "%f 度的余弦值为 %f\n", param, result
}'# 自然指数函数
awk 'BEGIN {param = 5result = exp(param);printf "%f 的自然指数值为 %f\n", param, result
}'# 取整函数
awk 'BEGIN {param = 5.12345result = int(param)print "Truncated value =", result
}'# 自然对数函数
awk 'BEGIN {param = 5.5result = log (param)printf "log(%f) = %f\n", param, result
}'# 随机数函数
awk 'BEGIN {print "Random num1 =" , rand()print "Random num2 =" , rand()print "Random num3 =" , rand()
}'#正弦函数
awk 'BEGIN {PI = 3.14159265param = 30.0result = sin(param * PI /180)printf "The sine of %f degrees is %f.\n", param, result
}'# 平方根函数
awk 'BEGIN {param = 1024.0result = sqrt(param)printf "sqrt(%f) = %f\n", param, result
}'# 设置随机数种子
awk 'BEGIN {param = 10printf "srand() = %d\n", srand()printf "srand(%d) = %d\n", param, srand(param)
}'

2.字符串函数

函数名功能参数示例输出
asort(arr, [d [, how]])使用 GAWK 值比较的一般规则排序 arr 中的内容arr, d, howasort(arr)-
asorti(arr, [d [, how]])对数组的索引排序arr, d, howasorti(arr)-
gsub(regexp, replacement [, target])全局替换子串regexp, replacement, targetgsub("World", "Jerry", str)Hello, Jerry
index(str, sub)检测子串是否存在str, subindex(str, subs)5
length(str)返回字符串长度strlength(str)16
match(str, regex)搜索与正则表达式匹配的子串str, regexmatch(str, subs)5
split(str, arr, regex)分割字符串str, arr, regexsplit(str, arr, ",")One, Two, Three, Four
sprintf(format, expr-list)按指定格式构造字符串format, expr-listsprintf("%s", "Hello, World !!!")Hello, World !!!
strtonum(str)将字符串转换为数值strstrtonum("123")123
sub(regex, sub, string)执行一次子串替换regex, sub, stringsub("World", "Jerry", str)Hello, Jerry
substr(str, start, l)返回子串str, start, lsubstr(str, 1, 5)Hello
tolower(str)将所有大写字母转换为小写字母strtolower(str)hello, world !!!
toupper(str)将所有小写字母转换为大写字母strtoupper(str)HELLO, WORLD !!!

注释:

  • 以上表格仅列出了 AWK 提供的内置字符串函数。
  • 字符串函数的参数可以是字符串或变量。
  • 字符串函数的返回值是字符串。
# 按字母顺序排列数组元素
$ awk 'BEGIN {arr[0] = "Three"arr[1] = "One"arr[2] = "Two"print "排序前数组元素:"for (i in arr) {print arr[i]}asort(arr)print "排序后数组元素:"for (i in arr) {print arr[i]}
}'# 按索引顺序排列数组元素
awk 'BEGIN {arr["Two"] = 1arr["One"] = 2arr["Three"] = 3asorti(arr)print "排序后数组索引:"for (i in arr) {print arr[i]}
}'# 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strgsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 查找子串的位置
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = index(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 获取字符串长度
awk 'BEGIN {str = "Hello, World !!!"print "长度 = ", length(str)
}'# 使用正则表达式匹配子串
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = match(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 将字符串分割为数组
awk 'BEGIN {str = "One,Two,Three,Four"split(str, arr, ",")print "数组包含以下元素:"for (i in arr) {print arr[i]}
}'# 使用 sprintf() 格式化字符串
awk 'BEGIN {str = sprintf("%s", "Hello, World !!!")print str
}'# 将字符串转换为数字
awk 'BEGIN {print "Decimal num = " strtonum("123")print "Octal num = " strtonum("0123")print "Hexadecimal num = " strtonum("0x123")
}'# 使用 sub() 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 获取子字符串
awk 'BEGIN {str = "Hello, World !!!"subs = substr(str, 1, 5)print "Substring = " subs
}'# 小写转换
awk 'BEGIN {str = "HELLO, WORLD !!!"print "Lowercase string = " tolower(str)
}'# 大写转换
awk 'BEGIN {str = "hello, world !!!"print "Uppercase string = " toupper(str)
}'

3.时间函数

函数名功能参数示例输出
systime返回从 Epoch 以来到当前时间的秒数-systime()1418574432
mktime(datespec)将字符串转换为时间戳datespecmktime("2014 12 14 30 20 10")1418604610
strftime([format [, timestamp[, utc-flag]]])格式化时间戳format, timestamp, utc-flagstrftime("Time = %m/%d/%Y %H:%M:%S", systime())Time = 12/14/2014 22:08:42

注释:

  • 以上表格仅列出了 AWK 提供的内置时间函数。
  • 时间戳是一个数值,表示从 Epoch 以来经过的秒数。
  • Epoch 是 Unix 时间的起点,为 1970 年 1 月 1 日 00:00:00 UTC。
# 获取当前时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " systime()
}'
# 将字符串转换为时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
}'# 格式化时间戳
awk 'BEGIN {print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
}'# 打印当前星期几
awk 'BEGIN {print strftime("%A")
}'

4.位操作函数

函数名功能参数示例输出
and执行位与操作num1, num2and(10, 6)2
compl按位求补num1compl(10)9.0072E+15
lshift左移位操作num1, shiftlshift(10, 1)20
rshift向右移位操作num1, shiftrshift(10, 1)5
or按位或操作num1, num2or(10, 6)14
xor按位异或操作num1, num2xor(10, 6)12

注释:

  • 以上表格仅列出了 AWK 提供的内置位操作函数。
  • 位操作函数的参数必须是整数。
  • 位操作函数的返回值是整数。
# 位与操作
awk 'BEGIN {num1 = 10num2 = 6printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
}'# 按位求补
awk 'BEGIN {num1 = 10printf "compl(%d) = %d\n", num1, compl(num1)
}'# 左移位操作
awk 'BEGIN {num1 = 10printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
}'# 向右移位操作。
awk 'BEGIN {num1 = 10printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
}'# 按位或操作。
awk 'BEGIN {num1 = 10num2 = 6printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
}'# 按位异或操作
[jerry]$ awk 'BEGIN {num1 = 10num2 = 6printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
}'

5.其他常用函数

函数名功能参数示例输出
close(expr)关闭管道的文件exprclose(cmd, "to")-
delete从数组中删除元素数组索引delete arr[0]-
exit([expr])终止脚本执行exprexit 10-
fflush([output-expr])刷新打开文件或管道的缓冲区output-exprfflush()-
getline读入下一行-getline < file-
next停止处理当前记录,进入下一条记录的处理过程-if ($0 ~/Shyam/) next-
nextfile停止处理当前文件,从下一个文件第一个记录开始处理-if ($0 ~ /file1:str2/) nextfile-
return([expr])从用户自定义的函数中返回值exprreturn result-
system(cmd)执行特定的命令cmdsystem("date")0

释:

  • 以上表格仅列出了 AWK 提供的其它内置函数。
  • 每个函数的具体使用方法请参考 AWK 官方文档。
# 关闭管道
awk 'BEGIN {cmd = "tr [a-z] [A-Z]"print "hello, world !!!" |& cmdclose(cmd, "to")cmd |& getline outprint out;close(cmd);
}'# 从数组中删除元素
awk 'BEGIN {arr[0] = "One"arr[1] = "Two"arr[2] = "Three"arr[3] = "Four"print "删除前:"for (i in arr) {print arr[i]}delete arr[0]delete arr[1]print "删除后:"for (i in arr) {print arr[i]}
}'# 终止脚本执行
awk 'BEGIN {print "Hello, World !!!"exit 10print "AWK never executes this statement."
}'# 刷新打开文件或管道的缓冲区
fflush([output-expr])# 读入下一行
awk '{getline; print $0}' file.txt # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功;非 0 表示命令执行失败。
awk 'BEGIN { ret = system("date"); print "Return value = " ret }'

如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。

欢迎在评论区留言,关注。谢谢您的阅读!

敬请关注!

往期学习笔记:

Windows系统开启Linux子系统(Ubuntu)

Linux常用命令(目录操作命令)

Linux常用命令:文件的创建、复制、移动、查找和删除命令

Linux常用命令:文本文件的查看与编辑

Linux常用命令:文本文件的拼接与分割

Linux常用命令:文件的权限管理

Linux常用命令:文件的下载、压缩与解压

Linux常用命令:常见的操作符

Linux常用命令:系统操作命令
 

 Linux文本处理三剑客:grep

Linux文本处理三剑客:sed

Linux文本处理三剑客:awk

Linux文本处理三剑客:awk(常用匹配模式)

Linux文本处理三剑客:awk(结构化命令)

Linux文本处理三剑客:awk(对具体文本的示例代码)

相关文章:

Linux文本处理三剑客:awk(内置函数详解笔记)

Linux系统中&#xff0c;AWK 是一个非常强大的文本处理工具&#xff0c;它的内置函数使得对文本数据进行处理更加高效和便捷。 本文将介绍 AWK 内置函数的几种主要类型&#xff1a; 算数函数字符串函数时间函数位操作函数其他常用函数 我们将使用一个示例文本文件来演示这些函…...

C++调用lua函数

C 调用Lua全局变量(普通) lua_getglobal(lua, "width");int width lua_tointeger(lua,-1);lua_pop(lua,1);std::cout << width << std::endl;lua_close(lua); 这几行代码要放到lua_pcall(lua, 0,0,0);之后才可以. C给lua传递变量 lua_pushstring(lua, …...

java找工作之Mybatis(入门及xml配置相关)

Mybatis 学习Mybatis就要学会查看官网&#xff0c;官网地址如下&#xff1a;<MyBatis中文网 > 1、简介 1.1什么是Mybatis MyBatis 是一款优秀的持久层框架&#xff0c;它支持自定义 SQL、存储过程以及高级映射。MyBatis 免除了几乎所有的 JDBC 代码以及设置参数和获取…...

如何保证 HTTPS 证书的有效性?

随着互联网的蓬勃发展&#xff0c;保障用户在网络上的隐私和安全成为至关重要的任务。HTTPS证书&#xff0c;作为一种安全套接字层协议&#xff0c;扮演着网站安全的守护者。 1. 什么是HTTPS 证书&#xff1f; HTTPS&#xff08;HyperText Transfer Protocol Secure&#xff…...

Qt 简约美观的动画 摆钟风格 第十季

&#x1f60a; 今天给大家分享一个摆钟风格的加载动画 &#x1f60a; 效果如下: 最近工作忙起来了 , 后续再分享其他有趣的加载动画吧. 一共三个文件 , 可以直接编译运行 //main.cpp #include "LoadingAnimWidget.h" #include <QApplication> #include <Q…...

Vue 3 中的 Composition API 详解

Vue.js&#xff0c;作为前端领域流行的框架之一&#xff0c;以其响应式数据绑定和组件化开发赢得了广大开发者的喜爱。随着前端技术的不断发展和项目复杂度的增加&#xff0c;Vue 团队推出了 Vue 3&#xff0c;并引入了 Composition API&#xff0c;以更好地满足复杂应用的需求…...

利用Python爬取高德地图全国地铁站点信息

利用Python中的requests库进行地铁站点信息的获取,同时将数据保存在本机excel中 # 首先引入所需要的包 import requests from bs4 import BeautifulSoup import pandas as pd import json# 发送 GET 请求获取网页内容 url http://map.amap.com/subway/index.html response r…...

Vue 3 中的 Teleport 特性详解

引言 在 Vue 3 中&#xff0c;引入了一个名为 Teleport 的新特性。这个特性允许开发者将组件的子组件“传送”到 DOM 中的任意位置&#xff0c;而不仅仅是它们的直接父级内部。这一功能在处理如模态框、弹出菜单、提示框等需要从其原始位置在视觉上移动到其他地方的用户界面元…...

小白的matlab简单应用

基本概念 1、数组array 数组是一个更通用的数据结构&#xff0c;可以是一维、二维或多维的。 一维数组通常被称为向量。 二维数组可以被视为矩阵。 多维数组可以用来表示更高维度的数据&#xff0c;例如三维数组可以表示一系列的矩阵。 用过的函数 20240229 1、读取excel文件…...

边缘计算网关在机床生产中的应用-天拓四方

随着工业4.0的推进&#xff0c;物联网&#xff08;IoT&#xff09;技术在各个工业领域中的应用日益广泛。特别是在机床行业&#xff0c;物联网技术的引入不仅提高了生产效率&#xff0c;还实现了对机床设备的实时监控和远程维护。在这一背景下&#xff0c;边缘计算网关的角色愈…...

maven配置文件(一)Settings配置

一、仓库 1、关系 我们依赖的外部服务是需要有地方进行存储的&#xff0c;而存储的地方就称之为仓库。其中仓库又分为本地仓库、中央仓库、镜像仓库、私服。 &#xff08;1&#xff09;本地仓库 当项目在本地编译或运行时&#xff0c;直接加载本地的依赖服务无疑是最快的。默…...

选择何种操作系统作为网站服务器

选择操作系统时&#xff0c;需考虑稳定性、安全性、成本、兼容性和技术支持等因素&#xff0c;常见选项有Windows Server和Linux发行版。 选择网站服务器的操作系统是一个关键的决策&#xff0c;因为它将影响到网站的性能、稳定性、安全性以及未来的扩展性&#xff0c;目前市场…...

【LeetCode】升级打怪之路 Day 11:栈的应用、单调栈

今日题目&#xff1a; Problem 1: 栈的应用 155. 最小栈 | LeetCode20. 有效的括号 | LeetCode150. 逆波兰表达式求值 | LeetCode Problem 2: 单调栈 496. 下一个更大元素 I739. 每日温度503. 下一个更大元素 II 目录 Problem 1&#xff1a;栈 - “先进后出”的应用LC 155. 最…...

题目 1454: 蓝桥杯历届试题-蚂蚁感冒

题目描述: 长100厘米的细长直杆子上有n只蚂蚁。它们的头有的朝左&#xff0c;有的朝右。 每只蚂蚁都只能沿着杆子向前爬&#xff0c;速度是1厘米/秒。 当两只蚂蚁碰面时&#xff0c;它们会同时掉头往相反的方向爬行。 这些蚂蚁中&#xff0c;有1只蚂蚁感冒了。并且在和其它蚂蚁…...

WP外贸营销型网站模板

WordPress外贸独立站主题 简洁实用的WordPress外贸独立站主题&#xff0c;适合时尚服装行业搭建wordpress企业官网使用。 零件配件WordPress外贸建站模板 汽车行业零配件WordPress外贸建站模板&#xff0c;卖配件、零件的外贸公司可以使用的WordPress主题。 https://www.jia…...

Linux获取进程(系统启动时间和运行时间)运行时间

Linux获取进程运行时间 思路&#xff1a;使用 ps - o命令 ps -p 986 -o etime可以获取进程986的执行时间&#xff0c;不论系统时间有没有发生改变&#xff0c;它都可以返回正确的结果: 总结&#xff1a;etime 是真正的程序运行时间&#xff0c;而不是系统运行时间与进程启动…...

服务器内部错误的原因

服务器内部错误的原因 软件问题。服务器上运行的软件可能存在程序错误、内存泄漏、配置错误等&#xff0c;这些错误可能导致服务器崩溃、服务无法正常运行或响应时间过长 硬件故障。服务器的硬件组件&#xff08;如处理器、内存、硬盘等&#xff09;可能会因故障或损坏而无法正…...

不愧是华为的,太厉害了。。。

&#x1f345; 视频学习&#xff1a;文末有免费的配套视频可观看 &#x1f345; 关注公众号【互联网杂货铺】&#xff0c;回复 1 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 实习去了博彦科技&#xff08;外包&#xff09;&#xff0c;做的…...

贪心算法(区间问题)

452. 用最少数量的箭引爆气球 题目(求无重复区间) 有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points &#xff0c;其中points[i] [xstart, xend] 表示水平直径在 xstart 和 xend之间的气球。你不知道气球的确切 y 坐标。 一支弓箭可以沿着…...

【Javascript】设计模式之策略模式

文章目录 1、使用策略模式计算奖金2、JavaScript 版本的策略模式3、应用&#xff1a;表单验证3.1 用策略模式进行表单验证3.2 给某个文本输入框添加多种校验规则 4、策略模式的优缺点 策略模式的定义是&#xff1a;定义一系列的算法&#xff0c;把它们一个个封装起来&#xff0…...

Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以?

Golang 面试经典题&#xff1a;map 的 key 可以是什么类型&#xff1f;哪些不可以&#xff1f; 在 Golang 的面试中&#xff0c;map 类型的使用是一个常见的考点&#xff0c;其中对 key 类型的合法性 是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

linux 下常用变更-8

1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行&#xff0c;YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID&#xff1a; YW3…...

Linux-07 ubuntu 的 chrome 启动不了

文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了&#xff0c;报错如下四、启动不了&#xff0c;解决如下 总结 问题原因 在应用中可以看到chrome&#xff0c;但是打不开(说明&#xff1a;原来的ubuntu系统出问题了&#xff0c;这个是备用的硬盘&a…...

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

《C++ 模板》

目录 函数模板 类模板 非类型模板参数 模板特化 函数模板特化 类模板的特化 模板&#xff0c;就像一个模具&#xff0c;里面可以将不同类型的材料做成一个形状&#xff0c;其分为函数模板和类模板。 函数模板 函数模板可以简化函数重载的代码。格式&#xff1a;templa…...

return this;返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请&#xff0c;不同级别的经理有不同的审批权限&#xff1a; // 抽象处理者&#xff1a;审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

Leetcode33( 搜索旋转排序数组)

题目表述 整数数组 nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转&#xff0c;使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...

41道Django高频题整理(附答案背诵版)

解释一下 Django 和 Tornado 的关系&#xff1f; Django和Tornado都是Python的web框架&#xff0c;但它们的设计哲学和应用场景有所不同。 Django是一个高级的Python Web框架&#xff0c;鼓励快速开发和干净、实用的设计。它遵循MVC设计&#xff0c;并强调代码复用。Django有…...

python打卡day49@浙大疏锦行

知识点回顾&#xff1a; 通道注意力模块复习空间注意力模块CBAM的定义 作业&#xff1a;尝试对今天的模型检查参数数目&#xff0c;并用tensorboard查看训练过程 一、通道注意力模块复习 & CBAM实现 import torch import torch.nn as nnclass CBAM(nn.Module):def __init__…...