当前位置: 首页 > news >正文

grep命令——在文件中搜索指定的文本模式

grep是英文词组“global search regular expression and print out the line”的缩写,意思是全局搜索正则表达式,并将结果输出。

通常将grep命令与正则表达式搭配使用,命令选项作为搜索过程中的补充或对输出结果的筛选,命令模式十分灵活,功能非常强大。

如果想要搜索包含某一文本模式的文件,可以使用 grep 命令。通过使用该命令,可以搜索单个文件或者递归搜索整个目录结构。

当搜索时,可以在屏幕上打印输出满足条件的行,也可以仅列出包含搜索词的文件名。

默认情况下,grep 以区分大小写的方式搜索文本,也可以设置不区分大小写。

除了搜索文件外,还可以使用 grep 命令搜索标准输出。即如果某一命令输出了许多文本,现需要从中找到包含特定文本的行,也可使用grep进行过滤。

grep命令的语法格式如下:

grep [选项] 文本模式 文件

常用选项如下:

选项作用或含义
-i 忽略大小写
-c只输出匹配行的数量
-l只列出符合匹配的文件名,不列出具体的匹配行
-n列出所有的匹配行,显示行号
-h查询多文件时不显示文件名 
-s不显示不存在、没有匹配文本的错误信息
-v显示不包含匹配文本的所有行
-w匹配整词
-x匹配整行
-r递归搜索
-q禁止输出任何结果,已退出状态表示搜索是否成功 
-b打印匹配行距文件头部的偏移量,以字节为单位
-o与-b结合使用,打印匹配的词距文件头部的偏移量,以字节为单位 
-F匹配固定字符串的内容
-E支持扩展的正则表达式

实例演示:

1、在指定文件中搜索某个文本模式,输出包含了该文本模式的行

# 文本模式有空格时,建议用引号括起来,默认区分大小写
[root@myEuler ~]# grep 'desktop' /etc/services 
desktop-dna     2763/tcp                # Desktop DNA
desktop-dna     2763/udp                # Desktop DNA# 不区分大小写
[root@myEuler ~]# grep -i 'desktop' /etc/services 
sco-dtmgr       617/tcp                 # SCO Desktop Administration Server
sco-dtmgr       617/udp                 # SCO Desktop Administration Server
……此处省略部分输出……

2、在指定的多个文件中搜索

# 在多个文件中找出以root开头的行
[root@myEuler ~]# grep ^root /etc/passwd /etc/group
/etc/passwd:root:x:0:0:root:/root:/bin/bash
/etc/group:root:x:0:# 在多个文件中找出以root开头的行,不显示文件名
[root@myEuler ~]# grep -h ^root /etc/passwd /etc/group
root:x:0:0:root:/root:/bin/bash
root:x:0:# 在多个文件中查找,输出符合条件的行及其行号
[root@myEuler ~]# grep -hn ^nobody /etc/passwd /etc/group
13:nobody:x:65534:65534:Kernel Overflow User:/:/sbin/nologin
24:nobody:x:65534:

3、反向匹配,即找出不包含指定文本模式的行

#输出所有不包含nologin的行
[root@myEuler ~]# grep -v nologin /etc/passwd
root:x:0:0:root:/root:/bin/bash
sync:x:5:0:sync:/sbin:/bin/sync
……此处省略部分输出……

4、整词/整行匹配

#查找整行内容为lang zh_CN.UTF-8的行
[root@myEuler ~]# grep -x 'lang zh_CN.UTF-8' anaconda-ks.cfg 
lang zh_CN.UTF-8#找出文本行中包含单词graphical的行
[root@myEuler ~]# grep -w graphical anaconda-ks.cfg 
# Use graphical install
graphical

5、递归搜索,不仅搜索指定目录,还搜索其内子目录内是否有包含指定文本模式的文件

[root@myEuler ~]# grep -lsr 'openEuler 22.03' /etc 
/etc/os-release

6、从命令输出信息中查找

grep也可以从命令输出信息中查找特定文本,只是通常需要配合管道线,示例如下:

# 从cat命令的执行结果中查找特定文本graphical
[root@myEuler ~]# cat anaconda-ks.cfg | grep graphical
# Use graphical install
graphical# 从网络连接中筛查出sshd进程连接
[root@myEuler ~]# netstat -antlp | grep sshd

7、利用正则表达式搜索特定文本模式

正则表达式包括基础正则表达式和扩展正则表达式。前面的以root开头的头(^root)就是一种基础正则表达式。

(1)基础正则表达式

常用的基础正则表达式如下:

正则表达式

含义

*

*号前面的一个字符重复0到任意多次,如a*表示有0或多个a

.

表示此处一定有一个且仅有一个任意字符

[]

与通配符相同,表示方括号中的单个字符,如[0-9]表示单个数字

^str

以str开头的行,如^start表示以start开头的行

str$

以str结尾的行,如end$表示以end结尾的行

^$

开头与结尾间无内容,也就是空行

[[:alpha:]]

代表任意字母,包括大小写

[[:alnum:]]

代表任意字母和数字,包括大小写

[[:digit:]]

代表任意数字,即0~9

[[:lower:]]

代表任意小写字母

[[:upper:]]

代表任意大写字母

[[:blank:]]

代表任意空格或制表符Tab

[[:print:]]

代表任意可打印的字符

[[:punct:]]

代表标点符号 

# 打印出所有以小写字母开头的行
[root@myEuler ~]# grep ^[[:lower:]] anaconda-ks.cfg
graphical
keyboard --vckeymap=cn --xlayouts='cn'
……此处省略部分输出……# 打印出所有非空行
[root@myEuler ~]# grep -v ^$ anaconda-ks.cfg 
# Generated by Anaconda 36.16.5
# Generated by pykickstart v3.34
……此处省略部分输出……

(2)扩展正则表达式

正则表达式

含义

?

?号前面的一个字符重复0次或1次,如a?表示有0或1个a

+

+号前面的一个字符至少重复1次,如a+表示有1个a或多个a

|

表示|两侧的字符串是或者的关系,如dog|cat,坚线两侧无空格

()

表示括号内的字符串是一个组,如(c|b)a(b|t)表示cab、cat、bab、bat

\{n,m\}

将前面的一个字符重复n到m次,\{n\}表示n次,\{n,\}表示n次以上

#查看cron或rsyslog进程状态
[root@myEuler ~]# ps aux | grep -E '(cron|rsyslog)'
root        1831  0.0  0.0 164368  9880 ?        Ssl  3月07   0:04 /usr/sbin/rsyslogd -n -i/var/run/rsyslogd.pid
root        1858  0.0  0.0  23240  2736 ?        Ss   3月07   0:00 /usr/sbin/crond -n
root      338425  0.0  0.0  21672  1944 pts/0    S+   09:21   0:00 grep --color=auto -E (cron|rsyslog)

 下面再举几个关于扩展正则表达式的例子,以帮助理解。

现假定file1的文件内容如下。

[root@myEuler ~]# cat file1 
gg
go
gog
google
gooogle
gooooogle
# 找出包含文本模式go?g的行,其中的字母o至多出现一次
[root@myEuler ~]# grep -E 'go?g' file1
gg
gog# 找出包含文本模式go+g的行,其中的字母o至少出现一次
[root@myEuler ~]# grep -E 'go+g' file1 
gog
google
gooogle
gooooogle# 找出包含文本模式gog或者ggg的行
[root@myEuler ~]# grep -E 'g(o|g)g' file1 
gog# 找出包含文本模式go{2,5}g的行,其中的字母o可出现2到5次,其中的{}需转义
[root@myEuler ~]# grep -E go\{2,5\}g file1 
google
gooogle
gooooogle

相关文章:

grep命令——在文件中搜索指定的文本模式

grep是英文词组“global search regular expression and print out the line”的缩写,意思是全局搜索正则表达式,并将结果输出。 通常将grep命令与正则表达式搭配使用,命令选项作为搜索过程中的补充或对输出结果的筛选,命令模式十…...

数据结构刷题(二十二):90子集II、491递增子序列、46全排列

1.子集II题目链接思路:这是一道标准的组合问题数组排序去重。依然是使用回溯。注意:去重代码只需要判断同一树层上是否有重复,同组合总和II(https://blog.csdn.net/xiaomingming99/article/details/129396344)解法&…...

AI+人类,实现高效网络安全

导语 聊天机器人和生成式人工智能(如 ChatGPT)突然成为主流让很多人感到担忧。很多人开始担忧,人工智能取代人的时代已经到来。 幸运的是,事实并非如此。 更有可能的情况是,人类将与 AI 合作创建工作角色的混合模型。…...

牛客小白月赛68【A-E】

文章目录A.Tokitsukaze and New Operation【模拟】B.Tokitsukaze and Order Food Delivery【模拟、特判】C.Tokitsukaze and Average of Substring【暴力、前缀】D.Tokitsukaze and Development Task【记忆化搜索】E.Tokitsukaze and Colorful Chessboard【预处理,二…...

WIFI P2P架构

WI-FI P2P定义架构3个组件组织结构技术标准P2P DiscoveryDevice Discovery(扫描)流程p2p probe 管理帧Group Formation(组网)GO Negotiation(GON)流程P2P Public Action管理帧Provision Discovery&#xff…...

架构师之中台思维_系统发展之路_结果和抽象之间平衡的艺术

父文章 如何成为一名架构师,架构师成长之路_golang架构师成长之路_个人渣记录仅为自己搜索用的博客-CSDN博客 任何系统的发展都是如此. 1. 业务增长 2. 烟囱增长 _ 结果优先 _ 太快去抽象抽象不好 3. 太多的烟囱, 3.1 抽象复用为平台 3.2 面对更多新的业务,提供不同的枚举值…...

23届非科班选手秋招转码指南

1.秋招情况介绍 1.1自我介绍 我是一名23届非科班转码选手,本硕均就读于某211院校机械专业,秋招共计拿下12份offer,包括大疆创新、海康威视、联发科技、理想汽车、中电28、阳光电源等各行业、各种性质企业的意向。主要的投递岗位为嵌入式软件…...

《传感器技术》考试学习笔记

文章目录一、选择题二、简答题1.什么是传感器?传感器的共性是哪些?2.差动变气隙式传感器电感传感器的灵敏度推导过程是什么(推导公式)?与单极性进行比较它们的优缺点是哪些?3.霍尔传感器如何进行微位移测量…...

第十五章 opengl之高级OpenGL(模板测试)

OpenGL模板测试模板函数物体轮廓模板测试 当片段着色器处理完一个片段后,模板测试就会开始执行。类似于深度测试,模板测试也可能会丢弃片段。被保留的片段会进入深度测试,可能会丢弃更多的片段。 模板测试是根据模板缓冲来进行的。一个模板缓…...

【C语言蓝桥杯每日一题】—— 单词分析

【C语言蓝桥杯每日一题】—— 单词分析😎前言🙌单词分析🙌总结撒花💞😎博客昵称:博客小梦 😊最喜欢的座右铭:全神贯注的上吧!!! 😊作者…...

Web2:Tomcat

二.Web2:Tomcat 1.Tomcat的配置 2.Tomcat的工作方式 3.Tomcat服务器的虚拟映射 4.Tomcat部署到IDEA中使用 二.Web2:Tomcat 1.Tomcat的配置 ①安装下载Tomcat 配置好JAVA_HOME启动时保证端口号8080不被占用 ②下载后的目录结构 bin 启动或关闭to…...

C++语法规则2(C++面向对象)

继承 面向对象程序设计中最重要的一个概念是继承。继承允许我们依据另一个类来定义一个类,这使得创建和维护一个应用程序变得更容易。这样做,也达到了重用代码功能和提高执行效率的效果。 当创建一个类时,您不需要重新编写新的数据成员和成…...

第八批国家药品集中采购-(附药品集采目录明细下载)

2023年3月2日,‘国家组织药品联合采购办公室’发出了《全国药品集中采购文件》,宣告了第八批国家组织药品集中采购工作正式开展,其公告中还包含三个附表分别为‘采购品种目录’、‘各地区首年约定采购量’、‘各采购品种首年约定采购量’&…...

政府工作报告连提9年科技创新 企业研发如何“又快又好”

今年的政府工作报告, “科技创新” 这一描述连续出现7次,这也是自2015年开始, “科技创新” 这一概念在全国“两会”政府工作报告中连续九年被提到。政府工作报告指出,科技政策要聚焦自立自强,完善新型举国体制&#x…...

GM8773C 是一款 1:2 DSI 桥接芯片,可实现 4 路进 8 路出转换器功能、视频分离器功能。

GM8773C 是一款 1:2 DSI 桥接芯片,可实现 4 路进 8 路出转换器功能、视频分离器功能。芯片内集成了一个 4 路单一链路的 MIPI DSI 接收器和 8 路双链路 MIPI DSI 发送器。 接 收 器 每 路 可 以 支 持 到 2.0Gbps/lane , 可 以 最 高 支 持 到…...

Java常用包名和说明

包名主要功能java.applet提供了创建applet需要的所有类java.awt.*提供了创建用户界面以及绘制和管理图形、图像的类java.beans.*提供了开发Java Beans需要的所有类java.io提供了通过数据流、对象序列以及文件系统实现的系统输入、输出java.lang.*Java编程语言的基本类库java.ma…...

dva01-初识

背景 React 本身只是一个 DOM 的抽象层,使用组件构建虚拟 DOM。如果开发大应用,还需要解决一个问题。 通信:React 只提供了一种传参手段,后续数据变化非常麻烦,无法适用于大应用。数据流:每次要更新数据&…...

信捷 XDH Ethercat A_WRITE指令

本指令修改指令轴的当前位置。 什么时候需要用本指令呢?换句话说,用本指令后,坐标原点修改了偏移了。如果在回原点后,往前走了一段距离x,如果是用绝对模式执行把位置修改成0,那么下一次开始每次做绝对运动A_MOVEA&…...

Spring Cloud ( Eureka集群的搭建 )

操作步骤: 添加主机映射创建Eureka服务 导入依赖编写启动类编写yml复制服务实例测试一、添加主机映射 以 Windows系统为例,如果要构建集群,需要修改 hosts 文件,为其添加主机名的映射。 打开C:\Windows\System32\drivers\etc\h…...

Python re 模块

正则表达式是一种小型、高度专业化的编程语言。适用于任何语言,在 Python 中通过 re 模块实现。正则模式被编译成一系列的字节码,然后由 C 语言编写的匹配引擎执行。给字符串模糊匹配 正则用于匹配字符串,匹配字符串可以完全匹配和模糊匹配&…...

为什么92%的候选人栽在FastAPI流式响应题上?——基于137份大厂AI后端面试记录的深度复盘

第一章:FastAPI 2.0流式响应的核心机制与演进脉络FastAPI 2.0 对流式响应(Streaming Response)进行了底层重构,将原先依赖 Starlette 的 StreamingResponse 封装升级为原生异步生成器驱动模型,并深度整合 ASGI 3.0 规范…...

80地理学院校2026考研复试线汇总【持续更新】

80地理学院校2026考研复试线汇总,已更新60多所高校复试线,其余学校持续更新中~武汉大学2026年地理学方向复试线:2026年中科院新疆生态与地理研究所复试线2026年中国矿业大学资源与地球科学学院复试线陕西师范大学2026年地理科学与旅游学院复试…...

效果实测:nli-distilroberta-base处理长文本与跨语言推理能力

效果实测:nli-distilroberta-base处理长文本与跨语言推理能力 1. 模型核心能力概览 nli-distilroberta-base作为轻量级自然语言推理模型,在文本理解任务中展现出独特优势。这个基于RoBERTa架构的蒸馏版本,保留了原模型90%以上的性能&#x…...

小白友好!Gemma-3-12B-IT WebUI部署常见错误及修复方法

小白友好!Gemma-3-12B-IT WebUI部署常见错误及修复方法 1. 为什么你的WebUI总是打不开? 你是不是也遇到过这种情况:跟着教程一步步部署Gemma-3-12B-IT的WebUI,最后一步打开浏览器,输入地址,结果页面一直转…...

次元画室+AI绘图工作流:从文字描述到精准提示词的无缝衔接

次元画室AI绘图工作流:从文字描述到精准提示词的无缝衔接 1. 为什么需要AI绘图工作流? 在动漫角色设计领域,创作者们长期面临一个核心矛盾:脑海中有丰富的创意,却难以准确转化为视觉形象。传统工作流程中&#xff0c…...

中文句子相似度分析神器:StructBERT本地部署全流程详解(附代码)

中文句子相似度分析神器:StructBERT本地部署全流程详解(附代码) 1. 工具概览与核心价值 中文语义相似度分析是自然语言处理中的一项基础但关键的任务。无论是智能客服中的问题匹配,还是内容平台的文章查重,都需要准确…...

【SpringBoot 】dynamic 动态数据源配置连接池(转)

前言 在复杂的业务场景中,我们经常需要使用多数据源来满足不同的数据访问需求。Dynamic Datasource 为我们提供了一种灵活切换不同数据源的解决方案。但是多数据源配置连接池 以及说明文档都是收费的。 本篇博文将详细介绍如何配置和优化 Dynamic Datasource 的连接…...

Fish Speech 1.5入门指南:无需Python基础,5步完成高质量语音生成

Fish Speech 1.5入门指南:无需Python基础,5步完成高质量语音生成 你是不是也遇到过这些烦恼?想给视频配音,但自己的声音不好听,找配音员又太贵;想制作有声书,但录制过程繁琐,效果还…...

如何使用Rainmeter监控PCIe设备延迟:完整响应时间检测指南

如何使用Rainmeter监控PCIe设备延迟:完整响应时间检测指南 【免费下载链接】rainmeter Desktop customization tool for Windows 项目地址: https://gitcode.com/gh_mirrors/ra/rainmeter Rainmeter是一款强大的Windows桌面自定义工具,不仅能美化…...

解密数字图像处理中的m邻接:从理论到实战的连通性优化

1. 为什么我们需要m邻接? 第一次接触数字图像处理时,你可能和我一样被各种邻接关系绕晕。记得当时处理一个简单的二值图像,用8邻接做连通区域分析,结果两个明明分开的方块被错误地连在了一起。这就是典型的"歧义路径"问…...