当前位置: 首页 > article >正文

文件目录与检索综合练习题

文章目录

  • 前言
  • 一、基础部分
  • 二、参数应用
  • 三、参数进阶
  • 四、组合应用
  • 五、归档压缩
  • 六、统计与分析
  • 总结


前言

这部分练习题帮助大家更好的掌握命令


一、基础部分

1.用grep在error.log中查找所有含"Timeout"的行
2.使用find在/var/log下搜索7天内修改过的.log文件
3.对data.txt按第二列数值降序排列(列以空格分隔)
4.去除list.txt中连续的重复行
5.用tr将file.txt中所有小写字母转为大写
6.提取access.log中第5列(以冒号分隔)的IP地址
7.用which确认python3的可执行文件路径
8.用whereis查找nginx的配置文件位置
9.比较v1.conf和v2.conf的差异,输出上下文3行
10.在/etc目录下递归查找所有.conf文件
11.转换output.log所有字母为大写
12.统计/home各用户的文件数量
13.过滤同时含"WARNING"和"2023-10"的行
14.查找/usr/bin下root用户的执行文件
15.按扩展名分组统计filelist.txt文件名
16.查找~/.ssh目录下的所有隐藏文件
17.将data.txt按第二列数值逆序排列
18.合并file1.txt和file2.txt并去重
19.删除log.txt中所有空行
20.比较dir1和dir2的目录结构差异
21.递归查找/var/log所有含"ERROR"的.log文件
22.将access.log按第四列IP地址排序
23.去除data.csv中连续重复行
24.DOS转UNIX换行格式
25.提取employees.csv第三列(逗号分隔)
26.查找nginx.conf所有可能路径
27.显示python可执行文件路径
28.比较config.old与config.new差异
29.批量修改.tmp为.bak后缀
30.查找/etc下7天前修改且>1MB的文件
31.查找普通文件容量小于100M并删除
32.查找普通文件容量大于100M并显示详细信息
33.find结合xargs命令进行结果的再处理(删除小于100M)
参考答案:
1.grep -n “Timeout” /error.log
2.find /var/log -name “.log" -mtime -7
3.sort -k2,2nr data.txt 或者 sort -r | cut -d ’ ’ -f2 data.txt
4.cat list.txt | uniq
5.tr ‘a-z’ ‘A-Z < file.txt
6.cut -d’:’ -f5 access.log
7.which python3
8.whereis -b nginx
9.diff -C 3 v1.conf v2.conf
10.find /etc -name "
.conf”
11.tr ‘a-z’ ‘A-Z’ output.log
12.find /home -type f -printf “%u\n” | sort | uniq -c
13.grep ‘WARNING’ | grep ‘2023-10’
14.find /usr/bin -user root -perm /+x
15.cut -d’.’ -f2 filelist.txt | sort | uniq -c或者rev filelist.txt | cut -d’.’ -f1 | rev | sort | uniq -c
16.find ~/.ssh -name “.*”
17.sort -k 2 -rn | uniq data.txt
18.cat file1.txt file2.txt | uniq
19.tr -s ‘\n’ < log.txt | sed ‘/^KaTeX parse error: Expected group as argument to '\r' at position 185: …iq 24.tr -d '\r'̲ < dosfile.txt …/.bak/’ {} +
30.find /etc/ -type f -size +1MB -mtime 7
31.find -type f -size -100M -exac rm {};
32. find -type f -size +100M -exac ls - lh {};
33. find /root/c2407-3/ -size -100M -type f | xargs rm -rf

二、参数应用

grep相关​
31. 在多个文件(.log)中搜索"ERROR"并显示文件名
32. 忽略大小写查找"warning"并标红关键词
33. 显示匹配"success"的行及其后2行内容
34. 统计access.log中出现"404"的次数
35. 使用正则表达式匹配以"192.168"开头的IP
参考答案:
find . -type f -name "
.log" -exec grep -l “ERROR” {} ;
grep -i --color=auto “warining” *.log
grep “success” -A2 *.log
grep -c “404” /var/log/access.log
grep -E ‘192.168’ access.log

​find相关​
37. 查找/home下大于100MB的文件
38. 搜索30天前修改的.bak文件并删除
39. 查找/tmp目录下空文件
40. 组合条件:查找属主为root且权限644的文件
41. 对找到的.tmp文件执行ls -l操作

参考答案:
find /home -type f -size +100MB
find -type f -name “.bak" -mtime +29 -exac rm {} ;
find /tmp -type f -size 0c
find -type f -user root -perm 644
find -type f -name "
.tmp” -exac ls -l {} ;

​sort/uniq​
42. 对users.csv按第三列(数字UID)排序
43. 去重非连续重复行(需先排序)
44. 统计words.txt中每个单词的出现频率
45. 按文件大小(第五列)排序ls -l的输出
46. 合并两个已排序文件并去重

参考答案:
cut -d"," -f3 ceshi.txt | sort -r 或者 sort -t, -k3,3n ceshi.txt
sort file.txt | uniq
tr ’ ’ ‘\n’ < words.txt | sort | uniq -c
ls -l | sort -k5,5n
sort -m file1.txt file2.txt | uniq

​tr/cut​
48. 删除data.csv中的Windows换行符(^M)
49. 将file.txt中的制表符替换为逗号
50. 截取ps aux输出中的CPU占用率(第三列)
51. 从ifconfig输出中提取所有IPv4地址
52. 过滤/etc/passwd中所有用户的shell类型(第7列)

参考答案:
tr -d ‘\r’ < data.csv > data_unix.csv
tr ‘\t’ ‘,’ < file.txt > file_comma.txt
ps aux | awk ‘{print $3}’
ifconfig | grep -oE ‘inet [0-9]+.[0-9]+.[0-9]+.[0-9]+’ | awk ‘{print $2}’
awk -F: ‘{print $7}’ /etc/passwd

三、参数进阶

递归搜索代码目录中所有包含"TODO:"注释的文件
查找30天前修改且大于100MB的备份文件
统计日志文件中每个IP地址出现的次数
将students.tsv文件中的制表符替换为逗号
显示system.log中匹配"warning"及其后3行内容
查找并删除/tmp下所有空文件
按文件大小逆序排列当前目录内容
过滤日志中所有符合邮箱格式的字符串
批量修改文件名后缀(.htm→.html)
提取ifconfig命令输出中的所有IPv4地址

四、组合应用

查找所有.conf文件并统计总行数
分析日志中访问量TOP5的页面路径
自动清理7天前的日志压缩包(.tar.gz)
将ps aux输出转换为CSV格式
对比两个目录中同名文件的内容差异

五、归档压缩

打包project目录为.tar文件
解压backup.zip到指定目录/data
使用最高压缩率压缩database.db
查看archive.tar.gz中的文件列表
创建加密的zip压缩包(密码:123456)

六、统计与分析

统计document.md的总行数
查看/var目录占用的磁盘空间
交互式分析/home的存储分布
统计当前目录的文件类型分布
找出占用空间最大的前10个文件
实时监控/tmp目录大小变化
对比两个月份日志文件的行数差异
生成目录树形大小报告
检测异常增长的日志文件
统计所有用户的主目录大小排名

总结

提示:这些练习题能更好的帮助大家熟练这些命令 如有不对的地方请告知,有些命令没有附答案的后续会补上

相关文章:

文件目录与检索综合练习题

文章目录 前言一、基础部分二、参数应用三、参数进阶四、组合应用五、归档压缩六、统计与分析总结 前言 这部分练习题帮助大家更好的掌握命令 一、基础部分 1.用grep在error.log中查找所有含"Timeout"的行 2.使用find在/var/log下搜索7天内修改过的.log文件 3.对da…...

Python+Selenium爬虫:豆瓣登录反反爬策略解析

1. 引言 在当今互联网时代&#xff0c;数据抓取&#xff08;爬虫&#xff09;技术广泛应用于数据分析、市场调研、自动化测试等领域。然而&#xff0c;许多网站采用动态加载技术&#xff08;如Ajax、React、Vue.js等框架&#xff09;来渲染页面&#xff0c;传统的**<font s…...

信息系统运行管理员:临阵磨枪版

信息系统运行管理员考试 - 全覆盖详细背诵大纲 (根据考情分析和原始材料&#xff0c;力求完整覆盖考点细节) 第一部分&#xff1a;基础知识与运维概览 Chapter 1: 信息系统运维概述 (上午题 5分) 信息&#xff1a; 含义&#xff1a;香农 - 减少随机不确定性的东西&#xff1b…...

电总协议调试助手更新-PowerBus-v1.0.5

电总协议调试助手&#xff0c;该工具主要是用于打包电总协议&#xff0c;用于电总协议的设备调试&#xff08;精密空调、UPS、基站电源等等&#xff09;。电总协议校验计算、编码转换比较麻烦&#xff0c;手动组包困难&#xff0c;使用该工具可以大大提高调试效率。 Ver1.0.5版…...

技术文档:变频器干扰问题与解决方案

1. 引言 在现代工业自动化系统中&#xff0c;变频器&#xff08;Variable Frequency Drive, VFD&#xff09;因其高效节能和精确调速的特点被广泛应用于电机控制。然而&#xff0c;变频器在运行过程中会产生高频电磁干扰&#xff08;EMI&#xff09;&#xff0c;对周边设备如P…...

2025认证杯数学建模C题思路+代码+模型:化工厂生产流程的预测和控制

2025认证杯数学建模C题思路代码模型&#xff0c;详细内容见文末名片 在化工厂的生产流程中&#xff0c;往往涉及到多个反应釜、管道和储罐等设备。在 流水线上也有每个位置的温度、压力、流量等诸多参数。只有参数处于正常范 围时&#xff0c;最终的产物才是合格的。这些参数…...

亚马逊,temu测评采购低成本养号策略:如何用一台设备安全批量管理买家账号

只要能够巧妙规避平台的检测和风控措施&#xff0c;测评便可安全进行。 自养号测评&#xff0c;它更便于卖家掌控&#xff0c;且能降低风险。现在很多卖家都是自己养号&#xff0c;自己养号都是精养&#xff0c;不是自动的机刷&#xff0c;买家账号掌握在自己手里&#xff0c;更…...

SiFli-SDK 编译

1.编译报错 scons: *** No SConstruct file found. 出现这个错误是没有正确进入到工程目录执行编译命令&#xff0c;例如应该进入project目录中。 2.scons: *** [build_em-lb525_hcpu\src\resource\strings\en_us.c] AttributeError : dict object has no attribute iteritem…...

React 第四十一节Router 中 useActionData 使用方法案例以及注意事项

一、useActionData前言 useActionData 是 React Router 提供的一个钩子函数&#xff0c;用于获取在路由的 action 函数中返回的数据。它通常与表单提交&#xff08;通过 <Form> 组件&#xff09;配合使用&#xff0c;用于处理表单提交后的服务器响应数据&#xff08;如错…...

C++多态实现的必要条件剖析

在C中&#xff0c;多态的一个必要条件确实是通过基类的指针或引用调用虚函数。这一要求背后的原因与C如何实现动态绑定&#xff08;运行时多态&#xff09;密切相关。下面详细解释了为什么需要使用基类的指针或引用来实现多态。 动态绑定与静态绑定 静态绑定&#xff08;编译期…...

C语言_自动义类型:联合和枚举

1. 联合体 1.1 联合体类型的声明 与结构体相似&#xff0c;联合体也是有一个或多个成员&#xff08;可以是不同类型&#xff09;构成&#xff1b;但是编译器只为最大的成员分配足够的内存空间 联合体的特点是所有成员共用同一块内存空间&#xff0c;所以联合体也叫&#xff…...

汽车紧固件涂层18问:看敦普无铬锌铝涂料如何为螺丝防锈防腐

导读 在汽车紧固件防锈涂装领域&#xff0c;敦普牌紧固件无铬锌铝涂料&#xff0c;是专为汽车紧固件打造的水性涂料&#xff0c;集防锈、环保、高性价比于一体。它有何独特之处&#xff1f;让我们一探究竟。​ 1、敦普紧固件无铬锌铝涂料是什么产品&#xff1f; 敦普紧固件无铬…...

掘金中亚货代蓝海,易境通货代系统解锁数字化制胜密码!

2025年&#xff0c;中亚地区正成为全球物流行业的新蓝海。中亚五国因其独特的地缘位置和“一带一路”倡议的深化推进&#xff0c;正逐渐成为全球物流行业的战略要地。 在政策红利、基建升级与市场需求的叠加效应下&#xff0c;中亚物流市场预计在2025年迎来爆发式增长。但传统…...

Python内存管理:赋值、浅拷贝与深拷贝解析

赋值与共享资源 在Python中&#xff0c;直接赋值操作&#xff08;如 list2 list1&#xff09;会导致两个变量共享同一个内存地址。这意味着对 list1 的修改会直接影响到 list2&#xff0c;因为它们指向同一个对象。 注意: 赋值等于完全共享资源 如果我们不希望这样完全共享&…...

W1R3S: 1.0.1靶场

W1R3S: 1.0.1 来自 <W1R3S: 1.0.1 ~ VulnHub> 1&#xff0c;将两台虚拟机网络连接都改为NAT模式 2&#xff0c;攻击机上做namp局域网扫描发现靶机 nmap -sn 192.168.23.0/24 那么攻击机IP为192.168.23.182&#xff0c;靶场IP192.168.23.249 3&#xff0c;对靶机进行端口…...

深度学习-分布式训练机制

1、分布式训练时&#xff0c;包括train.py的全部的代码都会在每个gpu上运行吗&#xff1f; 在分布式训练&#xff08;如使用 PyTorch 的 DistributedDataParallel&#xff0c;DDP&#xff09;时&#xff0c;每个 GPU 上运行的进程会执行 train.py 的全部代码&#xff0c;但通过…...

[Mamba轻量化]DefMamba: Deformable Visual State Space Model,CVPR2025

paper 文章目录 AbstractMethod整体模型架构可变形状态空间模型 Experiments Abstract 然而&#xff0c;大多数现有的视觉Mamba方法使用预定义的扫描顺序将图像展平为1D序列&#xff0c;导致模型在特征提取过程中对图像空间结构信息的利用能力减弱。为解决这一问题&#xff0…...

CSRF 和 XSS 攻击分析与防范

CSRF 和 XSS 攻击分析与防范 CSRF (跨站请求伪造) 什么是 CSRF&#xff1f; CSRF (Cross-Site Request Forgery) 是一种攻击方式&#xff0c;攻击者诱使用户在已登录目标网站的情况下&#xff0c;执行非预期的操作。 攻击流程&#xff1a; 用户登录可信网站 A在不登出 A 的…...

找银子 题解(c++)

题目 思路 首先&#xff0c;这道题乍一看&#xff0c;应该可以用搜索来做。 但是&#xff0c;搜索会不会超时间限制呢&#xff1f; 为了防止时间超限,我们可以换一种做法。 先创立两个二维数组&#xff0c;一个是输入的数组a&#xff0c;一个是数组b。 假设 i 行 j 列的数…...

中国版 Cursor?腾讯推出 AI 编程助手 CodeBuddy,重新定义编程体验

人工智能&#xff08;AI&#xff09;技术的迅猛发展正深刻地变革着各个行业&#xff0c;编程领域也不例外。以原生 IDE 体验见长的 Cursor&#xff0c;凭借其 Agent 模式在 AI 编程领域脱颖而出&#xff0c;对 GitHub Copilot 以及 VS Code 与 JetBrains 全家桶的地位发起挑战。…...

JVM学习专题(二)内存模型深度剖析

目录 1.JVM结构体系 ​编辑 2.跨平台特性 3.JVM整体结构及内存模型 1.栈内存 1、栈帧&#xff1a; 1.局部变量表 2.操作数栈 3.动态链接 4.方法出口 2、创建对象 2.程序计数器&#xff1a; 3.方法区 ​4.堆 5.本地方法区 6.总结 1.JVM结构体系 JDK、JRE 和 JVM…...

密码学实验:凯撒密码

密码学实验&#xff1a;凯撒密码 一、实验目的 掌握凯撒密码的数学原理&#xff1a;理解字符移位与模运算的结合&#xff0c;实现加解密算法。理解暴力破解本质&#xff1a;通过穷举有限密钥空间&#xff0c;掌握利用语言特征破解密文的方法。编程实践&#xff1a;用Python实…...

linux备份与同步工具rsync

版权声明&#xff1a;原创作品&#xff0c;请勿转载&#xff01; 文章目录 版权声明&#xff1a;原创作品&#xff0c;请勿转载&#xff01; 实验环境介绍&#xff1a; 1.工具介绍 2.详细介绍 2.1 本地模式&#xff08;用得少&#xff09; 2.2 远程模式 2.3 守护进程模式…...

PYTHON训练营DAY26

一、函数 &#xff08;一&#xff09;不带参数的函数 # 定义一个简单的问候函数 def greet():"""打印一句问候语。"""message "大家好&#xff01;欢迎学习Python函数定义&#xff01;"print(message)greet()&#xff08;二&#x…...

WPS一旦打开,就会修改默认打开方式,怎么解?

目录 前言 解决方法 结语 前言 电脑上同时存在WPS和微软的Office全家桶&#xff0c;但是我更喜欢用Office全家桶。前几天刚在设置改过来&#xff0c;忘记更改pdf文件打开默认应用。结果没过几天&#xff0c;不小心用WPS打开pdf文件时候&#xff0c;给我把默认设置全改回去了…...

从概念到可工程化智能体的转变路径——以“知识奇点工程师”为例

产品部门定义了一个如下概念性的“知识奇点工程师”&#xff0c;他们构建的不仅仅是一个数据库或知识图谱&#xff0c;而是一个活的、能自我进化的知识生态系统&#xff0c;是整个“Neuralink for Education”宏伟蓝图的基石。他们的工作难度和重要性&#xff0c;不亚于为AI引擎…...

单片机-STM32部分:12、I2C

飞书文档https://x509p6c8to.feishu.cn/wiki/MsB7wLebki07eUkAZ1ec12W3nsh 一、简介 IIC协议&#xff0c;又称I2C协议&#xff0c;是由PHILP公司在80年代开发的两线式串行总线&#xff0c;用于连接微控制器及其外围设备&#xff0c;IIC属于半双工同步通信方式。 IIC是一种同步…...

Payload的定义及核心概念

在IT领域&#xff0c;Payload&#xff08;有效载荷&#xff09; 指数据传输或操作中承载实际功能或信息的主体部分&#xff0c;与协议头、元数据等辅助内容区分。其核心特点是完成特定目标&#xff0c;例如传递关键数据、执行代码逻辑或实现攻击行为。 主要应用场景及技术解析 …...

idea插件使用

文章目录 在哪里安装插件常用插件 在哪里安装插件 离线下载插件请参考我的文章–>可复用性代码 在线下载 插件 &#xff1a;File(文件) —> Settings(设置) —> Plugins(插件) 常用插件 汉化插件&#xff1a;Chinese (Simplified) Language Pack /中文语言包。作者:…...

计算机网络笔记(二十四)——4.6互联网的路由选择协议

4.6.1有关路由选择协议的几个基本概念 路由选择协议是计算机网络中维护和生成路由表的核心机制。 1. 路由选择的核心目标 转发&#xff08;Forwarding&#xff09;&#xff1a;路由器基于本地转发表&#xff0c;将分组从输入链路转移到输出链路&#xff08;单台路由器的本地…...