当前位置: 首页 > news >正文

在 Ubuntu 上查看重复文件

一般情况下

1. 使用 fdupes 工具

fdupes 是一个专门用于查找重复文件的工具。

安装:

sudo apt-get install fdupes

使用:

fdupes -r /path/to/directory

-r 选项会递归查找子目录中的重复文件。

2. 使用 rmlint 工具

rmlint 是另一个强大的重复文件查找工具,并且可以生成删除脚本来帮助清理重复文件。

安装:

sudo apt-get install rmlint

使用:

rmlint /path/to/directory

默认情况下,rmlint 会输出报告,但你可以使用 -o 选项来生成删除脚本。

3. 使用 findmd5sum 命令组合

如果你喜欢使用命令行,你可以通过结合 findmd5sum 命令来查找重复文件。

示例:

find /path/to/directory -type f -exec md5sum {} + | sort | uniq -d --check-chars=32

这个命令会计算所有文件的 MD5 校验和,并找出重复的校验和。

4. 使用图形界面的工具

如果你更喜欢图形用户界面,可以使用工具如 BleachBitdupeGuru 来查找重复文件。

安装 dupeGuru:

sudo add-apt-repository ppa:dupeguru/ppa sudo apt-get update sudo apt-get install dupeguru

启动 dupeGuru: 在应用菜单中找到 dupeGuru 并启动它,按照向导选择目录来扫描重复文件。

多线程处理

如果你希望使用多线程来加速查找重复文件的过程,可以考虑以下工具和命令:

1. rmlint

rmlint 支持多线程。它会自动检测并使用系统的 CPU 核心来加速文件扫描过程。

示例:

rmlint -c sh /path/to/directory

这里的 -c sh 选项会生成一个 shell 脚本以清理重复文件。rmlint 默认会使用多线程来提高性能。

2. fdupes

fdupes 本身不直接支持多线程,但可以通过其他工具来加速。例如,可以将目录分割成多个部分,然后并行运行多个 fdupes 实例:

find /path/to/directory -type d | xargs -I{} -P 4 fdupes -r {}

这里,-P 4 选项指定使用 4 个并行进程来运行 fdupes

3. findmd5sum

你可以使用 GNU Parallel 来并行处理 findmd5sum,从而利用多线程来加速查找:

安装 GNU Parallel:

sudo apt-get install parallel

示例:

find /path/to/directory -type f | parallel -j 4 md5sum {} | sort | uniq -d --check-chars=32

这里的 -j 4 选项表示使用 4 个并行线程。

相关文章:

在 Ubuntu 上查看重复文件

一般情况下 1. 使用 fdupes 工具 fdupes 是一个专门用于查找重复文件的工具。 安装: sudo apt-get install fdupes 使用: fdupes -r /path/to/directory -r 选项会递归查找子目录中的重复文件。 2. 使用 rmlint 工具 rmlint 是另一个强大的重复文件查找工具&#xf…...

docker容器高效连接 Redis 的方式

在微服务架构中,Redis 是一种常见的高效缓存解决方案,通常用于存储临时数据、会话信息或 token。如何在服务容器中高效、稳定地连接 Redis 是架构设计中的一个重要环节。 这篇博客将以实际项目为例,详细介绍如何配置 Flask 应用中的服务容器…...

手撕Python之生成器、装饰器、异常

1.生成器 生成器的定义方式&#xff1a;在函数中使用yield yield值&#xff1a;将值返回到调用处 我们需要使用next()进行获取yield的返回值 yield的使用以及生成器函数的返回的接收next() def test():yield 1,2,3ttest() print(t) #<generator object test at 0x01B77…...

LabVIEW步进电机控制方式

在LabVIEW中控制步进电机可以通过多种方式实现。每种方法都有其独特的优缺点&#xff0c;适用于不同的应用场合。下面详细介绍几种常见的步进电机控制方式&#xff0c;并进行比较。 1. 开环控制&#xff08;Open-Loop Control&#xff09; 特点 通过定期发出脉冲信号来控制步进…...

vllm源码解析(五):LLM模型推理

八 模型推理细节探索 8.1 回顾下step的流程 def step(self) -> List[Union[RequestOutput, EmbeddingRequestOutput]]:# 多GPU并行推理时走AsyncLLMEngine分支。如果进入当前LLMEngine,性能会下降&#xff0c;这里会抛出异常。if self.parallel_config.pipeline_parallel_s…...

数学建模笔记——熵权法(客观赋权法)

数学建模笔记——熵权法[客观赋权法] 熵权法(客观赋权法)1. 基本概念2. 基本步骤3. 典型例题3.1 正向化矩阵3.2 对正向化矩阵进行矩阵标准化3.3 计算概率矩阵P3.4 计算熵权3.5 计算得分 4. python代码实现 熵权法(客观赋权法) 1. 基本概念 熵权法,物理学名词,按照信息论基本原…...

XGBoost算法-确定树的结构

我们在求解上面的w和obj的过程中&#xff0c;都是假定我们的树结构是确定的&#xff0c;因为当我们改变树中划分条件的时候&#xff0c;每个叶子节点对应的样本有可能是不一样的&#xff0c;我们的G和H也是不一样的&#xff0c;得到的最优w和最优obj肯定也是不一样的。 到底哪一…...

concurrentHashMap线程安全实现的原理

1. Segment 数组 ConcurrentHashMap 内部维护一个 Segment 数组&#xff0c;每个 Segment 都是一个小型的 HashMap。Segment 继承自 ReentrantLock&#xff0c;因此每个 Segment 都是一个可重入锁。 2. 并发级别 ConcurrentHashMap 在构造时可以指定并发级别&#xff08;con…...

域名证书,泛域名证书,sni

文章目录 前言一、证书1.全域名证书2.泛域名证书 二、域名证书的使用1、浏览器请求域名证书流程对全域名证书的请求流程对泛域名证书的请求流程ssl client-hello携带server name 报文 2、浏览器对证书的验证流程 三、域名证书和sni 前言 本文介绍了泛域名证书和全域名证书的区别…...

Pytest夹具autouse参数使用。True表示会自动在测试中使用,而无需显式指定

1. 全局conftest文件日志记录功能 # 当前路径(使用 abspath 方法可通过dos窗口执行) current_path os.path.dirname(os.path.abspath(__file__)) # 上上级目录 ffather_path os.path.abspath(os.path.join(current_path,"../"))LOG_FILE_PATH f{ffather_path}/lo…...

Linux:归档及压缩

tar命令 • tar 集成备份工具 – -c&#xff1a;创建归档 – -x&#xff1a;释放归档 – -f&#xff1a;指定归档文件名称,必须在所有选项的最后 – -z、-j、-J&#xff1a;调用 .gz、.bz2、.xz 格式工具进行处理 – -t&#xff1a;显示归档中的文件清单 – -C&#xff1a;指定…...

jenkins 安装

jenkins安装 jenkins官网 中文网址 安装设置 所有jenkins版本 内存512M以上&#xff0c;10Gb磁盘&#xff1b;安装jdk&#xff0c;需要java8以上下载较新的版本&#xff0c;否则安装插件时可能报错版本过低 # 搜索java yum search java | grep -iE "jdk"# 安装jd…...

mysql学习教程,从入门到精通,MySQL 删除数据库教程(6)

1、MySQL 删除数据库 使用普通用户登陆 MySQL 服务器&#xff0c;你可能需要特定的权限来创建或者删除 MySQL 数据库&#xff0c;所以我们这边使用 root 用户登录&#xff0c;root 用户拥有最高权限。 在删除数据库过程中&#xff0c;务必要十分谨慎&#xff0c;因为在执行删除…...

C语言:刷题日志(2)

一.币值转换 输入一个整数&#xff08;位数不超过9位&#xff09;代表一个人民币值&#xff08;单位为元&#xff09;&#xff0c;请转换成财务要求的大写中文格式。如23108元&#xff0c;转换后变成“贰万叁仟壹百零捌”元。为了简化输出&#xff0c;用小写英文字母a-j顺序代…...

微带结环行器仿真分析+HFSS工程文件

微带结环行器仿真分析HFSS工程文件 工程下载&#xff1a;微带结环行器仿真分析HFSS工程文件 我使用HFSS版本的是HFSS 2024 R2 参考书籍《微波铁氧体器件HFSS设计原理》和视频微带结环行器HFSS仿真 1、环形器简介 环行器是一个有单向传输特性的三端口器件&#xff0c;它表明…...

怎么仿同款小程序的开发制作方法介绍

很多老板想要仿小程序系统&#xff0c;就是想要做个和别人界面功能类似的同款小程序系统&#xff0c;咨询瀚林问该怎么开发制作&#xff1f;本次瀚林就为大家介绍一下仿制同款小程序系统的方法。 1、确认功能需求 想要模仿同款小程序系统&#xff0c;那么首先需要找到自己想要…...

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础&#xff1a;WAV专题&#xff08;6&#xff09;——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道&#xff0c;通过FFprobe命令可以打印WAV音频文件每个packet&#xff08;也称为数据包或多媒体包&#xff09;的信息&#xff0…...

0.91寸OLED屏幕大小的音频频谱,炫酷

&#xff08;后文有详细介绍&#xff09; 频谱扫描&#xff1a; 迷你音频频谱——频率扫描 音乐律动&#xff1a; 迷你音频频谱——频率扫描 迷你音频频谱——音乐2 迷你音频频谱——音乐3 一、简介 音频频谱在最小0.91寸OLED 屏幕上显示&#xff0c;小巧玲珑 二、应用场景 本…...

6. LinkedList与链表

一、ArrayList的缺陷 通过源码知道&#xff0c;ArrayList底层使用数组来存储元素&#xff0c;由于其底层是一段连续空间&#xff0c;当在ArrayList任意位置插入或者删除元素时&#xff0c;就需要将后序元素整体往前或者往后搬移&#xff0c;时间复杂度为O(n)&#xff0c;效率比…...

Statcounter Global Stats 提供全球统计数据信息

Statcounter Global Stats 提供全球统计数据信息 1. Statcounter Global Stats2. Mobile & Tablet Android Version Market Share WorldwideReferences Statcounter Global Stats https://gs.statcounter.com/ Statcounter Global Stats are brought to you by Statcounte…...

iOSDeviceSupport:解决设备调试兼容性问题的高效管理工具

iOSDeviceSupport&#xff1a;解决设备调试兼容性问题的高效管理工具 【免费下载链接】iOSDeviceSupport All versions of iOS Device Support 项目地址: https://gitcode.com/gh_mirrors/ios/iOSDeviceSupport 问题场景&#xff1a;当新系统遇见旧Xcode "连接失败…...

终极指南:一键解决iPhone USB网络共享驱动问题

终极指南&#xff1a;一键解决iPhone USB网络共享驱动问题 【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/gh_mirrors/ap…...

牙齿龋齿检测数据集 YOLO模型如何训练牙齿病害数据集 权重识别龋齿

牙齿龋齿检测数据集&#xff0c;2554张&#xff0c;提供yolo和voc两种标注方式 1类&#xff0c;标注数量&#xff1a; caries: 6946 image num: 2554 &#x1f9b7; 龋齿检测数据集 (Dental Caries Detection Dataset) 属性详细描述数据集名称齿科龋齿目标检测数据集图像总数2…...

MOOTDX终极指南:5个简单步骤掌握Python通达信数据接口

MOOTDX终极指南&#xff1a;5个简单步骤掌握Python通达信数据接口 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx MOOTDX是一个强大的Python通达信数据接口库&#xff0c;它能让你轻松获取A股市场…...

新手入门指南:在快马平台用万文通思路打造你的第一个文本转换网页

今天想和大家分享一个特别适合编程新手的实践项目——用万文通思路在InsCode(快马)平台快速搭建文本转换网页。这个项目完全不需要复杂的环境配置&#xff0c;打开浏览器就能完成&#xff0c;特别适合想体验完整开发流程的初学者。 项目核心功能设计 这个网页的核心功能非常简单…...

Matlab_Simulink与Carsim的联合仿 擅长基于群智能算法优化的LQR、PID控制算法,能清晰讲解其中要点哦。对于基于群智能算法的一般路径规划

Matlab/Simulink与Carsim的联合仿 擅长基于群智能算法优化的LQR、PID控制算法&#xff0c;能清晰讲解其中要点哦。对于基于群智能算法的一般路径规划 稍长智能车轨迹跟踪控制方向 熟悉Matlab/Simulink和Carsim的联合仿真呢。这是一个非常专业且热门的研究方向&#xff08;群智能…...

Emmc系列(二)--------协议解析与实战应用

1. Emmc协议基础解析 Emmc协议作为嵌入式存储领域的核心标准&#xff0c;其重要性不言而喻。简单来说&#xff0c;它就像存储设备与主机之间的"普通话"&#xff0c;规定了双方如何高效沟通。我在实际项目中遇到过不少因为协议理解不到位导致的通信故障&#xff0c;今…...

OpenWRT路由器如何用Zerotier实现异地组网?保姆级配置教程(含防火墙规则详解)

OpenWRT路由器通过Zerotier构建安全异地内网的完整实践指南 异地办公已成为现代企业的常态&#xff0c;而如何安全高效地访问公司内网资源则是技术人员面临的现实挑战。传统VPN方案往往配置复杂且性能受限&#xff0c;而基于P2P技术的Zerotier配合OpenWRT路由器&#xff0c;能够…...

Phi-4-mini-reasoning:轻量级推理模型在人工智能浪潮中的定位

Phi-4-mini-reasoning&#xff1a;轻量级推理模型在人工智能浪潮中的定位 1. 轻量级推理模型的时代价值 当ChatGPT等千亿参数大模型占据媒体头条时&#xff0c;一个容易被忽视的趋势正在悄然兴起——轻量级推理模型正在特定领域展现出惊人的实用性。Phi-4-mini-reasoning正是…...

Beyond Compare 5密钥生成终极指南:轻松解决评估模式错误

Beyond Compare 5密钥生成终极指南&#xff1a;轻松解决评估模式错误 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 你是否曾遇到Beyond Compare 5弹出"评估模式错误"的困扰&#xf…...