git-filter-repo 清除大文件教程
git filter-repo 是一个用于过滤和清理 Git 仓库历史的工具,它可以高效地批量修改提交历史中的文件内容、删除文件、重命名文件以及进行其他历史重构操作。相较于 git filter-branch,它通常更快且更易于使用。
以下是一个基本示例,说明如何使用 git filter-repo 来删除仓库中特定的大文件:
安装 git-filter-repo
-
首先确保你已安装 Python,并且可以通过 pip(Python 的包管理器)来安装软件包。如果没有安装 Python 和 pip,需要先安装它们。
-
使用 pip 安装
git-filter-repo:
python -m pip install --user git-filter-repo # 对于个人用户安装
# 或者全局安装(可能需要管理员权限)
python -m pip install git-filter-repo
安装完成后,你可以直接使用 git-filter-repo 命令。但由于它并非 Git 内置命令,你需要在终端中直接调用它的路径或者将它的安装目录添加到系统 PATH 环境变量中。例如,在 Unix/Linux 系统中,如果 git-filter-repo 已经被安装在 ~/.local/bin/ 目录下,你可以通过如下命令临时添加到 PATH 中:
export PATH=$PATH:~/.local/bin/
win11
C:\Users\w8\AppData\Roaming\Python\Python311\site-packages
既然 git-filter-repo 已经安装完毕,接下来你可以直接在命令行中使用它。但是请注意,在 Windows 系统中,可能需要将 git-filter-repo 的安装路径添加到系统的 PATH 环境变量,以便能在任何目录下执行这个命令。
若要在当前终端会话中临时添加到 PATH,可以运行以下命令(请替换实际的路径):
set PATH=%PATH%;C:\Users\w8\AppData\Roaming\Python\Python311\Scripts
如果希望永久生效,你需要编辑系统的环境变量设置:
-
右键点击“计算机”或“此电脑”,选择“属性”。
-
在左侧菜单栏选择“高级系统设置”。
-
在“系统属性”窗口中点击“环境变量”按钮。
-
在“系统变量”区域找到名为
Path的变量,选中后点击“编辑”。 -
在“编辑环境变量”窗口中,点击“新建”按钮,然后添加
C:\Users\w8\AppData\Roaming\Python\Python311\Scripts这个路径。 -
点击“确定”保存所有更改。
完成以上步骤后,你应该能够在命令行中直接运行 git filter-repo 命令了
删除仓库历史中的大文件
假设你想删除历史记录中所有包含名为 large_file.txt 的文件,并且你知道这个文件存在于所有的提交中。
-
首先备份你的仓库,以防万一:
1cp -r your_repo your_repo_backup -
进入要处理的仓库目录:
1cd your_repo -
使用
git filter-repo删除指定文件:1git filter-repo --force --invert-paths --path large_file.txt参数解释:
-
--force:允许覆盖当前仓库。 -
--invert-paths:保留不匹配路径的提交,这里是反选,即删除匹配路径的文件。 -
--path large_file.txt:指定要从历史中删除的文件名。
-
-
清理并优化本地仓库:
1git reflog expire --all --expire-unreachable=now --update-reflogs 2git gc --prune=now --aggressive -
推送更改到远程仓库(如果必要的话):
1git push origin --force --all 2git push origin --force --tags注意:由于你改变了历史记录,所以需要用
--force强制推送,并通知协作者他们需要重新克隆更新后的仓库。
其他高级用法
除了删除文件外,git filter-repo 还可以实现更多的功能,例如:
-
删除符合某种模式的所有文件:
1git filter-repo --force --path-glob '*.zip' -
替换文件内容:
1git filter-repo --replace-text <replacement-file>在
<replacement-file>中定义替换规则。 -
根据大小过滤文件:
1git filter-repo --strip-blobs-bigger-than 10M删除大于10MB的二进制文件。
-
更多复杂操作,请参考官方文档:https://github.com/newren/git-filter-repo/blob/main/README.md
请根据具体需求调整命令参数,并始终谨慎操作,因为修改历史记录会影响所有仓库使用者。在执行这些操作前务必创建仓库备份。
相关文章:
git-filter-repo 清除大文件教程
git filter-repo 是一个用于过滤和清理 Git 仓库历史的工具,它可以高效地批量修改提交历史中的文件内容、删除文件、重命名文件以及进行其他历史重构操作。相较于 git filter-branch,它通常更快且更易于使用。 以下是一个基本示例,说明如何使…...
【python】gunicorn配置
起因:因为cpu利用率低导致我去缩容,虽然缩容之后cpu利用率上升维持在60%左右,但是程序响应耗时增加了。 解释:因为cpu干这件活本身不累,但在干这件活的时候不能去干其他事情,导致并发的请求不能及时响应&am…...
基于WebAssembly的云原生运行时:重新定义轻量化微服务架构
引言:颠覆性的运行时革命 Fastly边缘计算平台每天处理2000亿次Wasm请求,冷启动时间低于1ms。字节跳动采用Wasm实现广告算法热更新,发布耗时从分钟级降至秒级。CNCF 2024调研显示Wasm在边缘计算场景渗透率达42%,单实例内存开销仅为…...
25年社工考试报名时间⏰附报名全流程✅
目前,湖北、重庆、云南、天津、山西、内蒙、四川、北京八地已发布考务通知。 1、湖北:3月11日9:00—3月26日20:00 2、重庆:3月13日9:00—3月24日17:00 3️⃣云南:3月10日09:00—3月20日17:00 4、天津:3月10日0:00至…...
鸿蒙全栈开发 D2
课程目标 掌握ArkTS基础语法与核心概念理解声明式UI开发范式能独立开发简单鸿蒙应用组件建立规范的代码编写习惯 第一部分:初识ArkTS 1.1 语言全景认知 #mermaid-svg-V5mnjQN3DAHkfoBo {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size…...
下载PyCharm 2024.3.4 (Community Edition)来开发测试python
1、下载PyCharm 2024.3.4 (Community Edition) 如果你使用的是联想电脑,可以直接在联想应用商店里下载,这样比较省事。 如果你使用的不是联想电脑,当然也可能是别的应用商店里下载。 也可以直接在官网下载: 下载 PyCharm&…...
C#调用Ni板卡进行实现采集任务(模拟量输入输出)示例2
C#调用Ni板卡进行实现采集任务(模拟量输入输出)示例2 本文介绍如何使用C#控制Ni的USB-6008板卡进行模拟量输入、模拟量输出、输出量输入、数字量输出。本例通过新建一个类USB_6008的类进行功能封装:即把模拟量的读取以及模拟量的输出进行了封装。代码详见: https://download…...
01-二分-查找(洛谷)
链接: P2249 【深基13.例1】查找 - 洛谷 题目 思路 没啥好说的,就是二分的模板要熟练掌握;详细参考代码随想录 本道题要注意的就是不能直接套模板,因为有重复元素,所以要单独处理一下边界。 代码 #include<bi…...
linux发送邮件结合cron
Linux发送邮件结合cron定时任务 配置邮件发送(以QQ邮箱为例,其他同理) 一、获取qq邮箱授权码 登录qq邮箱 进行手机验证或者令牌啥的会获取到一个授权码 二、使用mailx发邮件 安装软件 yum -y install mailx编辑配置文件 vim /etc/mail…...
C语言基础2
一、变量的作用域 局部变量的作用域是变量所在的局部范围,全局变量的作用域是整个工程。 int main() { { int a 10; printf("a %d\n", a); } printf("a %d\n", a); //报错位置 return 0; } 这里会发生报错: “a”: 未声明的…...
Linux系统上安装kafka
目录 1. 安装Java环境 2. 下载和解压Kafka 3. 配置Kafka 4. 启动ZooKeeper和Kafka 5. 测试Kafka 6. 停止服务 7.常见问题 1. 安装Java环境 Kafka依赖Java运行环境(JDK 8或更高版本): # 安装OpenJDK(推荐) yum…...
09 HarmonyOS NEXT 仿uv-ui Tag组件开发教程系列(三)
温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! 文章目录 Tag组件实战应用与最佳实践1. 复杂场景应用1.1 标签筛选系统 2. 性能优化实践2.1 状态管理优化2.2 渲染性能优化 3. 实用功能扩展3.1 拖拽…...
【每日学点HarmonyOS Next知识】网页Scheme拉起应用、列表刷新、Web下载文件、根据子元素
1、HarmonyOS 目前 app 中是否支持网页Scheme拉起应用? 支持deeplink的,网页中添加按钮引导用户拉起应用。网页端直接提示打开应用按钮绑定点击事件window.open(tzptest://www.xxxxx.com?urlXXX)>,点击该按钮,打开网页web端收到的url为t…...
如何排查MySQL是否走索引
博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…...
AF3 curry1函数解读
AlphaFold3 data_transforms 模块的 curry1 函数实现了一个经典的柯里化 (currying) 技术,具体是固定函数 f 的所有参数,除了第一个参数。换句话说,curry1 允许你在调用函数时,先提供除了第一个参数之外的所有参数,然后返回一个新的函数,这个新函数只等待第一个参数。 …...
摄像头应用编程(三):多平面视频采集
文章目录 1、前言2、环境介绍3、步骤4、应用程序编写5、测试5.1、编译应用程序5.2、运行应用程序 6、总结 1、前言 在查看摄像头类型时,大致可以分为两类:Video Capture 和 Video Capture Multiplanar。 本次应用程序主要针对类型为Video Capture Multi…...
【GoTeams】-2:项目基础搭建(下)
本文目录 1. 回顾2. Zap日志3. 配置4. 引入gprc梳理gRPC思路优雅关闭gRPC 1. 回顾 上篇文章我们进行了路由搭建,引入了redis,现在来看看对应的效果。 首先先把前端跑起来,然后点击注册获取验证码。 再看看控制台输出和redis是否已经有记录&…...
02-双指针-A-B 数对
题目 链接:P1102 A-B 数对 - 洛谷 思路 问题场景想象 我们可以把这个问题想象成在一个排队的队伍里找符合特定身高差的人对。给定的数列里的每个数就好比队伍里每个人的身高,而差值 C 就是我们要找的身高差。我们的目标是找出队伍里所有身高差恰好是 …...
2025年Cursor最新安装使用教程
Cursor安装教程 一、Cursor下载二、Cursor安装三、Cursor编辑器快捷键(1) 基础编辑快捷键(2) 导航快捷键(3) 其他常用快捷键 一、Cursor下载 Cursor官方网站(https://www.cursor.com/ ) 根据自己电脑操作系统选择对应安装包 二、Cursor安装 下载完成后…...
Modbus TCP/IP 与 RS-485 接口的兼容性
Modbus TCP/IP 和 RS-485 接口的 直接兼容性 不存在,因为两者分属不同的网络层次(TCP/IP 基于以太网,RS-485 是物理层接口),但通过 协议转换和网络架构设计 可以实现互联互通。以下是详细的技术解析与实现方案: 一、协议差异对比 特性Modbus TCP/IPModbus RTU(RS-485)物…...
快速部署:在虚拟机上安装 CentOS 7 的详细步骤
CentOS是一个开源的基于Red Hat Enterprise Linux (RHEL) 的Linux发行版,它的主要目的是提供一个与RHEL相似的操作系统但不包含RHEL的商业支持和服务,完全免费。主要面向那些希望在企业环境中使用稳定、可靠的Linux系统但又不想支付RHEL许可证费用的用户…...
better-sqlite3之exec方法
在 better-sqlite3 中,.exec() 方法用于执行包含多个 SQL 语句的字符串。与预编译语句相比,这种方法性能较差且安全性较低,但有时它是必要的,特别是当你需要从外部文件(如 SQL 脚本)中执行多个 SQL 语句时。…...
NDT 代价函数
SLAM 中的 NDT 代价函数 在SLAM(同步定位与地图构建)中,NDT(Normal Distributions Transform)是一种常用的点云配准方法。NDT代价函数用于评估点云配准的质量。以下是NDT代价函数的详细介绍: NDT 代价函数…...
【有啥问啥】深入浅出:大模型应用工具 Ollama 技术详解
深入浅出:大模型应用工具 Ollama 技术详解 引言 近年来,大型模型(Large Models,LLMs)技术突飞猛进,在自然语言处理、计算机视觉、语音识别等领域展现出强大的能力。然而,部署和运行这些庞大的…...
【AI训练】如何提高LLM的训练速度
提高大型语言模型(LLM)的训练速度需要从算法优化、硬件加速、软件框架和基础设施等多个层面综合考虑。以下是一些关键方法,按类别分类说明: --- 一、硬件优化 1. 分布式训练 - 数据并行(Data Parallelism)…...
利用opencv_python(pdf2image、poppler)将pdf每页转为图片
1、安装依赖pdf2image pip install pdf2image 运行.py报错,因为缺少了poppler支持。 2、安装pdf2image的依赖poppler 以上命令直接报错。 改为手工下载: github: Releases oschwartz10612/poppler-windows GitHub 百度网盘: 百度网盘…...
大数据测试总结
总结测试要点: 参考产品文档,技术文档梳理以下内容 需求来源 业务方应用场景 数据源,数据格转,数据产出,数据呈现方式(数据消亡史),数据量级(增量,全量&am…...
pytorch高可用的设计策略和集成放大各自功能
在使用 PyTorch 编写模型时,为确保模型具备高可用性,可从模型设计、代码质量、训练过程、部署等多个方面采取相应的方法,以下为你详细介绍: 模型设计层面 模块化设计 实现方式:将模型拆分成多个小的、独立的模块,每个模块负责特定的功能。例如,在一个图像分类模型中,可…...
容器 /dev/shm 泄漏学习
容器 /dev/shm 泄漏的介绍 在容器环境中,/dev/shm 是一个基于 tmpfs 的共享内存文件系统,通常用于进程间通信(IPC)和临时数据存储。由于其内存特性,/dev/shm 的大小是有限的,默认情况下 Docker 容器的 /de…...
Redis面试常见问题——集群方案
Redis集群方案 在Redis中提供的集群方案总共有三种 主从复制 哨兵模式 分片集群 主从复制 单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离。 主从数据同步原理 单节点Redis的并发能力是有…...
