当前位置：首页 > news >正文

「git 系列」git 如何存储代码的？

news 2026/2/28 6:55:41

这里写自定义目录标题

git 文件存储位置
git 数据模型
示例分析
- 分析前准备
- - 命令
  - 哈希值
- 具体示例
不同版本的提交，git 做了什么工作？
snapshot vs delta-based vs backup
参考资料

git 文件存储位置

想要了解如何存储，首先需要知道存储位置。
当我们通过 git init 创建 git 仓库时，会创建.git 目录，.git 的目录结构如下：

├─hooks
├─info
├─logs
│  └─refs
│      ├─heads
│      └─remotes
│          └─origin
├─objects 
│  ├─07 
│  ├─13 
│  ├─2b 
│  ├─2d 
│  ├─3b 
│  ├─5a 
│  ├─5e 
│  ├─7e 
│  ├─94 
│  ├─fa 
└─refs├─heads├─remotes│  └─origin└─tags

其中 objects 目录中存储了所有的 git 对象，也是直接涉及数据文件存储的目录，其他目录在此不做讨论。

那么，想要了解 objects 目录中如何存储文件，就需要首先了解 git 的数据模型。

git 数据模型

git 数据模型分为三种：

blob 对象：存储文件数据，一个 blob 对象代表一个文件数据
tree 对象：存储文件和子目录的目录对象
commit 对象：也即快照，包含两个指针，分别指向 parent 以及 tree，此外还有作者以及提交信息

通过伪代码来认识这三个对象

type blob = array<byte>type tree = map<string, tree|file>type commit = struct {parent: array<commit>author: stringmessage: stringsnapshot: tree
}

示例分析

使用我本地的一次提交为例，分析一下这三种对象的效果。

分析前准备

命令

分析过程主要使用到两条命令。

git 中提供了 git cat-file 用来查看 git 对象，分析时主要使用的参数有：
- -t 查看对象的类型
- -p 查看对象的具体内容
git 还有 git log 可以查看提交记录，快速找到 commit 对象。

哈希值

git 在存储文件/目录之前，会首先根据文件/目录计算 40 位哈希值。其中：

前两位为子目录
后三十八位为文件名称

git 存储信息时以该哈希值做索引，而不是文件名。

哈希值通过 SHA-1 计算得出。

具体示例

首先通过 git log 获取提交历史

可以看到最初的一次提交对应的 commit 对象为 7ea1f87e133d400610a887ad9d9542cb03dc98ad。
查看 commit 对象

可以看到 commit 对象中包含了 tree 指针、作者、提交者、提交信息等内容，由于第一次提交，所以并没有 parent 指针。
查看 tree 对象

可以看到，该 tree 对象下还有一个 tree 对象以及三个文件 blob 对象。
查看 blob 对象

可以看到是一个非常简单的 go 文件。
查看第二次提交对象

此处已经有 parent 对象，指向了第一次提交 commit 对象。

通过上述过程，我们大体可以得出以下结论：

commit 对象以链式结构串联，代表了不同提交的版本信息
commit 对象中保留的 tree 对象包含了当前仓库的全部信息

不同版本的提交，git 做了什么工作？

以下图为例，数据库代表 commit 对象，目录代表 tree 对象，文件代表blob 对象。该图代表的场景为：

第一次提交时，commit1 对象指向 tree1 对象，tree1 对象中包含了 blob1对象以及 tree1-1对象。
第二次提交时，仅仅改变了 blob1 所代表的文件内容，其余并没改动。

从中可以看到，当第二次提交时， commit 对象（commit2）下创建一个新的 tree 对象（tree2）。对于第二次提交而言，tree1-1并未改动，因此 tree2 直接使用指针指向原有地址，blob1发生变动，则生成一个新的 blob 对象（blob2），并让 tree2 指向它。

完成上述操作后，commit2 对象包含了当前仓库的所有信息，这也就是当前时刻的 snapshot。

snapshot vs delta-based vs backup

对三者做一个简易对比。

snapshot 基于快照，
- 每次记录当前时刻仓库状态
- 获取当前版本信息，直接获取，因为每个版本都拥有整个仓库的所有信息
delta-based 基于差异，
- 每次更新记录该版本和上个版本的差异，
- 想获取当前版本信息，需要进行差异计算。
backup 备份
- 最原始的管理方法，每做一次改动，将代码全量备份到另一个位置
- 找某个版本数据，手动查找，无法（很难）得知版本差异。

参考资料

https://cloud.tencent.com/developer/article/1923502
git book

「git 系列」git 如何存储代码的？

这里写自定义目录标题 git 文件存储位置git 数据模型示例分析分析前准备命令哈希值具体示例不同版本的提交，git 做了什么工作？snapshot vs delta-based vs backup参考资料 git 文件存储位置想要了解如何存储，首先需要知道存储位置。当我…...

编程日记 2023/11/19 6:44:19

IDEA 集成 Docker 插件一键部署 SpringBoot 应用

目录前言IDEA 安装 Docker 插件配置 Docker 远程服务器编写 DockerFileSpringBoot 部署配置SpringBoot 项目部署结语前言随着容器化技术的崛起，Docker成为了现代软件开发的关键工具。在Java开发中，Spring Boot是一款备受青睐的框架，然而&…...

编程日记 2023/11/19 6:43:18

IDEA无法查看源码是.class,而不是.java解决方案？

问题：在idea中，ctrl鼠标左键进入源码，但是有时候会出现无法查看反编译的源码，如图！ 而我们需要的是方法1: mvn dependency:resolve -Dclassifiersources 注意：需要该模块的目录下，不是该文件目…...

编程日记 2023/11/19 6:42:17

机器视觉系统选型-定光照强度

同一个外形结构的光源，光照强度受如下影响： 单颗灯珠的亮度灯珠排列的数量和密度漫射板/防护板的材质（透明、半透明、全漫射） 在合理范围内提升光照强度，可降低对相机曝光时长的要求外形结构尺寸相同的两款光源&am…...

编程日记 2023/11/19 6:41:15

ChatGLM3-6B：新一代开源双语对话语言模型，流畅对话与低部署门槛再升级

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实…...

编程日记 2023/11/19 6:40:14

StoneDB顺利通过中科院软件所 2023 开源之夏结项审核

近日，中科院软件所-开源软件供应链点亮计划-开源之夏2023的结项名单正式出炉，经过三个月的项目开发和一个多月的严格审核，共产生 418个成功结项项目！其中，StoneDB 作为本次参与开源社区，社区入选的两个项目…...

编程日记 2023/11/19 6:39:11

Linux本地docker一键部署traefik+内网穿透工具实现远程访问Web UI管理界面

文章目录前言1. Docker 部署 Trfɪk2. 本地访问traefik测试3. Linux 安装cpolar4. 配置Traefik公网访问地址5. 公网远程访问Traefik6. 固定Traefik公网地址前言 Trfɪk 是一个云原生的新型的 HTTP 反向代理、负载均衡软件，能轻易的部署微服务。它支持多种后端 (D…...

编程日记 2023/11/19 6:38:11

SpringCloud FeignClient声明式服务调用采坑记录（A调用服务B/C，B/C重启后必须重启A后才能成功调用配置项）

SpringCloud FeignClient声明式服务调用（A调用服务B/C，B/C重启后必须重启A后才能成功调用配置项采坑记录） 1. 报错（info级别的警告信息）2. 原因：使用了默认了cache负载均衡，或者禁用了ribbonLoa…...

编程日记 2023/11/19 6:37:10

安装银河麒麟linux系统docker(docker-compose)环境，注意事项(一定能解决,有环境资源)

1：安装docker环境必须使用麒麟的版本如下 2：使用docker-compse up -d启动容器遇到的文件故障1：如果运行docker-compose up 报“Cannot create redo log files because data files are corrupt or the database was not shut down cleanly a…...

编程日记 2023/11/19 6:36:09

BUG:编写springboot单元测试,自动注入实体类报空指针异常

原因:修饰测试方法的Test注解导入错误造成错误的原因是 import org.junit.Test;正确的应该是 import org.junit.jupiter.api.Test前者是Junit4,后者是Junit5 junit4的使用似乎要在测试类除了添加SpringbootTest还要添加RunWith(SpringRunner.class) 同时要注意spring-boot-s…...

编程日记 2023/11/19 6:35:08

深度解析 InterpretML：打开机器学习模型的黑箱

深度解析 InterpretML：打开机器学习模型的黑箱机器学习模型的高性能往往伴随着模型的复杂性，这使得模型的决策过程变得不透明，难以理解。在这个背景下，可解释性机器学习成为了一个备受关注的领域。本文将介绍 InterpretML&#…...

编程日记 2023/11/19 6:34:06

数据结构初阶leetcodeOJ题（二）

目录第一题思路： 第二题思路第三题描述示例1 思路总结：这种类似的题，都是用快慢指针，相差一定的距离然后输出慢指针。第一题给你一个链表的头节点 head 和一个整数 val ，请你删除链表中所有满足 Node.val…...

编程日记 2023/11/19 6:33:06

若依框架数据源切换为pg库

一切换数据源在ruoyi-admin项目里引入pg数据库驱动 <dependency><groupId>org.postgresql</groupId><artifactId>postgresql</artifactId><version>42.2.18</version> </dependency>修改配置文件里的数据源为pg spring:d…...

编程日记 2023/11/19 6:32:05

java 访问sqlserver 和此驱动程序不支持jre1.8错误

sqlserver数据如下； TestSQL.java； import java.sql.*;public class TestSQL {public static void main(String[] args) throws ClassNotFoundException, SQLException {String driverName "com.microsoft.sqlserver.jdbc.SQLServerDriver";…...

编程日记 2023/11/19 6:31:04

C/C++字符判断 2021年12月电子学会青少年软件编程（C/C++）等级考试一级真题答案解析

目录 C/C字符判断一、题目要求 1、编程实现 2、输入输出二、算法分析三、程序编写四、程序说明五、运行结果六、考点分析 C/C字符判断 2021年12月 C/C编程等级考试一级编程题一、题目要求 1、编程实现对于给定的字符，如果该字符是大小写字母或…...

编程日记 2023/11/19 6:30:03

Kotlin语言实现单击任意TextVIew切换一个新页面，并且实现颜色变换

<LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:orientation"vertical"android:layout_height"match_parent">&…...

编程日记 2023/11/19 6:29:02

Flume学习笔记（4）—— Flume数据流监控

前置知识： Flume学习笔记（1）—— Flume入门-CSDN博客 Flume学习笔记（2）—— Flume进阶-CSDN博客 Flume 数据流监控 Ganglia 的安装与部署 Ganglia 由 gmond、gmetad 和 gweb 三部分组成。 gmond（Ganglia …...

编程日记 2023/11/19 6:28:01

使用webhook发送企业微信消息

文章目录使用webhook发送企业微信消息企业微信群机器人思路实现总结使用webhook发送企业微信消息企业微信群机器人思路实现 1，在企业微信中新建一个群 2，在设置里面添加机器人 3，拿到webhook地址在终端某个群组添加机器人之后&#xf…...

编程日记 2023/11/19 6:27:00

C语言的由来与发展历程

C语言的起源可以追溯到上世纪70年代，由Dennis Ritchie在贝尔实验室开发出来。C语言的设计目标是提供一种简洁、高效、可移植的编程语言，以便于开发底层的系统软件。在那个时代，计算机技术正在迅速发展，出现了多种高级编程语言&…...

编程日记 2023/11/19 6:25:57

python django 小程序博客源码

开发工具： PyCharm，mysql5.7，微信开发者工具技术说明： python django html 小程序功能介绍： 用户端： 登录注册（含授权登录） 首页显示搜索文章，文章分类&#xf…...

编程日记 2023/11/19 6:24:56

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造，完美适配AGV和无人叉车。同时，集成以太网与语音合成技术，为各类高级系统（如MES、调度系统、库位管理、立库等）提供高效便捷的语音交互体验。 L…...

编程新知 2026/2/25 11:42:21

【JavaEE】-- HTTP

1. HTTP是什么？ HTTP（全称为"超文本传输协议"）是一种应用非常广泛的应用层协议，HTTP是基于TCP协议的一种应用层协议。应用层协议：是计算机网络协议栈中最高层的协议，它定义了运行在不同主机上…...

编程新知 2026/2/28 4:33:03

django filter 统计数量按属性去重

在Django中，如果你想要根据某个属性对查询集进行去重并统计数量，你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求： 方法1：使用annotate()和Count 假设你有一个模型Item，并且你想…...

编程新知 2026/2/17 20:17:57

在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module

1、为什么要修改 CONNECT 报文？ 多租户隔离：自动为接入设备追加租户前缀，后端按 ClientID 拆分队列。零代码鉴权：将入站用户名替换为 OAuth Access-Token，后端 Broker 统一校验。灰度发布：根据 IP/地理位写…...

编程新知 2026/2/17 5:43:14

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类：块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

编程新知 2026/2/22 16:19:27

多模态大语言模型arxiv论文略读（108）

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题：CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者：Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

编程新知 2026/2/1 6:11:51

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求，并检查收到的响应。它以以下模式之一…...

编程新知 2026/2/20 22:08:35

iview框架主题色的应用

1.下载 less要使用3.0.0以下的版本 npm install less2.7.3 npm install less-loader4.0.52./src/config/theme.js文件 module.exports {yellow: {theme-color: #FDCE04},blue: {theme-color: #547CE7} }在sass中使用theme配置的颜色主题，无需引入，直接可…...

编程新知 2026/2/21 8:54:43