搞懂 Git 工作原理,遇到问题不再瞎蒙
bigegpt 2024-10-27 08:18 3 浏览
【此文章转自乐字节】
在开始本篇文章之前,读者可以先试着回答以下几个问题:
- 是否了解工作区、暂存区、仓库之间的区别?
- Git的常用命令在三大区域中是如何工作的?
- 分支是如何合并的?原理是什么?
- 分支合并中rebase和merge的区别?
如果有回答不出的,那么建议还是往下仔细看看文章吧~
三大分区
我们首先用一张图来理解工作区、暂存区和仓库的位置:
我们先看由下而上的路径,首先工作区就是我们当前的文件目录,我们改完代码,用git add命令把当前文件加入暂存区,然后git commit把暂存区生成的快照提交到本地仓库,最后再用git push命令把本地仓库的提交复制到远程仓库,也就是Github之类的在线仓库。
而由上到下的路径其实也很好理解,git pull用来将远程仓库的最新提交拉取到本地仓库,git reset -- files 用来撤销最后一次git add files,也就是撤销commit,这是我们前面提到的回滚的一种办法;git checkout -- files则是把文件从暂存区复制到工作区,用来丢弃本地修改(也就是覆盖掉还未add到暂存区的改动)。
常用命令的工作原理
先来个开胃小菜:
diff
上一篇文章中我们讲了git diff可以直观的看到工作区和暂存区的差异,这里我们画图演示下不同的diff是如何比较的:
- git diff,不加任何参数,将工作区(未add的内容)和暂存区进行比较;
- git diff HEAD,将工作区与HEAD指针指向的commit进行比较,一般来说我们当前的改动就是在HEAD指向的commit的基础上进行改动;
- git diff --cached,将暂存区与当前commit进行比较;
- git diff dev,将工作区与目标分支的最新commit进行比较;
- git diff [commitId_1] [commitId_2],将两个commit进行比较。
commit
前面我们说了,commit会在暂存区生成快照,然后推到本地仓库,这里我们考虑三种情况下的提交:
- 当前HEAD指向末尾的commit:
- 当前HEAD指向中间的commit,此时提交就会再分离出一条新的路线,因此后续的分支合并就不可避免地要派上用场。
- 希望用新提交覆盖前一个提交:git commit --amend:
这个使用场景也非常广泛,比如我们git commit后才发现漏改了点东西,这个时候如果再改再提交,就会导致对一个错误的修改用了两个commit,在git log上看将会非常丑,对于我们自己做小demo时可能无所谓,对于一些大项目或者开源项目,本来commit就很多,这样胡乱地增加commit必然是不能接受的。
如上图所示,我们新增的commit会代替原来的commit的位置,而旧commit则被抛弃掉。
checkout
当我们使用git checkout [branch_name]切换分支时,如下图所示:
dev分支会把其中的内容复制到暂存区和工作区中,覆盖掉master的版本,而只存在于master的文件则会被删除。
reset
下图展示了回滚的情况,具体的三种情况请仔细看下方的描述:
- git reset [commitId] --sort,这是最弱的回滚方式,只改变commit信息,不影响暂存区和工作区;
- git reset [commitId],不携带参数时,默认只回滚暂存区,也就是把dks8v所在的信息复制到暂存区,但是不影响工作区;
- git reset [commitId] --hard,这种方式则能回滚工作区和暂存区。
merge
Git的合并有许多策略,默认情况下Git会帮助我们挑选合适的策略,当然如果我们需要手动指定,可以使用:git merge -s [策略名称],了解 Git 合并策略的原理可以使你对合并结果有一个准确的预期。
Fast-forward
Fast-forward是最简单的一种合并策略,如我们前面示例的图所示,dev分支是master分支的祖先节点,那么合并git merge dev的话,只会将dev指向master当前位置,Fast-forward是Git合并两个没有分叉的分支时的默认行为。
Recursive
Recursive是Git在合并两个有分叉的分支时的默认行为,简单的说,是递归的进行三路合并。
这里出现了一个新名词——三路合并(three-way merge),也是我们接下来讲解的重点。我们先搞清楚合并的整体链路。
- 首先dev分支的c5k8x与HEAD指向的sf22x,再加上它们的最近公共祖先a23c4先进行一次三路合并;
- 然后将合并后的结果拷贝到暂存区和工作区;
- 再然后产生一次新的提交,该提交的祖先为dev和原master;
分支合并的原理
首先,我们来看看两个文件如何合并:
下图所示为test.py中某一行的代码,如果我们要将A/B两个版本合并,就需要确定是A修改了B,还是B修改了A,亦或者两者都修改了,显然这种情况下分辨不出来。
因此,为了实现两个文件的合并,我们引入三路合并:
如下图所示,很显然A与Base版本相同,B版本的修改比A版本新,因此将A/B合并后,得到的就是B版本。
聪明的读者看完上面的例子,就会想到,要是A/B和Base都不一样怎么办?这就是接下来要讲的问题了。
冲突
当出现下图这种情况时,一般就需要我们手动解决冲突了。
也就是我们在合并代码时往往会看到的一种情况:
<<<<<<< HEAD
print("hello")
=======
print("fxxk")
>>>>>>> B
对于新手而言,看到这个箭头可能有点摸不着头脑,到底哪个是哪个呢?其实分辨起来很简单,中间的=======是分隔符,到最上方的<<<<<<之间的内容,是HEAD版本,也就是当前的master分支,而到最下方>>>>>>之间的内容,则是分支B的,我们只需要删除箭头,保留所需要的版本即可:
print("hello")
最终合并结果:
递归三路合并
在实际的生产环境中,Git的分支往往非常繁杂,会导致合并A/B时,能找到多个A/B的共同祖先,而所谓的递归三路合并就是,对它们的共同祖先继续找共同祖先,直到找到唯一一个共同祖先为止,这样可以减少冲突的概率。
如上图所示,我们要合并5和6,就需要先找到5/6的共同祖先——2和3,然后再继续找共同祖先——1,当我们找到唯一祖先时,开始递归三路合并,先对1、2、3进行三路合并,得到临时节点2'/B:
接下来继续对2、5、6进行三路合并,得到7/C:
rebase
当我们处于dev分支,然后使用git rebase master时,可以理解为把dev分支上的部分在master分支后面重新提交了一遍(重演),具体看下图:
首先找到dev分支和master分支的祖先a23c4,然后从a23c4到dev所在路径上的节点,都通过回放的方式插入到master之后,注意,这里“复制”的过程中,commitId是会改变的。同时,dev旧分支上的节点因为没有了引用则会被丢弃。
总结
回顾开头的问题,相信仔细阅读完本篇文章的你已经可以解答了。本篇文章更多聚焦在Git的工作原理上,但对于底层原理还未展开叙述,下一篇我们会对Git底层到底是如何存储文件,如何实现进行讲解,敬请期待。
最后
有帮助的话,各位朋友们可以点个赞收藏支持下啦!??
也欢迎关煮乐字节哩哩,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!
相关推荐
- AI「自我复制」能力曝光,RepliBench警示:大模型正在学会伪造身份
-
科幻中AI自我复制失控场景,正成为现实世界严肃的研究课题。英国AISI推出RepliBench基准,分解并评估AI自主复制所需的四大核心能力。测试显示,当前AI尚不具备完全自主复制能力,但在获取资源...
- 【Python第三方库安装】介绍8种情况,这里最全看这里就够了!
-
**本图文作品主要解决CMD或pycharm终端下载安装第三方库可能出错的问题**本作品介绍了8种安装方法,这里最全的python第三方库安装教程,简单易上手,满满干货!希望大家能愉快地写代码,而不要...
- pyvips,一个神奇的 Python 库!(pythonvip视频)
-
大家好,今天为大家分享一个神奇的Python库-pyvips。在图像处理领域,高效和快速的图像处理工具对于开发者来说至关重要。pyvips是一个强大的Python库,基于libvips...
- mac 安装tesseract、pytesseract以及简单使用
-
一.tesseract-OCR的介绍1.tesseract-OCR是一个开源的OCR引擎,能识别100多种语言,专门用于对图片文字进行识别,并获取文本。但是它的缺点是对手写的识别能力比较差。2.用te...
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
-
号称“OpenAI迄今为止最强模型”,o3/o4-mini真实能力究竟如何?就在发布后的几小时内,网友们的第一波实测已新鲜出炉。最强推理模型o3,即使遇上首位全职提示词工程师RileyGoodsid...
- 使用Python将图片转换为字符画并保存到文件
-
字符画(ASCIIArt)是将图片转换为由字符组成的艺术作品。利用Python,我们可以轻松实现图片转字符画的功能。本教程将带你一步步实现这个功能,并详细解释每一步的代码和实现原理。环境准备首先,你...
- 5分钟-python包管理器pip安装(python pip安装包)
-
pip是一个现代的,通用、普遍的Python包管理工具。提供了对Python包的查找、下载、安装、卸载的功能,是Python开发的基础。第一步:PC端打开网址:选择gz后缀的文件下载第二步:...
- 网络问题快速排查,你也能当好自己家的网络攻城狮
-
前面写了一篇关于网络基础和常见故障排查的,只列举了工具。没具体排查方式。这篇重点把几个常用工具的组合讲解一下。先有请今天的主角:nslookup及dig,traceroute,httping,teln...
- 终于把TCP/IP 协议讲的明明白白了,再也不怕被问三次握手了
-
文:涤生_Woo下周就开始和大家成体系的讲hadoop了,里面的每一个模块的技术细节我都会涉及到,希望大家会喜欢。当然了你也可以评论或者留言自己喜欢的技术,还是那句话,希望咱们一起进步。今天周五,讲讲...
- 记一次工控触摸屏故障的处理(工控触摸屏维修)
-
先说明一下,虽然我是自动化专业毕业,但已经很多年不从事现场一线的工控工作了。但自己在单位做的工作也牵涉到信息化与自动化的整合,所以平时也略有关注。上一周一个朋友接到一个活,一家光伏企业用于启动机组的触...
- 19、90秒快速“读懂”路由、交换命令行基础
-
命令行视图VRP分层的命令结构定义了很多命令行视图,每条命令只能在特定的视图中执行。本例介绍了常见的命令行视图。每个命令都注册在一个或多个命令视图下,用户只有先进入这个命令所在的视图,才能运行相应的命...
- 摄像头没图像的几个检查方法(摄像头没图像怎么修复)
-
背景描述:安防监控项目上,用户的摄像头运行了一段时间有部分摄像头不能进行预览,需要针对不能预览的摄像头进行排查,下面列出几个常见的排查方法。问题解决:一般情况为网络、供电、设备配置等情况。一,网络检查...
- 小谈:必需脂肪酸(必需脂肪酸主要包括)
-
必需脂肪酸是指机体生命活动必不可少,但机体自身又不能合成,必需由食物供给的多不饱和脂肪酸(PUFA)。必需脂肪酸主要包括两种,一种是ω-3系列的α-亚麻酸(18:3),一种是ω-6系列的亚油酸(18:...
- 期刊推荐:15本sci四区易发表的机械类期刊
-
虽然,Sci四区期刊相比收录在sci一区、二区、三区的期刊来说要求不是那么高,投稿起来也相对容易一些。但,sci四区所收录的期刊中每本期刊的投稿难易程度也是不一样的。为方便大家投稿,本文给大家推荐...
- be sick of 用法考察(be in lack of的用法)
-
besick表示病了,做谓语.本身是形容词,有多种意思.最通常的是:生病,恶心,呕吐,不适,晕,厌烦,无法忍受asickchild生病的孩子Hermother'sverysi...
- 一周热门
- 最近发表
-
- AI「自我复制」能力曝光,RepliBench警示:大模型正在学会伪造身份
- 【Python第三方库安装】介绍8种情况,这里最全看这里就够了!
- pyvips,一个神奇的 Python 库!(pythonvip视频)
- mac 安装tesseract、pytesseract以及简单使用
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
- 使用Python将图片转换为字符画并保存到文件
- 5分钟-python包管理器pip安装(python pip安装包)
- 网络问题快速排查,你也能当好自己家的网络攻城狮
- 终于把TCP/IP 协议讲的明明白白了,再也不怕被问三次握手了
- 记一次工控触摸屏故障的处理(工控触摸屏维修)
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)