本例采用两个项目以及两个公共类库演示对submodule
的操作。因为在一些资料或者书上的例子都是一个项目对应1~N个lib,但是实际应用往往并不是这么简单。
准备环境
创建需要的本地仓库:
初始化工作区:
初始化项目
初始化project1
:
我在此用的是相对路径,若有问题请用绝对路径。
初始化project2
:
初始化公共类库
初始化公共类库lib1:
初始化公共类库lib2:
为主项目添加Submodules
为project1添加lib1和lib2
查看已下公共类库的内容
好了,到目前为止我们已经使用git submodule add
命令为project1
成功添加了两个工共类库(lib1、lib2),查看了当前的状态发现添加了一个新文件.gitmodules
和两个文件夹libs/lib1、libs/lib2
,那么新增的.gitmodules
是做什么用的呢?我们查看以下文件内容便知晓了。
原来如此,.gitmodules
记录了每个submodule
的引用信息,知道在当前项目的位置以及仓库的所在。
好的,我们现在把更改提交到仓库。
假如你是第一次引入工共类库的开发人员,那么项目组的其他成员怎么Clone
带有Submodule
的项目呢,下面我们再clone
一个项目讲解如何操作。
Clone带有Submodule的仓库
模拟开发人员B…
看到submodules
的状态是hash
码和文件目录,但是注意前面有一个减号
,含义是该子模块还没有检出。
OK,检出project1-b
的submodules
…
读者可以查看: .git/config
文件的内容,最下面有submodule
的注册信息!
验证一下类库的文件是否存在:
上面的两个命令(git submodule init & update)其实可以简化,后面会讲到!
修改Submodule
我们在开发人员B的项目上修改Submodule
的内容。
先看一下当前Submodule
的状态:
我们可以看到HEAD不指向分支。
Git对于Submodule
有特殊的处理方式,在一个主项目中引入了Submodule
其实Git做了3件事:
- 记录引用的仓库
- 记录主项目中
Submodule
的目录位置 - 记录引用
Submodule
的commit id
在project1
中push
之后其实就是更新了引用的commit id
,然后project1-b
在clone
的时候获取到了submodule
的commit id
,然后当执行git submodule update
的时候git
就根据gitlink
获取submodule
的commit id
,最后获取submodule
的文件,所以clone
之后不在任何分支上;但是master
分支的commit id
和HEAD
保持一致。
现在我们要修改lib1
的文件需要先切换到master
分支:
在主项目中修改Submodule
提交到仓库稍微繁琐一点,在git push
之前我们先看看project1-b
的状态:libs/lib1(new commits)
状态表示libs/lib1
有新的提交,这个比较特殊,看看project1-b
的状态:
从状态中可以看出libs/lib1
的commit id
由原来的3ee623ea26cd10ec58c1f1fa4f5869e488e0cfc1
更改为d176f81129a28e5cb25c2b285818ed0202be7e58
注意:如果现在执行了git submodule update
操作,那么libs/lib1
的commit id
又会还原到3ee623ea26cd10ec58c1f1fa4f5869e488e0cfc1
,这样的话刚刚的修改是不是就丢死了呢?不会,因为修改已经提交到了master
分支,只要再git checkout master
就可以了。
现在可以把libs/lib1
的修改提交到仓库了。
现在仅仅只完成了一步,下一步要提交project1-b
引用submodule
的commit id
:
OK,大功告成,我们完成了Submodule
的修改并把libs/lib1
的最新commit id
提交到了仓库。
接下来要看看project1
怎么获取submodule
了。
更新主项目的Submodules
好的,让我们进入project1
目录同步仓库:
我们运行了git pull
命令和git status
获取了最新的仓库源码,然后看到了状态是modified
,这是为什么呢?
我们用git diff
比较一下不同:
从diff
的结果分析出来是因为submodule
的commit id
更改了,我们前面刚刚讲了要在主项目更新submodule
的内容,首先要提交submodule
的内容,然后再更新主项目中引用的submodule commit id
;现在我们看到的不同就是因为刚刚更改了project1-b
的submodule commit id
;好的,我们来学习下怎么更新project1
的公共类库。git submodule update
是更新子模块仓库。
如果没有更新,是因为子模块是在project1
中引入的,git submodule add repos/lib1.git libs/lib1
命令的结果,操作之后git
只是把lib1
的内容clone
到了project1
中,但是没有在仓库注册。需要输入git submodule init
, 再进行git submodule update
在仓库注册后的结果如下:
上面的结果足以证明刚刚的推断,所以记得当需要更新子模块的内容时请先确保已经运行过git submodule init
。
为project2添加lib1和lib2
这个操作对于读到这里的你来说应该是很熟的了:
我们一次执行了添加submodule
并commit
和push
到仓库,此阶段任务完成。
修改lib1和lib2并同步到project1和project2
假如开发人员C同时负责project1
和project2
,有可能在修改project1
的某个功能的时候发现lib1
或者lib2
的某个组件有bug需要修复,这个需求多模块和大型系统中经常遇到,我们应该怎么解决呢?
假如我的需求如下:
- 在
lib1
中添加一个文件:README,用来描述lib1
的功能。 - 在
lib2
在的lib2-features
文件中添加一些文字:学习Git submodule的修改并同步功能
在lib1中添加一个文件:README
前面提到过现在仅仅只完成了一部分,我们需要在project2
中再更新lib1
的commit id
:
我们暂时不push
到仓库,等待和lib2
的修改一起push
。
在lib2中的lib2-features文件中添加文字
同步project2的lib1和lib2的修改到project1
既然project1和project2属于同一个风格,或者调用同一个功能,要让这两个(可能几十个)项目保持一致。
看看上面的结果对吗?为什么lib1
和lib2
更新了但是没有显示new commits
呢?为什么我明明提交了但是从project1
更新不到任何改动呢?
帮大家分析一下问题,不过在分析之前先看看当前(project1
和project2
)的submodule
状态:
两个项目有两个区别:
commit id
各不相同libs/lib1
所处的分支不同
更新project1的lib1和lib2改动
我们还记得刚刚在project2
中修改的时候把lib1
和lib2
都切换到了master
分支,目前project1
中的lib1
不在任何分支,我们先切换到master
分支。
果不其然,我们看到了刚刚在project2
中修改的内容,同步到了project1
中,当然现在更新了project1
的lib1
,commit id
也会随之变动。
现在最新的commit id
和project2
目前的状态一致,说明真的同步了;好的,现在可以使用相同的方法更新lib2
了。
更新project1的submodule引用
在上面我们更新了project1
的lib1
和lib2
的最新版本,现在要把最新的commit id
保存到project1
中以保持最新的引用。
更新project1-b项目的子模块(使用脚本)
Git提示lib1
和lib2
有更新内容,这个判断的依据来源于submodule commit id
的引用。
现在怎么更新呢?难道还是像project1
中那样进入子模块的目录然后git checkout master
,接着git pull
?
而且现在仅仅才两个子模块、两个项目,如果在真是的项目中使用的话可能几个到几十个不等,再加上N个submodule
,自己算一下要怎么更新多少个submodule
?
工欲善其事,必先利其器。写一个脚本代替手动任务。
牛刀小试
我们通过分析.gitmodules
文件得出子模块的路径,然后就可以根据这些路径进行更新。
上路
把下面的脚本复制到bin/update-submodules.sh
中
解释下上面的脚本执行过程:
- 首先把子模块的路径写入到文件
tmp/sutdy-git-submodule-dirs
中; - 然后读取文件中的子模块路径,一次切换到
master
分支(修改都是在master
分支上进行的),最后更新最近改动。
2018-08-18更新
一个命令就可以代替上面的bin/update-submodules.sh
的功能。
此命令与脚本一样,循环进入(enter)每个子模块的目录,然后执行foreach
后面的命令。
该后面的命令可以任意的,例如
git submodule foreach ls -l
可以列出每个子模块的文件列表。
体验工具带来的便利
添加执行权限
更新之后的两个变化:
git submodule
的结果和project2
的submodule commit id
保持一致;project1-b
不再显示new commits
了。
现在可以把工具添加到仓库了。
新员工加入团队,一次性clone项目和Submodule
一般人使用的时候都是使用如下命令:
新员工不耐烦了,嘴上不说但是心里想,怎么那么麻烦?
上面的命令简直弱爆了,直接一行命令搞定:
recursive
参数的含义:可以在clone项目时同时clone
关联的submodules
。
使用一键方式克隆project2
舒服……
移除Submodules
我们从project1.git
克隆一个项目用来练习移除submodule
:
Step by
1、删除git cache
和物理文件夹
2、删除.gitmodules
的内容(或者整个文件)
因为本例只有两个子模块,直接删除文件:
如果仅仅删除某一个submodule
,那么打开.gitmodules
文件编辑,删除对应submodule
配置即可。
3、删除.git/config
的submodule
配置
源文件:
删除后:
4、提交更改