【问题标题】:How to merge history from unrelated repositories如何合并来自不相关存储库的历史记录
【发布时间】:2017-11-07 16:06:21
【问题描述】:

我有一个关于 SVN 的旧项目是这样组织的:

  • /some/sub-directories/a/trunk/foo
  • /some/sub-directories/b/trunk/foo
  • /some/sub-directories/c/trunk/foo

我使用GitHub工具git-import-svn-raw迁移了三个Git仓库下的这三个仓库:

  • a.git
  • b.git
  • c.git

我用这个命令去掉了路径

git filter-branch --prune-empty --subdirectory-filter \
/some/sub-directories/a/trunk/foo master

现在我想将所有这三个项目的历史记录导入到同一个存储库中,其中我有三个目录abc

bundle.git/
   a/
   b/
   c/

这个想法不是合并子树,而是将每个单独的子目录的历史交织在一起。

这可能吗?

注意:将整个 SVN 存储库转换为单个存储库会更容易,但它不起作用。 git-import-svn-raw 工具有很多问题。 git svn clone --stdlayout 也出现了同样的问题,需要单个存储库,但情况并非如此。我也尝试过svn2git,但它也不起作用。

【问题讨论】:

  • 如果这些是真正不相关的项目,我建议不要将它们放在一个存储库中。 Git 不是 Subversion,在进行切换时应该改掉一些旧习惯。
  • 确实有完全相关的

标签: git svn


【解决方案1】:

我建议不要使用“bundle”作为 repo 的名称,因为bundle 对 git 意味着其他东西。为避免混淆问题,我将在整个答案中使用您的术语,但我会使用不同的名称。

因此很容易将所有提交放到同一个 repo 中。

cd bundle.git
git remote add a ../a.git
git remote add b ../b.git
git remote add c ../c.git
git fetch --all

现在你有像remote/a/masterremote/b/masterremote/c/master 这样的引用。

A1 -- A2 -- A3 -- A4 <--(a/master)

B1 -- B2 -- B3 -- B4 <--(b/master)

C1 -- C2 -- C3 -- C4 <--(c/master)

(master)

请注意,我假设您从 master 开始没有提交(“未出生”分支),并且它仍处于该状态。

接下来,获得包含组合内容的单个提交也不难。例如,您可以这样做:

git reset --hard a/master
get merge --allow-unrelated-histories b/master
git merge --allow-unrelated-histories c/master

这会给你

               (a/master)
                   v
A1 -- A2 -- A3 -- A4 -- M1 ------------- M2 <--(master)
                       /                /
B1 --- B2 --- B3 --- B4 <--(b/master)  /
                                      /
C1 -------- C2 -------- C3 -------- C4 <--(c/master)

这个历史是完整和正确的,但是历史提交没有交错并且它们没有组合内容(TREE 对象)。因此,如果您查看B3,您将看不到ac 在相应时间的样子。

这可能已经足够了。 log 的输出将默认按时间倒序排列,您可以提供排序选项来准确影响此历史的排序方式(请参阅 git log 文档)。但这不是你要求的......

所以下一步你可以

git rebase -i --root master

这将打开一个显示所有提交的“TODO”列表;但是您必须手动找出您希望它们交错的顺序。 (默认顺序遵循每个分支,一次一个。)所以这可能非常乏味。您可以使用git log 输出找出正确的顺序,然后相应地重新排列 TODO 列表。

更新:我想到我应该添加一些关于rebase 步骤的警告。

首先,上面只明确提到了master 分支。当然,每个 repo 都可以有额外的分支,您必须决定如何反映这些分支。也许您会决定分支点(来自分支的master 的第一个提交)应该保持不变,并且分支根本不会有来自其他存储库的更改交错进入它(假设这不会导致分支名称碰撞)。或者,也许您会决定以某种方式组合来自每个源代码库的相应分支。

其次,如果原始历史中有合并,那么您必须决定如何在变基中处理它们。如果合并包含冲突解决方案,或者是“邪恶的合并”(即引入相对于默认合并结果的更改的合并),这尤其是一个问题。上述过程将尝试生成单一的线性历史。如果这不是你想要的,那么很难做到这一点,因为如果你告诉rebase 保持合并,那么它也会保持三个历史分开。 (此外,--preserve-merges 不能很好地与 --interactive / -i 混合。)

因此,上述方法适用于相对简单的历史,而对于更复杂的历史,这可能不是一件实际的事情。

【讨论】:

    【解决方案2】:

    另请参阅https://stackoverflow.com/a/34861819/933106,了解另一种根据提交时间戳“压缩”两个存储库的方法。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-04-18
      • 1970-01-01
      • 2019-01-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-06-28
      相关资源
      最近更新 更多