合并两个 DAG 的高效算法答案

【问题标题】：Efficient algorithm for merging two DAGs合并两个 DAG 的高效算法
【发布时间】：2011-05-27 20:09:13
【问题描述】：

我有两个加权 DAG（有向无环图）并且需要将它们合并为一个，因此我可以获得拓扑排序（在某些情况下可能超过两个）。问题是这些图都是非循环的，但可以一起形成一个循环。此外，图表很大（100k+ 节点，500k+ 边）。有没有一种巧妙的方法来合并图表？一种“一次”遍历所有图的算法同样好。

编辑：

“合并”是指将两个图的所有边和顶点组合在一起（当然保留权重），如果它们不创建循环的话。如果边缘已经存在，我想为它使用更大的权重。

这个想法是，从两个无环图开始应该比之后简单地“修复”结果更有优势（这意味着要找到 NP 难的反馈弧集，所以我想避免这种情况）。

感谢您的建议。

【问题讨论】：

合并是什么意思？请在数学上更加具体
感谢您的回答。我修改了问题以澄清。
创建循环后如何处理还不清楚。

标签： algorithm graph directed-acyclic-graphs

【解决方案1】：

我有一个类似的问题，我是这样解决的：

我将我的 DAG 转换为一个包含节点图（以节点 ID 为键，值是一组节点，可能是一个开始）和边图（以源、目标对为键，值是一组边缘，可能是一个开始）。我称之为规范化。原始图是“根”的集合，每个节点都有一个子节点的集合

然后，我可以通过键合并节点和键合并边缘来将其中两个合并在一起。即：如果节点确实存在，则将新节点转换为现有节点值，如果节点不存在，则添加它。与边缘相同。

这很干净，但没有避免循环。

这是我使用的一些代码（clojure）：

(def empty-graph
   {:nodes {}
    :edges {}})

(defn merge-graphs
  [a b]
  {:nodes (merge-with concat (get a :nodes) (get b :nodes))
   :edges (merge-with concat (get a :edges) (get b :edges))})

(defn normalize-graph
  [graph]
  {:nodes (->>
            graph
            (mapcat
              (fn [root]
                (->>
                  root
                  (tree-seq (fn [_] true) (fn [node] (get node :children)))
                  (mapcat
                    (fn [edge]
                      (concat
                        (if-let [source (get edge "source")]
                          [[source [source]]]
                          [])
                        (if-let [target (get edge "target")]
                          [[target [target]]]
                          [])))))))
            (into {}))
   :edges (->>
            graph
            (mapcat
              (fn [root]
                (->>
                  root
                  (tree-seq (fn [_] true) (fn [node] (get node :children)))
                  (filter (fn [edge] (and (not (nil? (get edge "source"))) (not (nil? (get edge "target")))))) ;this sucks but is necessary
                  (map
                    (fn [edge]
                      (let [compact (dissoc edge :children)]
                        [[(get edge "source") (get edge "target")] [compact]]))))))
            (into {}))})

【讨论】：

【解决方案2】：

一个问题是可能有不止一种解决方案。

以 DAG {(a,b),(a,c)} 和 {(b,a),(b,c)} 为例。您可以通过两种不同的方式“合并”它们：

{(a,b),(a,c),(b,c)}
{(a,c),(b,a),(b,c)}

解决方案的数量随着两个图联合中的循环数组合增长，因此对于您的大图，您可能有很多方法可以“合并”它们。

您是否有一个标准可以帮助您确定哪个 DAG 比另一个“更好”？

【讨论】：

【解决方案3】：

假设两个图的顶点相同，如果不是，考虑一下

V = V1 U V1

假设您有一个邻接列表。现在对于 V1 和 V2 中的每个顶点 v，您可以按边缘通向的顶点对邻接列表进行排序（如果是 (vertex, weight) 对，则按顶点排序）。这不应该那么昂贵，因为图表很小，它应该是summation degree(v)*log(degree(v))，应该不会那么糟糕。

在此之后，您可以迭代 V1 和 V2 中的所有顶点 v，并对 V1 和 V2 中的 v 的邻接列表进行合并排序。这类似于使用归并排序查找 2 个已排序数组的并集，只是在两个都出现的元素中，您可以选择较大的边。

【讨论】：