【问题标题】:Weighted bipartite graph clustering in RR中的加权二分图聚类
【发布时间】:2019-03-08 20:27:59
【问题描述】:

我有一个加权二部图,例如:

A   V   5
A   W   4
A   X   1
B   V   5
B   W   6
C   V   7
C   W   4
D   W   2
D   X   5
D   Z   7
E   X   4
E   Y   5
E   Z   8

structure(list(g1 = c("A", "A", "A", "B", "B", "C", "C", "D", 
"D", "D", "E", "E", "E"), g2 = c("V", "W", "X", "V", "W", "V", 
"W", "W", "X", "Z", "X", "Y", "Z"), w = c(5L, 4L, 1L, 5L, 6L, 
7L, 4L, 2L, 5L, 7L, 4L, 5L, 8L)), class = "data.frame", row.names = c(NA, 
-13L))

是否有一种聚类方法来检测组 1 和 2 之间的高度连接节点。例如在上面的示例中,似乎存在两个聚类:

A,B,C - V,W
D,E - X,Y,Z

我从二分包中找到了这个函数:https://www.rdocumentation.org/packages/bipartite/versions/2.11/topics/computeModules。但是,我想为每个集群提供某种 p 值或分数,告诉我它的“稳健性”。有什么想法吗?

m <- as_adjacency_matrix(graph_from_data_frame(g),attr = "w") %>% 
       as.matrix() %>% 
       computeModules()    
listModuleInformation(m)
[[1]]
[[1]][[1]]
[[1]][[1]][[1]]
[1] "A" "B" "C" "D" "E"

[[1]][[1]][[2]]
[1] "V" "W" "X" "Z" "Y"



[[2]]
[[2]][[1]]
[[2]][[1]][[1]]
[1] "A" "B" "C"

[[2]][[1]][[2]]
[1] "V" "W"


[[2]][[2]]
[[2]][[2]][[1]]
[1] "D" "E"

[[2]][[2]][[2]]
[1] "X" "Z" "Y"

谢谢,

【问题讨论】:

  • 您是否有一个示例说明如何为每个集群分配稳健性度量?据我所见,大多数将数字分配给整个聚类(因此您可以比较可以对顶点进行聚类的不同方式并选择最佳方式)而不是单个聚类。尽管您可以提出自己的衡量标准(例如(集群内的#edges)/(集群外的#edges)),但我不确定这是否能回答您的问题。
  • 能否请您包含代码以重现该图?
  • 一个简单的鲁棒性度量可以通过删除 1、2 到 k 条边,并查看 1 到 k 条边影响集群的排列。设 i 为移除边的数量,即稳健性的 -sortap 值,可以计算为基础集群相对于排列总数的排列数。这可以显式计算,也可以通过引导来计算。
  • 我认为答案是 a.) 主要是统计数据和 b.) 有点特定于应用程序,因为稳健性度量或 p 值取决于零假设或比较。您可以(例如)假设 h0:网络是一个具有恒定链接概率 p 的随机图,并通过生成随机边来模拟零值下的聚类算法的分布,然后回答诸如“当没有”,或者“当图中没有聚类结构时,节点 i 和 j 共享一个聚类的概率是多少”。
  • @Oliver 删除边是一种有趣的方法,但除了集群对观测测量误差的稳健性之外,我不清楚它将测试什么。

标签: r module cluster-analysis bipartite


【解决方案1】:

您是否考虑过使用 Watts/Strogatz 的聚类系数(也称为“传递性”)?它衡量一个节点的邻居相互连接的趋势。您可以计算网络中所有节点的聚类系数,然后在每个集群中的节点之间进行平均。结果将表明一个集群与一个 cliqe 的接近程度,即一个完全连通的子图。

传递性在 igraph 包中实现。

另请参阅wiki 页面,了解加权网络的概括。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-10-20
    • 2020-08-10
    • 2015-07-26
    • 1970-01-01
    • 1970-01-01
    • 2016-06-29
    • 2014-07-25
    相关资源
    最近更新 更多