网络中,高阶链接模式是控制和调节复杂系统的基本结构,大部分高阶结构是指一个小的子图,这种小的子图是复杂系统的建筑块。例如,正反馈回路是调控网络的关键要素,三元组是社交网络的关键,双向开三角结构是大脑hub节点的关键,开三角结构是航空网络的关键模式。这里介绍高阶结构,并提出一种聚类框架。
给定一个网络模块M,寻找一种聚类S以满足两种目标。首先,节点应参与尽量多的模块M,其次集合S应避免破坏模块M。即,给定模块M,高阶聚类方法的目标是最小
ϕM(S)=cutM(S,S¯¯¯)/min[volM(S),volM(S¯¯¯)](1)
cutM(S,S¯¯¯)是被分割开来的M的个数,volM(S)是S中M的节点数。算法借鉴谱聚类的方法,算法流程是
1.给定一个网络和一种模块M,算出矩阵WM,其中元素(i,j)表示节点i,j共现于M中的次数。
2.计算由WM产生的拉普拉斯谱排序σ。
3.找到σ排序的前r个组成的集合作为Sr={σ1,…,σr},依据是S:=argminrϕM(Sr)。
我们的方法统一了模块分析和网络聚类这两个基础方向,揭示了组织结构和模块。之前的分析没有给出最差情况下的聚类保证,以及随网络规模增加而导致的复杂度,补充材料里的理论结果说明了超图聚类方法对于特殊的有向图是更加通用的。
考虑无向图G=(V,E),|V|=n,进一步假设没有独立点,W记为图的权重,对角矩阵D记为Dii=∑nj=1Wij,拉普拉斯矩阵为L=D−W。对于集合S,则ϕ(G)(S)为
ϕ(G)(S)=cut(G)(S,S¯¯¯)/min(vol(G)(S),vol(G)(S¯¯¯))(3)
cut(G)(S,S¯¯¯)=∑i∈S,j∈S¯¯¯¯Wij(4)
vol(G)(S)=∑i∈SDii(5)
cut(G)(S,S¯¯¯)=weighted sum of edges that are cut(6)
vol(G)(S)=weighted number of edge end points in S(7)
x表示集合S的向量,xi=1表示节点i在S中,xi=0表示节点i在S¯¯¯中,若边(i,j)被分开,则(xi−xj)2=1,反之(xi−xj)2=0,于是
xTLx=cut(G)(S,S¯¯¯)=∑(i,j)∈Ewij(xi−xj)2(9)
在这里定义(B,A),其中B是一个k×k的二值矩阵,A是一个节点集合,B编码连边模式,A表示模块的子集,在很多时候A表示节点的整个集合。set(⋅)将有序元组变成无序元组,set((v1,v2,…,vk))={v1,v2,…,vk},
M(B,A)={(set(v),set(χA(v)))|v∈Vk,v1,…,vk}(10)
若χA(v)=v,则为simple motifs,否则为anchored motifs。
公式(10)可以重新写为
cut(G)M(S,S¯¯¯)=∑(v,χA(v))∈M1(∃i,j∈χA(v)|i∈S,j∈S¯¯¯)(17)
vol(G)M(S)=∑(v,χA)∈M∑i∈χA(v)1(i∈S)(18)
(WM)ij=∑(v,χA)∈M1({i,j})⊂χA(v))(20)
(DM)ii=∑nj=1(WM)ij,LM=DM−WM,最后LM=D−1/2MLMD−1/2M=I−D−1/2MWMD−1/2M,使用特征向量LM进行分类。


引理1.令G=(V,E)为一个无权重有向图,GM是基于模块的有权重图,|A|≥2则对于任意S⊂V,有
vol(G)M(S)=1|A|−1vol(GM)(S)
引理2.令xi,xj,xk∈{−1,1},则
4⋅1(xi,xjxk not all the same)=x2i+x2j+x2k−xixj−xjxk−xkxi
引理3.令z∈{0,1}n,若zi=1则xi=1,若zi=1则xi=−1,则对于L=D−W,有4zTLz=xTLx。
引理4.令G=(V,E)有向无权重图,GM是基于|A|=3的模块的有权重图,对于S⊂V,有
cut(G)M(S,S¯¯¯)=12cut(GM)(S,S¯¯¯)
定理5.令G=(V,E)有向无权重图,WM有权重邻接矩阵,且模块|A|=3,则对于S⊂V,有
ϕ(G)M(S)=ϕ(GM)(S)
定理6.假设使用算法1找到较好的集合S,令ϕ∗=minS′ϕ(G)M(S′)为最优集合,则
1.ϕ(G)M≤4ϕ∗−−√ and
2.ϕ∗≥λ2/2
引理7.令xi,xjxk,xl∈{−1,1},则有
8⋅1(xi,xj,xk,xl not all the same)=(7−xixj−xixk−xixl−xjxk−xjxl−xkxl−xixjxkxl)(21)
引理8.令G=(V,E)有向无权重图,GM基于|A|=4模块有权重图,则对于S⊂V,有
cut(G)M(S,S¯¯¯)=13cut(GM)(S,S¯¯¯)−∑(v,{i,j,k,l}∈M)13⋅1(exactly two of i,j,k,l in S)
定理9.令G=(V,E)有向无权重图,WM基于|A|=4模块邻接矩阵,则对于S⊂V,有
ϕ(G)M(S)=ϕ(GM)(S)−∑(v,{i,j,k,l})∈M1(exactly two of i,j,k,l in S)vol(GM)(S)