1. Centrality
1). 度中心性
在社会网络中,对于具有更多连接关系的结点,度中心性度量方法认为他们具有更高的中心性。可以利用结点的度来衡量连接关系。在无向图中,结点vi的度中心性Cd是:
Cd(vi) = di。
其中di是结点vi的度(邻接边的数量)。在有向图中,既可以利用入度或者初度,也可以将2者相结合起来作为度中心性值:
Cd(vi) = diin(声望)
Cd(vi) = diout(合群性)
Cd(vi) = diin + diout
度中心性的归一化
2). 特征向量中心性
在度中心性度量中,我们认为具有较多连接的结点更重要。然而在现实中,拥有更多朋友并不能确保这个人就是重要的,拥有更多重要的朋友才能提供更有力的信息。
因此,我们试图用邻居结点的重要性来概括本结点的重要性。设ce(vi)表示结点vi的特征向量中心性,则其求解公式如下:
3). Katz中心性
在特征向量中心性度量中,会有这么一个问题:某个点被大量的关注,但是关注该点的点的中心性很低(甚至为0),这样会导致网络中存在被大量关注但中心值却为0的点。因此,我们需要在特征向量中心性度量的基础上加入一个偏差项(或者说是中心值下限),来解决这个问题。
写成矩阵形式为:
4).PageRank
Katz在某些情况下存在一些与特征向量中心性相似的问题。在有向图中,一旦一个结点成为一个权威结点(高中心值结点),它将向它所有的外连接传递其中心性,导致其它结点中心性变的很高。但这是不可取的,因为不是每一个被名人所知的人都是有名的。
因此我们在katz中心性的基础上,累加时让每一个邻居的中心性除以该邻居结点的出度,这种度量称为PageRank:
5). betweenness
另一种中心性度量方法是考虑结点在连接其他结点时所表现出的重要性。其中一种方法是计算其他结点间通过结点vi的最短路径的数目:
其中,segma st 是从结点s到结点t的最短路径数目,segma st (vi) 是从s到t经过vi的最短路径数目。也就是说,我们在度量结点vi在连接结点s和结点t时所表现的重要性。这种度量方法称为中间中心性(betweenness centrality)
6). closeness
接近中心性的思想是结点越趋于中心,它们越能快速地到达其他的结点。更形式化的描述,这些结点满足与其他结点之间有最小的平均最短路径。
接近中心性被定义为:
2. Network Models
1). 随机图模型
随机网络(如ER模型),连接是随机设置的,但大部分节点的连接数目会大致相同,即节点的分布方式遵循钟形的泊松分布,有一个特征性的“平均数”。连接数目比平均数高许多或低许多的节点都极少,随着连接数的增大,其概率呈指数式迅速递减。故随机网络亦称指数网络。
2). 小世界模型
在网络理论中,小世界网络是一类特殊的复杂网络结构,在这种网络中大部份的节点彼此并不相连,但绝大部份节点之间经过少数几布就可到达。
在日常生活中,有时你会发现,某些你觉得与你隔得很“遥远”的人,其实与你“很近”。小世界网络就是对这种现象(也称为小世界现象)的数学描述。用数学中图论的语言来说,小世界网络就是一个由大量顶点构成的图,其中任意两点之间的平均路径长度比顶点数量小得多。除了社会人际网络以外,小世界网络的例子在生物学、物理学、计算机科学等领域也有出现。
二十世纪60年代,美国哈佛大学社会心理学家斯坦利·米尔格伦(Stanley Milgram)做了一个连锁信实验。他将一些信件交给自愿的参加者,要求他们通过自己的熟人将信传到信封上指明的收信人手里,他发现,20%的信件最终送到了目标人物手中。而在成功传递的信件中,平均只需要6.5次转发,就能够到达目标。也就是说,在社会网络中,任意两个人之间的“距离”是6。这就是所谓的“六度分隔”理论。
全局集聚系数(Global Clustering Coefficient)
全局集聚系数基于节点的三点组。一个三点组由三个节点组成,其中可以两边连接(为闭三点组)或三边连接(开三点组),统称连通三点组。
全局集聚系数是闭三点组个数(或三倍三角形个数)除以全部连通三点组个数。
该方法首次由Luce和Perry使用(1949)。该指标指示了整个网络的集聚程度,可被用于无方向和有向网络。
定义:
局部集聚系数(Local Clustering Coefficient, Watts&Strogatz 1998)
对于每个节点i,ni是节点i的邻居节点个数。
3). 优先链接模型
Albert-László Barabási 和Réka Albert为了解释幂律的产生机制,提出了无标度网络模型(BA模型)。BA模型具有两个特性,其一是增长性,所谓增长性是指网络规模是在不断的增大的,在研究的网络当中,网络的节点是不断的增加的;其二就是优先连接机制,这个特性是指网络当中不断产生的新的节点更倾向于和那些连接度较大的节点相连接。BA模型对很多的现象都是可以解释的,例如研究生对导师的选择,在这个网络当中,研究生和导师都是不断增加的,而研究生总是倾向于选择已经带过很多研究生的导师。
这个模型基于两个假设:
增长模式:不少现实网络是不断扩大不断增长而来的,例如互联网中新网页的诞生,人际网络中新朋友的加入,新的论文的发表,航空网络中新机场的建造等等。
优先连接模式:新的节点在加入时会倾向于与有更多连接的节点相连,例如新网页一般会有到知名的网络站点的连接,新加入社群的人会想与社群中的知名人士结识,新的论文倾向于引用已被广泛引用的著名文献,新机场会优先考虑建立与大机场之间的航线等等。
2.SupervisedLearing