上一篇博客中提到了网络属性的定义和计算方式,这一篇我们根据定义计算出真实世界的网络属性值(以MSN为例)。

1. MSN Messenger 1个月的活动数据

数据量 行为
245M 用户登录
180M 用户参与对话
>1.3B 对话次数
>255B 对话信息条数

其中: M 代表 百万次,B 代表 十亿次
以用户之间至少有一条信息交换构图,可得一幅有180M个节点、1.3B条边的复杂图。

2. 网络属性

2.1 Degree Distribution

cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性
取两次对数得下图:
cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性

我的理解: 由图上可知,极少数人和超过1000个人进行了沟通,大多数人(超过99%)一个月内沟通的人数在0-100的数量范围内。

2.2 Clustering

cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性

我的理解: MSN中平均集聚系数0.11,我感觉是不太高的,但是这个数字多少可能不具备太多含义,更多比较得可能是对比效果,结合具体的不同网络背景的对比效果。比如微信网络和微博网络。

2.3 Connected componentscs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性

我的理解: 最大的连通子图包含了99.9%的节点,说明绝大多数人是一个团体,保持着相互联系。另外左边斜线,说明存在大量子图的节点数目集中在0-50的数量上,并且他们与社会大众并无联系。说明MSN一个月的沟通图是一个很多子网络不连通的复杂网络。

2.4 Diameter of WCC

cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性
我的理解: MSN网络中节点之间的平均路径长度为6.6,90%的节点之间通过8跳可以到达。哈哈哈,之前是谁说通过6个人可以找到世界上任何一个人来着,那肯定不是通过一个月的MSN找到的。

2.5 小结 MSN: key network properties

属性
Degree distribution Heavily,skewed;avg.degree=14.4Heavily,skewed; avg.degree = 14.4
Path length 6.66.6
Clustering coefficient 0.110.11
Connected components giantcomponentgiant component

说明:
(1)节点度数分布严重倾斜,平均节点度数为14.4,即MSN中平均每个人一个月和14.4个人保持联系
(2)giant component,复杂网络中很多网络不连通

2.6 Another example:PPI Network

cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性
PPI Network:蛋白互作网络。

3 学习来源

感谢斯坦福CS224w 2019秋季

相关文章:

  • 2021-11-23
  • 2022-01-16
  • 2022-12-23
  • 2022-12-23
  • 2021-12-19
  • 2021-07-19
  • 2021-05-12
  • 2021-11-14
猜你喜欢
  • 2021-06-25
  • 2021-11-24
  • 2022-12-23
  • 2021-12-15
  • 2021-09-08
  • 2021-06-19
  • 2022-01-02
相关资源
相似解决方案