【发布时间】:2015-10-09 02:27:00
【问题描述】:
我有一个大型网络要分析。例如:
import networkx as nx
import random
BA = nx.random_graphs.barabasi_albert_graph(1000000, 3)
nx.info(BA)
我必须在保持度数分布不变的同时对边缘进行洗牌。基本思想由Maslov介绍。因此,我和我的同事编写了一个 shuffleNetwork 函数,我们在其中对网络对象 G 工作了 num 次。边缘是一个列表对象。
问题是这个函数对于大型网络来说运行太慢了。我尝试使用 set 或 dict 而不是 list 作为边缘对象(set 和 dict 是哈希表)。但是,由于我们还需要删除和添加元素,时间复杂度变得更大。
您对进一步优化此功能有什么建议吗?
def shuffleNetwork(G,Num):
edges=G.edges()
l=range(len(edges))
for n in range(Num):
i,j = random.sample(l, 2)
a,b=edges[i]
c,d=edges[j]
if a != d and c!= b:
if not (a,d) in edges or (d, a) in edges or (c,b) in edges or (b, c) in edges:
edges[i]=(a,d)
edges[j]=(c,b)
K=nx.from_edgelist(edges)
return K
import timeit
start = timeit.default_timer()
#Your statements here
gr = shuffleNetwork(BA, 1000)
stop = timeit.default_timer()
print stop - start
【问题讨论】:
-
我再次查看了您的代码。我认为较慢的部分是测试
(a,d) in edges等。执行if not G.has_edge(a,d)会更快。然后,与其检查(a,d)是否在您的边列表中(需要检查您的边列表中的每条边),它直接转到a并检查d是否是邻居。这是 O(1)(几乎)与 O(len(edgelist))。我怀疑通过此更改,您的代码将与double_edge_swap相当。
标签: python list hash networkx shuffle