【发布时间】:2016-01-30 10:35:51
【问题描述】:
我正在尝试使用 networkx 创建一个图形,到目前为止,我已经从以下文本文件创建了节点: 文件 1(user_id.txt) 样本数据:
user_000001
user_000002
user_000003
user_000004
user_000005
user_000006
user_000007
文件 2(user_country.txt) 示例数据:如果用户没有输入他的国家详细信息,也包含几个空白行
Japan
Peru
United States
Bulgaria
Russian Federation
United States
文件 3(user_agegroup.txt) 数据:包含四个年龄组
[12-18],[19-25],[26-32],[33-39]
我还有另外两个文件,其中包含用于在图中添加边的示例数据
文件 4(id,agegroup.txt)
user_000001,[19-25]
user_000002,[19-25]
user_000003,[33-39]
user_000004,[19-25]
user_000005,[19-25]
user_000006,[19-25]
user_000007,[26-32]
文件 5(id,country.txt)
(user_000001,Japan)
(user_000002,Peru)
(user_000003,United States)
(user_000004,)
(user_000005,Bulgaria)
(user_000006,Russian Federation)
(user_000007,United States)
到目前为止,我已经编写了以下代码来绘制只有节点的图形:
(请检查代码,因为 print g.number_of_nodes()
永远不会打印正确的节点数,尽管 print g.nodes() 显示正确的节点数。)
import csv
import networkx as nx
import matplotlib.pyplot as plt
g=nx.Graph()
#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='blue')
#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='red')
#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
g.add_nodes_from(row)
nx.draw_random(g,node_color='yellow')
print g.nodes()
plt.savefig("path.png")
print g.number_of_nodes()
plt.show()
除此之外,我不知道如何从 file4 和 file5 添加边。对此代码的任何帮助表示赞赏。 谢谢。
【问题讨论】:
-
g.nodes 和 g.number_of_nodes 出现的值是什么?您的预期是什么?
-
我得到 160 作为否。节点数而不是 259,这是三个文件(文件 1、2 和 3)中的实际节点数,g.node 正在打印节点,当我计算时结果是正确的,即 259。同样,关于代码的任何建议创建边缘?
-
那么,对于您提供的样本,您希望获得18个节点?
-
至于添加边,你可以读取行然后使用 G.add_edge(row[0],row[1])
-
g.number_of_nodes只返回g.node的长度(内部是一个字典),g.nodes() 也只返回g.node。因此,除非您在检查len(g.nodes())和g.number_of_nodes)之间修改图表,否则很难看出这两者将有何不同。这三个文件中的所有条目都是唯一的吗?任何重复项将对应于同一个节点。 (dict docs)
标签: python python-2.7 csv graph networkx