【发布时间】:2019-06-27 18:14:23
【问题描述】:
首先我要道歉,因为我是 Twitter 数据分析的新手。
我想创建一个用户标签网络,根据用户的推文标签连接用户。我已经将推文存储在 MongoDB 中,但我无法从扩展实体对象中提取所有主题标签,老实说,我有点迷失在如何做到这一点上,你能否认为这可能是实现它的最佳方法?
我尝试将主题标签存储在数据框中的新列中,但我只能检索一个,这不起作用,因为我需要考虑推文中的所有主题标签才能建立连接。
我有以下代码来检索第二个数据帧中的主题标签
def get_tweet_data(df2):
df2["user_id"] = df1["user"].apply(lambda x: x["id"])
df2["screen_name"] = df1["user"].apply(lambda x: x["screen_name"])
df2["hashtags"] = df1["entities"].apply(lambda x: x["hashtags"][0]["text"] if x["hashtags"] else np.nan)
return df2
结果给了我:
我在哪里寻找这样的东西:
但是我有另一个问题,我需要根据他们的标签连接每个推文用户,这样用户就可以与#Puertos 的用户、#Pemex 的用户和#abierto 的用户建立联系。我不知道该怎么做。
使用以下代码制作图表:
G = nx.from_pandas_edgelist(
df2,
source = "screen_name",
target = "hashtags",
create_using = nx.Graph())
再次道歉,我才刚刚开始。
【问题讨论】:
-
您好,欢迎来到 Stack Overflow!您能否在帖子中添加一些示例数据和您编写的代码?
-
您好,我刚刚补充了更多信息,谢谢您的回复。
标签: python-3.x twitter networkx