【发布时间】:2014-09-10 16:30:30
【问题描述】:
我正在尝试从推文的 json 文件中计算主题标签。我的程序的目标是首先提取主题标签并制作一个列表,然后创建这些主题标签的字典(为此我编写了“hashtags_dic”函数)以计算每个主题标签出现的次数。我的问题是,现在程序返回主题标签值,但没有总结每个特定主题标签出现的次数。 我创建了一个名为“hashtags_dic”的函数来创建字典,但它不起作用。 代码如下:
from twitter_DB import load_from_DB
def get_entities(tweet):
if 'entities' in tweet.keys():
hashtag_list = [hashtag['text'] for hashtag in tweet['entities']['hashtags']]
return hashtag_list
else:
return []
def hashtags_dic(hashtag_list):
hashtag_count = {}
for text in hashtag_list:
if text != None:
if text in hashtag_count.keys():
hashtag_count[text] = hashtag_count[text] + 1
else:
hashtag_count[text] = 1
return hashtag_count
if __name__ == '__main__':
DBname = 'search-results'
tweet_results = load_from_DB(DBname)
print 'number loaded', len(tweet_results)
for tweet in tweet_results[:100]:
labels = get_entities(tweet)
dic=hashtags_dic(labels)
print ' Hashtags:', labels[:20]
print ' Hastags count: ', dic
对于我的代码有什么问题的任何提示或想法,我将不胜感激。在此先感谢...诺帕
【问题讨论】:
-
你能展示一些你的文件是什么样子的输入示例吗?
标签: python twitter dictionary