【发布时间】:2011-11-07 01:25:06
【问题描述】:
我需要将来自 Twitter Streaming API 的所有推文实时保存到数据库中,当然,通过特定的单词列表过滤它们。我通过使用tweetstream 实现了它,在调用FilterStream() 之前像这样定义列表words:
words = ["word1","two words","anotherWord"]
我想做的是能够添加/更改/删除任何这些值,无需停止脚本。为此,我创建了一个纯文本文件,其中包含要过滤掉的单词,并用换行符分隔。使用此代码,我可以完美地得到列表 words:
file = open('words.txt','r')
words = file.read().split("\n")
我让这些行在它开始时工作,但每次它要检查流时我都需要它来做。有什么想法吗?
【问题讨论】: