【发布时间】:2013-07-23 17:23:17
【问题描述】:
我有一个用 Python 编写的文件,它发送到 Twitterstream 并根据列表中的关键字抓取消息。列表很长,输出不是我想要的。我想清理文件并将结果输出到文本文件。
这是我当前的代码,它将所有消息写入一行:
import sys
....
if __name__ == '__main__':
with open("keywords.txt", "r") as f:
keywords = f.readlines()
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=keywords])
以上内容没有拉入任何内容,这意味着当我在命令提示符python hashtagworking.py > output.txt 下键入以下内容时,没有任何内容输出到文本文件中
stream.filter 中有大约 300 个项目,所以我想使用 txt 文件代替实际文本。此外,每条消息的结果都显示在一行上,这是它的编写方式,我想将其重写为消息中每个对象的输出到 csv 文件。
我想这就是我正在寻找的,但想确认一下:similar problem
我还想从其他嵌套对象(例如实体:{...})中获取内容,特别是我想从实体对象中获取主题标签,更具体地说是任何对象。我试过data.text.hashtagdata.entities.hashtagdata.entities.media.hashtag之类的东西都无济于事。
【问题讨论】:
标签: python csv python-2.7 twitter export-to-csv