【发布时间】:2011-08-23 00:45:30
【问题描述】:
我正在使用 Twitter 流 API 来监控多个关键字/用户。我打算将我从 twitter 直接获得的推文 json 字符串原样转储到 cassandra 数据库,并稍后对它们进行后期处理。
这样的设计实用吗?当我有数百万条推文时,它会扩大规模吗?
我稍后会做的事情包括获得最受关注的用户、热门话题标签等。我想按原样保存流,以便以后挖掘它们以获取我现在可能不知道的任何新信息。
【问题讨论】:
标签: database api twitter streaming cassandra