【问题标题】:How to get the old timeline or tweet?如何获取旧时间线或推文?
【发布时间】:2017-02-14 03:32:42
【问题描述】:
我是韩国的大学生
我正在和我的导师教授一起使用 Twitter 的大数据开发分析应用程序。所以我正在收集包含特定关键字(相关犯罪词)的推文。我现在使用'streaming api'和'search api'。我已经看到使用搜索 api 和流式 api 结果只返回一周的推文。
我应该得到具有犯罪关键字的旧数据,从 2006 年到 2016 年
你有什么想法吗?
【问题讨论】:
标签:
twitter
twitter4j
twitter-streaming-api
twitter-search
【解决方案1】:
遗憾的是,您无法在该时间范围内收到推文。
来自documentation:
搜索 API 不是所有推文的完整索引,而是最近推文的索引。目前该索引包括 6-9 天的推文。
因此,您只能从搜索 API 获取最近的推文。对数据也要小心,因为它是关于相关性而不是完整性,来自同一个文档:
在参与之前,重要的是要知道 Search API 关注的是相关性而不是完整性。这意味着搜索结果中可能会丢失一些推文和用户。如果你想匹配完整性,你应该考虑使用 Streaming API。
如果您真的需要较旧的推文,您将不得不从其他来源获取它们,例如 Gnip。否则,您将不得不以不同的方式处理您的问题。
如果您拥有想要获取信息的所有用户的姓名(或 ID),您可以从每个用户那里获得 timelines,从而获得多达 3200 条推文。