【发布时间】:2017-05-01 01:17:05
【问题描述】:
我目前正在使用 r v. 1.0.44 和包 twitteR(最新版本)根据某些关键字抓取推文。具体来说,我使用以下命令:
my_twitter_data <- searchTwitter("#aleppo", n = 40000, lang = "en", since = '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)
在关于#aleppo 的 40k 条推文的请求中(由于速率限制需要相当长的时间才能获得),只有 5k 的结果将是原始推文,即strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE) 将返回长度为 5k 的列表。
我的问题是我在转发上花费了很多时间限制,因此与我的进一步分析无关。我的问题是在 R 中是否有解决这个问题的方法,所以我只在原始推文上花费我的速率限制?
【问题讨论】:
标签: r twitter web-scraping