排除在 r 中使用 twitteR 抓取转推答案

【问题标题】：Exclude scraping retweets with twitteR in r排除在 r 中使用 twitteR 抓取转推
【发布时间】：2017-05-01 01:17:05
【问题描述】：

我目前正在使用 r v. 1.0.44 和包 twitteR（最新版本）根据某些关键字抓取推文。具体来说，我使用以下命令：

 my_twitter_data  <- searchTwitter("#aleppo", n = 40000, lang = "en", since =    '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)

在关于#aleppo 的 40k 条推文的请求中（由于速率限制需要相当长的时间才能获得），只有 5k 的结果将是原始推文，即strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE) 将返回长度为 5k 的列表。

我的问题是我在转发上花费了很多时间限制，因此与我的进一步分析无关。我的问题是在 R 中是否有解决这个问题的方法，所以我只在原始推文上花费我的速率限制？

【问题讨论】：

标签： r twitter web-scraping

【解决方案1】：

您可以在查询中添加-filter:retweets：

 my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
                                  lang = "en", since = '2016-12-12',
                                  until = "2016-12-13", retryOnRateLimit = 120)

【讨论】：

如此简单的解决方案却很难找到。非常感谢！

【解决方案2】：

my_twitter_data

【讨论】：