【问题标题】:Exclude scraping retweets with twitteR in r排除在 r 中使用 twitteR 抓取转推
【发布时间】:2017-05-01 01:17:05
【问题描述】:

我目前正在使用 r v. 1.0.44 和包 twitteR(最新版本)根据某些关键字抓取推文。具体来说,我使用以下命令:

 my_twitter_data  <- searchTwitter("#aleppo", n = 40000, lang = "en", since =    '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120) 

在关于#aleppo 的 40k 条推文的请求中(由于速率限制需要相当长的时间才能获得),只有 5k 的结果将是原始推文,即strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE) 将返回长度为 5k 的列表。

我的问题是我在转发上花费了很多时间限制,因此与我的进一步分析无关。我的问题是在 R 中是否有解决这个问题的方法,所以我只在原始推文上花费我的速率限制?

【问题讨论】:

    标签: r twitter web-scraping


    【解决方案1】:

    您可以在查询中添加-filter:retweets

     my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
                                      lang = "en", since = '2016-12-12',
                                      until = "2016-12-13", retryOnRateLimit = 120)
    

    【讨论】:

    • 如此简单的解决方案却很难找到。非常感谢!
    【解决方案2】:

    my_twitter_data

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-05-12
      • 1970-01-01
      • 1970-01-01
      • 2014-03-12
      • 2016-11-07
      • 2016-06-26
      • 2015-06-27
      • 2020-10-12
      相关资源
      最近更新 更多