【问题标题】:Server Error with rvest in RR中的rvest服务器错误
【发布时间】:2015-04-23 21:48:20
【问题描述】:

我不是网络抓取专家,但很喜欢在 R 中使用 rvest。今天我尝试使用它来抓取一个名为 JeFit 的特定健身网站,但出现以下错误。这是我的输入和输出:

library(rvest)
html("https://www.jefit.com/")

 Error in function (type, msg, asError = TRUE)  : 
  error:14077458:SSL routines:SSL23_GET_SERVER_HELLO:reason(1112)

我无法理解为什么 rvest 适用于我尝试过的其他网站,但不适用于这个网站。任何帮助,将不胜感激。

【问题讨论】:

  • 这不是 R 问题。该网站的证书有问题。
  • 谢谢,有什么办法可以从我这边绕过吗?
  • 根本不懂 R,但也许有办法放松或禁用 ssl 证书检查。
  • 对我来说效果很好。

标签: r curl web-scraping rcurl rvest


【解决方案1】:

查找您的用户代理并将其放入 html 函数中。

ua

html("https://www.jefit.com/",httr::user_agent(ua))

【讨论】:

    猜你喜欢
    • 2015-07-07
    • 1970-01-01
    • 2018-02-02
    • 2013-05-16
    • 2017-11-16
    • 2018-07-19
    • 1970-01-01
    • 2019-10-09
    • 2017-09-18
    相关资源
    最近更新 更多