【发布时间】:2021-01-04 08:44:10
【问题描述】:
我尝试访问这个网站:https://www.apa.org/pubs/journals/browse?query=Title:*&type=journal
但是,我收到错误消息:当前页面似乎不是 html。
因此我无法继续使用html_nodes 等抓取网站。
这是我的代码:
apa_url <- "https://www.apa.org/pubs/journals/browse?query=Title:*&type=journal"
apa_page <- rvest::html_session(apa_url,
httr::user_agent("Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.20 (KHTML, like Gecko) Chrome/11.0.672.2 Safari/534.20"))
如果您知道如何解决它,我将非常感谢您的帮助!
【问题讨论】:
标签: html r web-scraping http-headers rvest