【发布时间】:2018-04-26 01:24:23
【问题描述】:
我对网络抓取很陌生,我正在尝试从此处链接的一个 538 网站 (https://projects.fivethirtyeight.com/carmelo/kyrie-irving/) 抓取 5 年的市场价值。这是我从 rvest 包运行的代码。
kyrie_irving <-
read_html("https://projects.fivethirtyeight.com/carmelo/kyrie-irving/")
kyrie_irving %>%
html_node(".market-value") %>%
html_text() %>%
as.numeric()
但是输出看起来像这样:
> kyrie_irving <-
read_html("https://projects.fivethirtyeight.com/carmelo/kyrie-irving/")
> kyrie_irving %>%
+ html_node(".market-value") %>%
+ html_text() %>%
+ as.numeric()
[1] NA
我只是想知道我哪里出了问题?
编辑:我尝试使用 RSelenium 来执行此操作,但仍然没有返回任何值。我真的不知道问题出在哪里。代码如下:
library(RSelenium)
rD <- rsDriver(port = 4444L, browser = "chrome")
remDr <- rD[["client"]]
remDr$navigate("https://projects.fivethirtyeight.com/carmelo/kyrie-irving/")
elem <- remDr$findElement(using="css selector", value=".market-value")
elemtxt <- elem$getElementAttribute("div")
【问题讨论】:
标签: web-scraping rvest rselenium