【发布时间】:2020-01-09 18:56:34
【问题描述】:
我有这个网站,我想提取前 4 列。但它不起作用。我是 WebScraping 的初学者,任何帮助都会很棒:
https://projects.fivethirtyeight.com/2017-nba-predictions/
我要提取每一列:ELO -- CARM-ELOe 以此类推
这是我到目前为止所做的:
url_nba <- 'https://projects.fivethirtyeight.com/2017-nba-predictions/'
webpage_nba <- read_html(url_nba)
data_nba.1 <- html_nodes(webpage_nba,'.num elo original desktop')
data_nba.2 <- html_nodes(webpage_nba,'.num elo carmelo')
在此之后,我想放入一个数据框。
有什么帮助吗?
【问题讨论】:
-
您说的是前四列,即 elo、carmelo、1-Week Change 和 Team Logo。真的是这样吗?如果是这样,您希望如何处理徽标?
标签: r web-scraping rvest