【发布时间】:2020-05-04 00:39:27
【问题描述】:
对不起,如果这个问题已经解决了,我已经搜索没有成功解决这个疑问。
我抓取了 NBA 的 10 个赛季并将数据集存储在一个列表中,但主要问题是数据集中没有包含赛季年份的列,因此很难确定数据集来自哪个赛季.
所以我期待做的是根据季节向量改变一个新列并识别季节的年份。
这是我尝试过的:
library(tidyverse)
library(rvest)
library(xml2)
season_scrape <- c(2010:2019)
url <- paste0("https://www.basketball-reference.com/leagues/NBA_", season_scrape, "_totals.html")
scrape_function <- function(url){
season_stats <- url %>%
read_html() %>%
html_nodes("table") %>%
.[[1]] %>%
html_table() %>%
mutate(season_year = season_scrape)
}
season_data <- lapply(url, scrape_function)
你会推荐什么?在 scrape_function 内部或在列表中获取数据集之后进行变异。
提前致谢。
【问题讨论】: