【发布时间】:2021-05-06 03:52:19
【问题描述】:
我想从 Vivino 抓取有关葡萄酒的基本数据。我以前从未做过抓取,但基于 Datacamp 上的一些教程和讲座,我尝试使用库 rvest 使用基本代码。 但是,它似乎不起作用并返回零值。 谁能帮助我并告诉我,问题出在哪里?代码是完全错误的,我应该使用其他方法,还是我只是遗漏了什么并且做错了? 提前感谢您的任何回答!
library(rvest)
library(dplyr)
url <- 'https://www.vivino.com/explore?e=eJwNybEOQDAQBuC3ubkG4z-abMQkIqdO00RbuTbF2_OtX1A0FHyEocAPWmPIvhh7suimga5_3YHK6qXwSWmDcvHR5ZWrKDuhhF2ypbvMC5oP96QajA%3D%3D&cart_item_source=nav-explore'
web <- read_html(url)
winery_data <- web %>% html_nodes('.vintageTitle__winery--2YoIr') %>% html_text()
head(winery_data)
wine_name <- web %>% html_nodes('.vintageTitle__wine--U7t9G') %>% html_text()
wine_country <- web %>% html_nodes('.vintageLocation__anchor--T7J3k+ .vintageLocation__anchor--T7J3k') %>% html_text()
wine_region <- web %>% html_nodes('span+ .vintageLocation__anchor--T7J3k') %>% html_text()
wine_rating <- web %>% html_nodes('.vivinoRating__averageValue--3Navj') %>% html_text()
n_ratings <- web %>% html_nodes('.vivinoRating__caption--3tZeS') %>% html_text()
【问题讨论】:
标签: html r web-scraping screen-scraping rvest