【发布时间】:2022-01-19 18:19:01
【问题描述】:
我是网络抓取的新手,下面的代码生成一个空字符向量,不知道如何解决:
google_url <- "https://news.google.com/topstories?hl=en-GB&gl=GB&ceid=GB:en"
google <- read_html(google_url)
articles <- google %>% html_nodes('.VDXfz') %>% html_text()
articles
【问题讨论】:
-
您可以通过
html_nodes('.VDXfz') %>% html_attr('href')获取网页链接,但无法获得头条。 -
请务必让我们知道您尝试使用的软件包。图书馆(rvest)
-
请提供足够的代码,以便其他人更好地理解或重现问题。
标签: r web-scraping tidyverse rvest xml2