【发布时间】:2018-05-04 21:21:42
【问题描述】:
作为项目的一部分,我正在尝试从 Google + 上抓取完整的评论(在之前在其他网站上的尝试中,我的评论被 More 截断,除非你点击它,否则它会隐藏完整的评论)。
我为此选择了 rvest 包。但是,我似乎没有得到我想要的结果。
这是我的步骤
library(rvest)
library(xml2)
library(RSelenium)
queens <- read_html("https://www.google.co.uk/search?q=queen%27s+hospital+romford&oq=queen%27s+hospitql+&aqs=chrome.1.69i57j0l5.5843j0j4&sourceid=chrome&ie=UTF-8#lrd=0x47d8a4ce4aaaba81:0xf1185c71ae14d00,1,,,")
#Here I use the selectorgadget tool to identify the user review part that I wish to scrape
reviews=queens %>%
html_nodes(".review-snippet") %>%
html_text()
但是这似乎不起作用。我在这里没有得到任何输出。
我对这个包和网络抓取非常陌生,因此非常感谢任何关于此的输入。
【问题讨论】:
-
这违反了 Google 的服务条款。
标签: r web-scraping rvest rselenium