【发布时间】:2019-10-12 09:08:00
【问题描述】:
我目前正在使用 RVest 在 R 中进行网络抓取。 我目前的网站是“https://www.immobilienscout24.de/Suche/S-2/Wohnung-Miete/Rheinland-Pfalz/Koblenz”。 但我无法获取房地产报价的各个 pushlishDates。
F.e,这是我发现嵌入在脚本中的 HTML 部分。
"@publishDate":"2019-10-12T10:50:57.831+02:00"
我找不到合适的 RVest-Selector... 下面的代码返回 Character[0],因为节点“publishDate”不起作用。
抓取每个发布日期所需的 html_node() 是什么?提前非常感谢。
library(rvest)
immo_webp <- read_html ("https://www.immobilienscout24.de/Suche/S-2/Wohnung-Miete/Rheinland-Pfalz/Koblenz")
PDate <- immo_webp %>%
html_nodes("publishDate") %>%
html_text()
【问题讨论】:
标签: r web-scraping rvest