【发布时间】:2017-06-15 15:18:40
【问题描述】:
我正在尝试使用 R 中的 rvest 包scrape this website。我已经在其他几个网站上成功完成了它,但这个似乎不起作用,我不知道为什么。
我从 chrome 的检查器工具中复制了 xpath,但是当我在 rvest 脚本中指定它时,它显示它不存在。这与表格是生成的而不是静态的有关吗?
感谢您的帮助!
library(rvest)
library (tidyverse)
library(stringr)
library(readr)
a<-read_html("http://www.diversitydatakids.org/data/profile/217/benton-county#ind=10,12,15,17,13,20,19,21,24,2,22,4,34,35,116,117,123,99,100,127,128,129,199,201")
a<-html_node(a, xpath="//*[@id='indicator10']")
a<-html_table(a)
a
【问题讨论】:
-
你能告诉我们你尝试了什么吗?您很可能需要将
httr::POST与xml2 包一起使用。这是一个示例:https://stackoverflow.com/questions/44313122/scraping-dynamic-table-in-r-with-post -
编辑帖子以包含代码
标签: r web-scraping rvest