【发布时间】:2017-10-14 15:04:18
【问题描述】:
我上下搜索,但找不到任何适合此目的的解决方案。
我想抓取这个页面(表格)
https://www.fxstreet.com/rates-charts/usdjpy/forecast
我尝试了几种方法,但无法将数据报废到表格中。
library(XML)
library(RCurl)
url <-"https://www.fxstreet.com/rates-charts/usdjpy/forecast"
url2 <- getURL(url)
parsed <- htmlParse(url2)
【问题讨论】:
-
在 Chrome 中打开一个新标签页。打开“开发者工具”(在 Chrome 菜单中搜索)。单击此处的“网络”选项卡和“XHR”子选项卡。导航到该页面。查看
xhr请求。您很有可能在那里找到数据,但主 HTML 页面也有大量 base64 编码的 JSON 数据块,它会解析并从(和其他动态内容)生成数据表和图表。因此,如果您不习惯剖析和提取页面上的 JavaScript,您可能需要使用splashr或seleniumPipes。 -
@hrbrmstr ,这将很难理解,我会尽力而为,谢谢!
标签: r web-scraping screen-scraping