如何使用 Rselenium 从表中获取特定数据？答案

【问题标题】：How can I get specific data from the table using Rselenium?如何使用 Rselenium 从表中获取特定数据？
【发布时间】：2018-08-29 15:01:48
【问题描述】：

我正在尝试废弃一张我认为使用 Java 脚本的表格。我想获取索引（即 TSX）的数据。我想获得所有指数的“前一天数据”。我正在使用 Rselenium 报废数据，但无法找到元素。

以下是我为名为 TSX 的索引删除前一天数据的代码：

library(RSelenium)
driver<- rsDriver(browser = "firefox")
remDr <- driver[["client"]]

remDr$navigate("http://bmgfunds.com/interactive-charts/")

elem <- remDr$findElement(using="xpath", value="//*[@id='indices-quotes']/table/tbody/tr[1]/td[2]")

为了获得 Xpath，我检查了元素并通过在 pan 中单击右键来复制 Xpath。我也尝试过使用 rvest。

library(rvest)

st_table <- read_html("http://bmgfunds.com/interactive-charts/")
table<-html_nodes(st_table, "tbody tr")

不幸的是，我得到零元素{xml_nodeset (0)}

任何建议或帮助将不胜感激。谢谢

【问题讨论】：

标签： html r web-scraping rvest rselenium

【解决方案1】：

表格位于来源为http://integration.nfusionsolutions.biz/client/bullionmanagementgroup/module/quotechartfull 的 iframe 中，因此您可以从那里抓取表格：

st_table <- read_html("http://integration.nfusionsolutions.biz/client/bullionmanagementgroup/module/quotechartfull") 
(table <- html_table(st_table)[[3]])

这段代码使用html_table 抓取上一个url 中的所有表格，并选择您想要的表格（这是列表的第三个元素）。

【讨论】：