【问题标题】:How can I get specific data from the table using Rselenium?如何使用 Rselenium 从表中获取特定数据?
【发布时间】:2018-08-29 15:01:48
【问题描述】:

我正在尝试废弃一张我认为使用 Java 脚本的表格。我想获取索引(即 TSX)的数据。我想获得所有指数的“前一天数据”。我正在使用 Rselenium 报废数据,但无法找到元素。

以下是我为名为 TSX 的索引删除前一天数据的代码:

library(RSelenium)
driver<- rsDriver(browser = "firefox")
remDr <- driver[["client"]]

remDr$navigate("http://bmgfunds.com/interactive-charts/")

elem <- remDr$findElement(using="xpath", value="//*[@id='indices-quotes']/table/tbody/tr[1]/td[2]")

为了获得 Xpath,我检查了元素并通过在 pan 中单击右键来复制 Xpath。 我也尝试过使用 rvest。

library(rvest)

st_table <- read_html("http://bmgfunds.com/interactive-charts/")
table<-html_nodes(st_table, "tbody tr")

不幸的是,我得到零元素{xml_nodeset (0)}

任何建议或帮助将不胜感激。谢谢

【问题讨论】:

    标签: html r web-scraping rvest rselenium


    【解决方案1】:

    表格位于来源为http://integration.nfusionsolutions.biz/client/bullionmanagementgroup/module/quotechartfull 的 iframe 中,因此您可以从那里抓取表格:

    st_table <- read_html("http://integration.nfusionsolutions.biz/client/bullionmanagementgroup/module/quotechartfull") 
    (table <- html_table(st_table)[[3]])
    

    这段代码使用html_table 抓取上一个url 中的所有表格,并选择您想要的表格(这是列表的第三个元素)。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-08-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-10-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多