【问题标题】:XPath queries to scrape data用于抓取数据的 XPath 查询
【发布时间】:2016-07-29 12:57:35
【问题描述】:

我正在使用从 Chrome 复制 XPath 来创建我的查询。它工作得很好,但不适用于这个问题。

这里是is the site 我从这里抓取数据。

一个有效的查询(表 1 中“Senaste NAV-kurs”旁边的数字)

=IMPORTXML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId="&1085603;"//*[@id='fund-summary-wrap']/div[1]/dl[2]/dd/text()" )

但是当我从标题为“AVKASTNING”的表中复制 XPath 时,我没有得到任何数据,请帮助

=IMPORTXML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId="&1085603;"//*[@id='ctl00_FourColumnWidthContent_ThreeColumnsContent_MainAndSecondColumnContent_fundInfo_fundPerformance_tableFund']/tbody/tr[4]/td[2]/span" )

【问题讨论】:

    标签: google-sheets google-query-language


    【解决方案1】:

    如果你愿意尝试另一种方式,下面会得到“AVKASTNING”表。

    =IMPORTHTML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId=1085603","table",7)
    

    如果您想从表中获取特定值,请使用索引。下面的例子获取第二行第二列的值:

    =index(IMPORTHTML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId=1085603","table",7),2,2)
    

    【讨论】:

    • 稍微调整一下就完美了,有些基金只有4个表,有些只有5个。通过添加一个带有Table#和InstrumentID的列就完美了!!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-02-06
    • 1970-01-01
    • 2019-04-09
    • 2016-01-11
    相关资源
    最近更新 更多