用于抓取数据的 XPath 查询答案

【问题标题】：XPath queries to scrape data用于抓取数据的 XPath 查询
【发布时间】：2016-07-29 12:57:35
【问题描述】：

我正在使用从 Chrome 复制 XPath 来创建我的查询。它工作得很好，但不适用于这个问题。

这里是is the site 我从这里抓取数据。

一个有效的查询（表 1 中“Senaste NAV-kurs”旁边的数字）

=IMPORTXML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId="&1085603;"//*[@id='fund-summary-wrap']/div[1]/dl[2]/dd/text()" )

但是当我从标题为“AVKASTNING”的表中复制 XPath 时，我没有得到任何数据，请帮助

=IMPORTXML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId="&1085603;"//*[@id='ctl00_FourColumnWidthContent_ThreeColumnsContent_MainAndSecondColumnContent_fundInfo_fundPerformance_tableFund']/tbody/tr[4]/td[2]/span" )

【问题讨论】：

标签： google-sheets google-query-language

【解决方案1】：

如果你愿意尝试另一种方式，下面会得到“AVKASTNING”表。

=IMPORTHTML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId=1085603","table",7)

如果您想从表中获取特定值，请使用索引。下面的例子获取第二行第二列的值：

=index(IMPORTHTML("http://www.di.se/di-fonder/fonddetaljer/?InstrumentId=1085603","table",7),2,2)

【讨论】：

稍微调整一下就完美了，有些基金只有4个表，有些只有5个。通过添加一个带有Table#和InstrumentID的列就完美了！！