【问题标题】:Xpath query for =ImportXML on Google SpreadsheetGoogle 电子表格上 =ImportXML 的 Xpath 查询
【发布时间】:2015-03-01 00:03:50
【问题描述】:

我的 html 和 xml 知识有限,我正在尝试使用 Google 电子表格上的 =ImportXML() 抓取一些 URL 以获取文本块。

这里是链接:http://www.worldbank.org/projects/P082167/agricultural-transition?lang=en&tab=overview

<div id="abstractmore" style="">

        <h2>ABSTRACT*</h2>
        <p>

            The project aims to...be responsible for the general management of the project.<a href="javascript:;" id="rdless" class="more">&nbsp;Read Less»</a>

        </p>

    </div>

我正在尝试提取完整的摘要。我使用了 Chrome 的检查元素工具并浏览了各种教程......我能够从我所阅读的内容中得出这些 xpath:

//div[@id='abstractmore']/p/text()
//*[@id="abstractmore"]/p/text()

这些返回错误:导入的内容为空。我完全不知道如何找出 xpath!?

【问题讨论】:

    标签: xml xpath google-sheets


    【解决方案1】:

    没有这样的@id='abstractmore',但是:

    id="abstract"
    and
    <span class="more"><a href="javascript:;" id="rdmore" class="more">&nbsp;Read More»</a></span>
    

    尽管如此,这无济于事,尚不清楚为什么 Google 电子表格函数不提取 H2:

    //*[@id="dataSections"]/*[@id="leftSection"]/*[@id="box2"]/*[@id="box2Inner"]/*[@id="tabContent"]/h2 
    

    可能出于同样的原因没有提取&lt;p&gt; 内容

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-03-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-05-09
      相关资源
      最近更新 更多