【问题标题】:How to use =ImportXML to pull data from an html tag with a specific class attribute.如何使用 =ImportXML 从具有特定类属性的 html 标记中提取数据。
【发布时间】:2014-03-22 00:06:58
【问题描述】:

我正在尝试从网站中提取数据。这是html源代码

<div class="sort-by">
<span class="totalrows js-totalrows">13386</span>
</div>

我使用的代码 =ImportXML 是:

=ImportXML("websitehere.com", "//span")

虽然页面上有数百个跨度,但我得到了数百个结果。我需要获取驻留在跨度内的数字。所以我的问题是我如何更改请求,以便它仅使用“totalrows js-totalrows”类提取“span”内的信息,这样它只会为我绘制一个数字。提前致谢!

【问题讨论】:

    标签: xml xpath google-sheets


    【解决方案1】:

    尝试使用更具体的 XPath 过滤掉不相关的跨度,例如通过在具有类“sort-by”的 div 下仅查询具有类“totalrows js-totalrows”的跨度:

    =ImportXML("websitehere.com", "//div[@class='sort-by']/span[@class='totalrows js-totalrows']")
    

    或者,如果您希望使用更简单的 XPath 来查询具有“totalrows js-totalrows”类的 span 元素,则可以这样做:

    =ImportXML("websitehere.com", "//span[@class='totalrows js-totalrows']")
    

    无论如何,重点是我们使用方括号 ([]) 来声明 XPath 中要选择的元素的规范(也称为过滤器)。

    【讨论】:

    • 工作就像一个魅力。谢谢!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-05-27
    • 2012-12-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多