【问题标题】:How to use IMPORTXML to get URL of first result of Google Search?如何使用 IMPORTXML 获取 Google 搜索的第一个结果的 URL?
【发布时间】:2014-02-12 14:31:26
【问题描述】:

我正在尝试使用 Google 电子表格中的 ImportXML 函数来查找 Google 搜索的第一个结果的 URL(不包括指向广告链接的任何链接)。我以为我理解所有搜索结果都显示在一个带有“r”类的 h3 元素中,我希望下面的 XPath 表达式会找到 a) 到搜索结果的所有链接(括号中的部分)然后 b) 选择第一个其中:

=importxml(A1,"(//h3[@class='r']/a/@href)[1]")

[其中 A1 是例如"="https://www.google.com/search?q=U+Chicago&num=10""]

不幸的是,我确实获得了 Google 地图的链接。

【问题讨论】:

    标签: xml xpath google-sheets


    【解决方案1】:

    您应该将 google 参数设置为只返回一个结果,而不是过滤结果。查询参数应包括响应的数量(num)和页面(开始)

    "https://www.google.com/search?q=stack+overflow&num=1&start=1"
    

    【讨论】:

      【解决方案2】:

      按相关 ID 缩小查询范围,例如:

      //ol[@id='rso']//h3[@class='r']/a/@href
      

      【讨论】:

        【解决方案3】:

        我一直在为同样的事情苦苦挣扎。尚未找到一种方法来获取仅返回一个 URL 的唯一 XPath 查询,但您可以强制 Google 仅返回顶部搜索结果!

        在您的搜索网址中,将“&num=10”更改为“&num=1”。就是这样。

        【讨论】:

          【解决方案4】:

          你可以两者都做,你可以让它用 "&num=1" 返回一个结果,也可以使用 xpath "//cite"

          【讨论】:

            猜你喜欢
            • 2019-12-15
            • 1970-01-01
            • 1970-01-01
            • 2011-07-27
            • 1970-01-01
            • 2019-04-05
            • 1970-01-01
            • 2020-06-16
            • 2013-01-30
            相关资源
            最近更新 更多