【问题标题】:Scrape website with Google Sheets IMPORTXML function使用 Google Sheets IMPORTXML 功能抓取网站
【发布时间】:2021-02-01 06:59:42
【问题描述】:

我需要从该网站LINK 刮取“Cpn Rate Ann Amt”单元格。

我试过这个:

=IMPORTXML("https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol","/html/body/font/table/tbody/tr/td[2]/p[1]/table[2]/tbody/tr[2]/td[2]/font")

正如我在网上看到的每个教程所建议的那样,但我就是无法让它发挥作用。也许它只是不起作用,因为该网站有 .cfm 页面。

【问题讨论】:

    标签: web-scraping google-sheets scrape


    【解决方案1】:

    我相信你的目标如下。

    • I need to scrape the "Cpn Rate Ann Amt" cell from this website LINK.,您想使用IMPORTXML 检索Cpn Rate Ann Amt 的标头的值。

    在这种情况下,下面的示例公式和 xpath 怎么样?看到网址里的html,我还以为<tr bgcolor="FFEFB5">的背景色只是表格,这个或许可以作为xpath使用。

    示例公式:

    =IMPORTXML(A1,"//tr[@bgcolor='FFEFB5']/../tr[2]/td[2]")
    
    • 单元格“A1”的 URL 为 https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol

    结果:

    注意:

    • 当你想要Cpn Rate Ann Amt的值时,也可以使用下面的公式。

        =IMPORTXML(A1,"//tr[@bgcolor='FFEFB5']/th[2]")
      
    • 在此示例公式中,xpath 用于https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol 的 URL。因此,当 URL 更改时,xpath 可能无法正常工作。所以请注意这一点。

    参考:

    【讨论】:

    • 谢谢。你真是太棒了。您不仅给了我问题的答案,还向我解释了整个过程并附上了屏幕截图。你太棒了,你就是这个社区应该做的一切 - 通过教他们这个过程来帮助人们解决他们的问题,这样如果其他人也有类似的问题,我们就可以进一步传播我们的知识。
    • @Nataliikaa PetroOwwa 感谢您的回复。我为此感到荣幸。而且,我很高兴您的问题得到了解决。也谢谢你。
    猜你喜欢
    • 1970-01-01
    • 2022-01-22
    • 2020-03-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-08-15
    • 1970-01-01
    相关资源
    最近更新 更多