【问题标题】:Google spreadsheet importHTML Could not fetch URLGoogle 电子表格 importHTML 无法获取 URL
【发布时间】:2014-08-13 09:46:51
【问题描述】:

谁能帮我确认一下?

我正在帮助某人解决 Google 电子表格上的 importHTML 问题。我不熟悉 importHTML,但我认为它应该可以工作。

=importhtml("http://www.stockq.org/","table",1)

我不在乎我要导入哪个表,只要它导入了一些东西。它发出错误消息Error: Could not fetch url: http://www.stockq.org/。但是可以在我的浏览器中访问该网站。这真的很奇怪。

【问题讨论】:

  • 这似乎是新工作表的问题。 productforums.google.com/forum/#!topic/docs/9U4--tlcKq4
  • 那是一月份。什么都没有改变?
  • =IMPORTHTML("en.wikipedia.org/wiki/…) 有效,但我不知道为什么。我尝试了其他链接,包括你的链接并得到相同的错误。cmets 部分不会让我放入链接。确保开头有 http://。
  • @Niccolo 好的,谢谢。也许该网站专门禁止谷歌?至少我知道这不是什么愚蠢的编程错误。
  • 我对 google 搜索结果 url 有同样的问题!有人找到原因了吗?

标签: google-sheets google-sheets-formula


【解决方案1】:

我的 Google 电子表格无法处理中文字符,但我可以在网页上识别的数字很高兴地导入,至少对于三者的中间表而言,带有:

=importhtml("http://www.stockq.org/","table",A12)  

这就是我认为@DigitalSeraphim 早在 9 月提到的内容。引用已删除的答案(不是答案?):

所以,我一直在构建一个页面来帮助我跟上我的 Minecraft 服务器的 mod 更新,大量使用 importxml。我发现对于某些在浏览器中加载完全正常的网站,我得到了同样的错误。进一步调查,我发现网站报告了 404 错误,但实际上返回了请求的数据。根据https://drupal.stackexchange.com/questions/110651/how-to-show-a-node-but-return-http-404-response,这是用来从搜索引擎中删除页面的,正如我所假设的那样。我认为如果没有一些hackery,没有任何办法可以解决这个问题......即设置一个可以“修复”状态的“代理”服务器。

但是,您提供的示例现在似乎正在运行,所以不妨再试一次。

【讨论】:

    【解决方案2】:

    TL;DR

    IMPORTXML 与 XPath 一起使用。


    我在尝试在httphttps 之间切换时遇到了类似的问题。解决方法偶尔会奏效,但结果并不一致(无论哪种方式都失败了很多)。

    后来我注意到还有另一个名为 IMPORTXML 的 API(这里是 XML,不是 HTML)。有了这个,您实际上可以从同一个 URL 查询内容并改为应用 XPath。

    因此我建议改用IMPORTXML。比如下面的公式

    =IMPORTXML("http://www.stockq.org/index/IBOV.php", "//table[@class='indexpagetable']")
    

    将从给定 URL 的页面中为您提供所有具有 indexpagetable 类的表。

    请注意,电子表格中的 XPath 略有不同,您可以参考文档了解更多详情。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-08-26
      • 1970-01-01
      • 2017-12-01
      • 1970-01-01
      • 1970-01-01
      • 2014-07-08
      • 1970-01-01
      相关资源
      最近更新 更多