【问题标题】:Import multiple data from webpage into Google Sheets将网页中的多个数据导入 Google 表格
【发布时间】:2020-08-23 20:21:21
【问题描述】:

我正在创建一个包含大量库存项目的库存表。每只股票都有多个数据,我正在从多个网站上抓取这些数据。

目前,由于我的工作表一直在增加,我开始在执行 IMPORTXMLIMPORTHTML 函数时遇到麻烦。

问题:可以将整个网页的源代码导入到一个单元格中一次,然后我可以运行我的IMPORTHTML/IMPORTXML 将该单元格作为源? 我正在考虑它,因为在这种情况下,我只需调用该特定页面一次,然后处理工作表本身内的所有不同数据。

任何想法都将不胜感激,谢谢!

【问题讨论】:

    标签: web-scraping google-sheets google-sheets-formula array-formulas google-sheets-importxml


    【解决方案1】:

    使用 Google Apps 脚本而不是内置公式。

    以上是因为没有“按原样”导入数据的内置函数

    • IMPORTDATA 将用逗号和换行符分割源代码
    • IMPORTXML 不导入标签,只导入它们所包含的文本。
    • IMPORTHTML 仅导入表格和列表的内容

    另一方面,上述函数不能用于解析单元格中的数据,唯一能够解析来自通过 URL 引用的外部源的内容。


    关于使用 Google Apps 脚本,它有 URL Fetch Service

    【讨论】:

      【解决方案2】:

      要导入源代码,您可以使用IMPORTDATA 公式。取决于您的网站结构,您可能需要对其进行 ArrayConstrain :

      =ARRAY_CONSTRAIN(IMPORTDATA("url-here"), 5000, 25)
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2023-01-04
        • 2018-08-10
        • 2011-02-09
        • 2020-02-23
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多