【问题标题】:Import multiple data from webpage into Google Sheets将网页中的多个数据导入 Google 表格
【发布时间】:2020-08-23 20:21:21
【问题描述】:
我正在创建一个包含大量库存项目的库存表。每只股票都有多个数据,我正在从多个网站上抓取这些数据。
目前,由于我的工作表一直在增加,我开始在执行 IMPORTXML 和 IMPORTHTML 函数时遇到麻烦。
问题:可以将整个网页的源代码导入到一个单元格中一次,然后我可以运行我的IMPORTHTML/IMPORTXML 将该单元格作为源? 我正在考虑它,因为在这种情况下,我只需调用该特定页面一次,然后处理工作表本身内的所有不同数据。
任何想法都将不胜感激,谢谢!
【问题讨论】:
标签:
web-scraping
google-sheets
google-sheets-formula
array-formulas
google-sheets-importxml
【解决方案1】:
使用 Google Apps 脚本而不是内置公式。
以上是因为没有“按原样”导入数据的内置函数
- IMPORTDATA 将用逗号和换行符分割源代码
- IMPORTXML 不导入标签,只导入它们所包含的文本。
- IMPORTHTML 仅导入表格和列表的内容
另一方面,上述函数不能用于解析单元格中的数据,唯一能够解析来自通过 URL 引用的外部源的内容。
关于使用 Google Apps 脚本,它有 URL Fetch Service
【解决方案2】:
要导入源代码,您可以使用IMPORTDATA 公式。取决于您的网站结构,您可能需要对其进行 ArrayConstrain :
=ARRAY_CONSTRAIN(IMPORTDATA("url-here"), 5000, 25)