【问题标题】:How to get IMPORTXML/IMPORTHTML result data in one cell?如何在一个单元格中获取 IMPORTXML/IMPORTHTML 结果数据?
【发布时间】:2021-08-04 17:26:21
【问题描述】:

使用 Google 表格,从这样的 html 表格中抓取:

我想获取 JUST ONE CELL 中的所有行... 像这样:

而我没办法做到!

预期的结果是在一个唯一的单元格中获取所有表格数据... 用空格替换列分割 并将行转换为简单的文本行。

有什么帮助吗? =(

注意:第一个值并不总是包含 de ":" 字符。表中的行数可能会有所不同。

【问题讨论】:

  • 分享你的公式
  • 嗨@player0。我没有公式...除了简单的 IMPORTHTML/IMPORTXML。- 事实上,这正是我所要求的!呵呵

标签: web-scraping google-sheets import


【解决方案1】:

您可以尝试从上一个答案构建:

=QUERY(TRANSPOSE(ARRAYFORMULA(CONCAT(QUERY(TRANSPOSE(importxml_formula),,9^9),CHAR(10)))),,9^9)

解释故障:

QUERY(TRANSPOSE(importxml_formula),,9^9)

这会返回一个表,其中一行的列数为原始表中的行,每一列的结果是表中每一行的数据。

ARRAYFORMULA(CONCAT(QUERY(TRANSPOSE(importxml_formula),,9^9),CHAR(10))

每一列都会附加CHAR(10),对应一个换行符。

TRANSPOSE(ARRAYFORMULA(CONCAT(QUERY(TRANSPOSE(importxml_formula),,9^9),CHAR(10))))

将表格转置为 1 列,x 行,最后最后 QUERY 将该列合并为单个单元格。

样本输出:

更新:

您的 IMPORTXML() 已经返回了一个单元格,并且由于它们可以用双空格分隔,因此您可以改用以下公式:

=QUERY(ARRAYFORMULA(CONCAT(TRANSPOSE(SPLIT(IMPORTXML(A1,B1),"  ",,FALSE)),CHAR(10))),,9^9)

【讨论】:

  • 嗨@Carlos M,谢谢你的建议。我试过但得到相同的结果......它在一个单元格中给了我所有数据......但列值之间没有空格,行之间没有换行符。 - 它只是所有值,在同一个单元格中彼此跟随- 我什至尝试过使用维基百科的表格,结果相同 =(
  • 分享您的工作表副本
  • docs.google.com/spreadsheets/d/… 这只是一个样本表,我正在尝试让它工作
  • =IMPORTXML(A1,B1) 已经输出了一个单元格。
  • 亲爱的@Carlos M. 非常感谢!顺便说一句,如果你看一下我的帖子的标题,我会要求两个选项:IMPORTXML/IMPORTHTML,因为我可以使用它们中的任何一个来获取数据......虽然,没有比我想要的方式,而且我没有不知道从哪个方面来获得想要的最终结果会更合适!你从一开始就回答了我,一个基于 IMPORTXML 的选项......我只听了你的建议并从那里开始工作。实际上,我刚刚尝试了您之前的建议,但是通过 IMPORTHTML 更改了 IMPORTXML ......而且效果也很好!非常感谢你的帮助! =)
【解决方案2】:

尝试:

=INDEX(SUBSTITUTE(SUBSTITUTE(QUERY(SUBSTITUTE(FLATTEN(QUERY(TRANSPOSE(
 your_formula_here
 ),,9^9)), " ", "×"),,9^9), " ", CHAR(10)&CHAR(10)), "×", " "))

【讨论】:

  • 试过了。我得到一个值,即使我不在桌子上:#N/A 387420489 =(
  • 对不起,这是我的错……一个错字。是的,它返回表的值......但它返回所有合并在一行中......在列之间没有任何分隔符(空格)并且没有在行之间插入任何换行符
  • 对不起@player0,非常感谢!我试过但得到相同的结果......它在一个单元格中给了我所有数据......但列值之间没有空格,行之间没有换行符。 - 它只是所有值,在同一个单元格中彼此跟随- 我什至尝试过使用维基百科表格,结果相同 =(
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-06-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多