【问题标题】:How to import first column using =IMPORTHTML?如何使用 =IMPORTHTML 导入第一列?
【发布时间】:2020-03-05 15:17:20
【问题描述】:
【问题讨论】:
标签:
web-scraping
google-sheets
google-sheets-formula
google-sheets-importxml
【解决方案1】:
如果表格包含 JavaScript 元素(在您的情况下确实如此),则无法使用任何公式将此类元素导入 Google 表格。不支持 GS 中的 JS 抓取。
【解决方案2】:
这个答案怎么样?请认为这只是几个可能的答案之一。
在此答案中,使用IMPORTXML 代替IMPORTHTML。
示例公式:
={QUERY(IMPORTXML(A1,"//tr | //td/a/@title"),"SELECT Col1 WHERE Col1 IS NOT NULL"),QUERY(IMPORTXML(A1,"//tr"),"SELECT Col2,Col3,Col4,Col5,Col6,Col7,Col8")}
-
https://www.tradeskillmaster.com/black-market?realm=EU-draenor 的 URL 放在单元格“A1”中。
- 从
QUERY(IMPORTXML(A1,"//tr | //td/a/@title") 检索列“A”。在这种情况下,//tr 和 //td/a/@title 的 xpath 分别具有列“A”的值和标题。
- 从
QUERY(IMPORTXML(A1,"//tr"),"SELECT Col2,Col3,Col4,Col5,Col6,Col7,Col8") 检索列“B”到“H”。在这种情况下,第一列被删除。
结果:
参考:
如果我误解了您的问题并且这不是您想要的方向,我深表歉意。