【问题标题】:How to import first column using =IMPORTHTML?如何使用 =IMPORTHTML 导入第一列?
【发布时间】:2020-03-05 15:17:20
【问题描述】:

我正在尝试导入此表:

来源:https://www.tradeskillmaster.com/black-market?realm=EU-draenor

但是,在使用 =IMPORTHTML("https://www.tradeskillmaster.com/black-market?realm=EU-draenor","table") 时,第一列保持空白。

测试:https://docs.google.com/spreadsheets/d/1MVgD5MUgOik89MMZweLKMZQLSkMeBNoCN_FrPe-eZ5U/edit?usp=sharing

【问题讨论】:

    标签: web-scraping google-sheets google-sheets-formula google-sheets-importxml


    【解决方案1】:

    如果表格包含 JavaScript 元素(在您的情况下确实如此),则无法使用任何公式将此类元素导入 Google 表格。不支持 GS 中的 JS 抓取。

    【讨论】:

      【解决方案2】:

      这个答案怎么样?请认为这只是几个可能的答案之一。

      在此答案中,使用IMPORTXML 代替IMPORTHTML

      示例公式:

      ={QUERY(IMPORTXML(A1,"//tr | //td/a/@title"),"SELECT Col1 WHERE Col1 IS NOT NULL"),QUERY(IMPORTXML(A1,"//tr"),"SELECT Col2,Col3,Col4,Col5,Col6,Col7,Col8")}
      
      • https://www.tradeskillmaster.com/black-market?realm=EU-draenor 的 URL 放在单元格“A1”中。
      • QUERY(IMPORTXML(A1,"//tr | //td/a/@title") 检索列“A”。在这种情况下,//tr//td/a/@title 的 xpath 分别具有列“A”的值和标题。
      • QUERY(IMPORTXML(A1,"//tr"),"SELECT Col2,Col3,Col4,Col5,Col6,Col7,Col8") 检索列“B”到“H”。在这种情况下,第一列被删除。

      结果:

      参考:

      如果我误解了您的问题并且这不是您想要的方向,我深表歉意。

      【讨论】:

        猜你喜欢
        • 2014-03-14
        • 1970-01-01
        • 1970-01-01
        • 2012-06-23
        • 1970-01-01
        • 2020-02-09
        • 1970-01-01
        • 2014-06-10
        • 1970-01-01
        相关资源
        最近更新 更多