【问题标题】:IMPORTHTML or IMPORTXML to collect data from a siteIMPORTHTML 或 IMPORTXML 从站点收集数据
【发布时间】:2019-11-20 00:46:38
【问题描述】:

我已多次尝试收集此表中的数据:

我评论过的两个函数的简单方法,我试过了,但没有成功。

如果有人知道在 Google 表格中收集这些数据的任何其他方式,我想知道。

网站链接:
https://www.onlinebettingacademy.com/stats/team/brazil/operrio-pr/13217#tab=t_squad

【问题讨论】:

    标签: xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml


    【解决方案1】:

    您要抓取的表在 JavaScript 控制下,因此无法抓取。

    您可以从该网站获取到 Google 表格的所有信息是:

    =ARRAY_CONSTRAIN(IMPORTDATA(
     "https://www.onlinebettingacademy.com/stats/team/brazil/operrio-pr/13217#tab=t_squad&team_id=13217"); 10000; 10)
    

    【讨论】:

    • 我曾想象过,但决定要求完全确定。谢谢朋友!
    【解决方案2】:

    因为您尝试抓取的页面是使用 Javascript 呈现的 - 即您要抓取的内容不在标记中,您将无法使用 Google 表格之类的工具。

    但是...您可以使用“无头浏览器”轻松抓取此内容。你几乎会使用一个浏览器(没有 UI),它会使用 Javascript 呈现你的 URL,然后一旦页面加载,你就可以使用 XPATH 等查询数据。

    查看Puppeteer 获取可用于此任务的 JS 框架示例。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-01-22
      • 1970-01-01
      • 1970-01-01
      • 2011-09-21
      相关资源
      最近更新 更多