【问题标题】:Web Scraping into Excel网页抓取到 Excel
【发布时间】:2018-08-15 10:59:06
【问题描述】:

我想创建一个电子表格,我可以刷新并提取每周英格兰超级联赛的赛程,每周我都想刷新这个并查看未来几周的赛程。我尝试使用来自 Data/From Web 的导入功能,并选择了带有夹具表的框,但是没有数据被拉入电子表格。

我使用的网站是-“http://data.7m.com.cn/matches_data/92/en/index.shtml

我愿意理解一种更好的导入方式,如果有更好的网站可以使用,我也很乐意做出改变。我选择了这个,因为它似乎有最简化的固定装置列表。 我也试过这个网站 - https://www.premierleague.com/fixtures 当导入完成时,它实际上会跳过所有的装置并返回所有其他信息。 我是否应该查看网页脚本中的一些 HTML 元素来提取数据?

例如在以下站点上 - https://www.premierleague.com/fixtures 我正在寻找网站收到的每周更新固定装置的文件(在 Google 的一些指示之后)我点击 F12 命令并查看“网络”选项卡但是我无法理解该网站、该网站或其他引用的网站是如何创建每周固定装置的。 任何有关如何将其导入 Excel 或其他工具的建议都会很棒。

【问题讨论】:

    标签: excel web-services web-scraping import


    【解决方案1】:

    欢迎来到 [so]! 听起来您还没有做尽可能多的研究。您的第一个链接,在上角有指向“免费供稿”的链接,可将您带到可自定义的小部件,并从那里有一个指向可自定义的实时模板的链接。第一页还有一个指向“数据”的链接,我不确定这包括什么或是否会有所帮助(因为我在我的大陆上不太喜欢体育迷,在你的大陆上更是如此!

    至于导入 Excel,我看到的表格没有问题,但我再次不清楚您要获取哪些数据以及您想用它做什么。

    1. 在功能区的Data 选项卡上单击From Web
    2. 在您的问题中输入first URL,然后点击Enter
    3. 当导航器窗口加载时,点击“Table 1”,然后点击Load
      下面是 Excel 然后自动加载为表格的内容:

    如果您不是单击 Load,而是单击 Edit,那么您将进入 Power Query 编辑器,您可以在其中自定义大量内容。我感兴趣的是Use First Row on Headers。选择后,点击 Close & Load,30 秒后格式化:

    使用 Power Query,您可以选择、删除、拆分或组合此表或其他表中的列。它相当先进,但您应该能够在线找到一个很好的 Power Query 教程,查看您可以做什么的示例,了解您可以自定义数据导入和/或分析的其他方法.


    编辑:

    更多信息:

    以下是所有版本的说明:

    【讨论】:

    • 我使用的是 - "data.7m.com.cn/matches_data/92/en/index.shtml",当我尝试导入并收到一条消息说没有要导入的数据时。我也没有“加载”选项(Excel 2010)我看到导入或 Go。
    • @Stephen :我编辑添加a link 以及所有版本的说明。
    • 回到 Excel 2010 嗯,这很不幸;很多东西都变了。 . .请注意,如果您是 studentdeveloper,则可以直接从 Microsoft 获得 Office 365 的免费副本(即将成为 Office 2019!)没有字符串(完整版 - 不是试用版,没有字符串)。
    • 下载这个插件已经解决了我的问题,感谢你们;-)
    • 如果解决方案满足您的需求,请记住考虑接受。 stackoverflow.com/help/someone-answers
    猜你喜欢
    • 2014-11-25
    • 1970-01-01
    • 2020-05-10
    • 2020-12-05
    • 1970-01-01
    • 2018-05-31
    • 1970-01-01
    • 2020-06-18
    相关资源
    最近更新 更多