【发布时间】:2018-12-30 22:29:41
【问题描述】:
我想从this 权益表中抓取实时数据并将其粘贴到 Excel 文件中
我尝试过使用 Python 的 beautifulsoup4 包,但是,数据并不直接驻留在页面 html 中,而是似乎使用一些 javascript 或类似的方式加载
【问题讨论】:
-
有在csv中下载选项。
-
我知道,但我想为表格提取实时数据,在这种情况下,下载 csv 选项是无用的,因为它会为您提供历史数据
-
@EvanStrom beautifulsoup(或 R 的 rvest 包)是从网站抓取数据的好方法。但是,在查看页面 html 后,我可以看到数据本身不在页面 html 中。我怀疑它是通过一些 AJAX 请求加载的。我不知道如何抓取它,但this 可能会有所帮助。我不想让你气馁,但我怀疑这可能相当困难,除非你知道一些 javascript/AJAX/jQuery 或有人帮助你
标签: javascript python r ajax web-scraping