【发布时间】:2020-01-15 23:18:04
【问题描述】:
我一直在寻找一种编写脚本的方法,该脚本将从特定网站下载文件,但无需打开网站本身。我希望一切都在后台发生。
该网站是 Morningstar,该示例的特定链接是这个:
https://financials.morningstar.com/ratios/r.html?t=MSFT
在此页面中,有一个“按钮”(它实际上并没有声明为按钮,而是声明为超链接,HTML 中的<a> 标记)
我在底部添加了一张照片,这样您就可以看到他们编写代码的确切方式。
无论如何,我看到当我单击按钮时,href 属性实际上调用了一个 javascript 函数,该函数然后创建了从中下载文件的链接。
我正在寻找一种方法来编写脚本并为其提供我想要的链接,例如上面的链接,该脚本会将这个特定的 CSV 文件从该页面下载到我选择的文件夹中。
我正在查看一些 selenium 教程,但对于我的具体问题找不到太多帮助。
【问题讨论】:
-
不打开网页是什么意思?为什么这很重要?
-
嗨,也许 PhantomJS 可能在这种情况下工作? stackoverflow.com/a/26440563/11746212
-
如果你知道下载地址可以使用requests
-
@K753 仅当网站是静态的,但我有理由确定 Morningstar 使用动态脚本
-
你试过他们的 API 吗?不确定它是否免费,但这里有一个链接。 developer.morningstar.com/apis/…
标签: javascript python html selenium web