【发布时间】:2021-03-14 09:08:24
【问题描述】:
我想下载一个 csv 文件,您可以从以下公共页面下载:
https://www.historique-meteo.net/france/rh-ne-alpes/annecy-haute-savoie/2016/02/
在右上角,您会看到一个下载按钮“导出 CSV”,它将下载一些 csv 文件。 用开发者控制台查看代码你会发现这个按钮的html代码是
<a href="/site/export.php?ville_id=1025&annee=2016&mois=02" class="btn btn-small btn-theme pull-right">export CSV</a>
所以我尝试通过以下命令使用 curl/wget 下载 csv 文件
curl "https://www.historique-meteo.net/site/export.php?ville_id=1025&annee=2016&mois=02"
wget "https://www.historique-meteo.net/site/export.php?ville_id=1025&annee=2016&mois=02"
但我没有得到 csv 文件。我要么得到一些 html 数据,要么得到 503 错误。
如何正确做?
【问题讨论】:
-
你得到 503 的原因是该页面在 Cloudflare DDOS 保护之后。
-
但是使用网络浏览器,我可以从该页面下载 csv 文件,该页面位于 Cloudflare DDOS 保护之后。我不能模拟浏览器的功能吗?