【发布时间】:2021-05-04 14:39:27
【问题描述】:
这是我最近部署的一个简单的网络应用:https://covid19-visualisation.herokuapp.com/
我使用了 Dash 框架并使用 Heroku 进行了部署。
我使用df = pd.read_csv('owid-covid-data.csv') 来加载数据集。数据集可以在这里找到:
https://ourworldindata.org/covid-vaccinations
数据每天都在更新。有没有办法自动化这个过程,比如将某种链接传递给这个 read_csv 函数?
【问题讨论】:
-
使用
requests,您可以自动抓取网站并下载数据。 -
那么您是否想在每日数据集中进行流式传输,然后以某种命名/日期格式和/或 Heroku 中的目录结构保存它?或者只是用昨天的覆盖今天的每日?