【发布时间】:2015-03-20 13:30:59
【问题描述】:
我想自动从世界银行的dataset 下载 CSV 文件。
我的问题是,与特定数据集对应的 URL 不会直接指向所需的 CSV 文件,而是对世界银行 API 的查询。例如,这是获取人均 GDP 数据的 URL:http://api.worldbank.org/v2/en/indicator/ny.gdp.pcap.cd?downloadformat=csv。
如果您将此 URL 粘贴到浏览器中,它将自动开始下载相应文件。因此,我通常用于在 Python 中收集和保存 CSV 文件的代码在当前情况下无法正常工作:
baseUrl = "http://api.worldbank.org/v2/en/indicator/ny.gdp.pcap.cd?downloadformat=csv"
remoteCSV = urllib2.urlopen("%s" %(baseUrl))
myData = csv.reader(remoteCSV)
我应该如何修改我的代码以便将来自查询的文件下载到 API?
【问题讨论】:
-
这个问题更有可能是数据被压缩了。您需要先解压缩它,然后才能使用它。
-
哪些代码行可以实现这一点?
-
您必须使用
zipfilelib 从压缩包中提取数据。