【发布时间】:2020-11-12 14:08:20
【问题描述】:
我正在从 url 中读取 csv 文件,并将所有 csv 文件附加到一个 csv 中。 最终的 csv 不包含来自 https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-regioni/dpc-covid19-ita-regioni-20201023.csv
到
其他都还好。 我什么都试过了,但所有的 csv 看起来都不错,我不明白为什么这些 csv 不好(从 ...20201023.csv 到 ...20201028.csv) 如果我单独阅读它们可以工作,那么问题出现在 pd.concatenate
你能帮忙吗?
'''
import pandas as pd
from pandas import read_csv
import requests
import io
from matplotlib import pyplot
from datetime import datetime
from datetime import timedelta
from datetime import date
import matplotlib.pyplot as plt
#url = 'https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-regioni/dpc-covid19-ita-regioni-20200224.csv'
begin_date = date(2020, 10, 23)
delta3 = date.today() - begin_date
n = delta3.days
url_path_base = 'https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-regioni/dpc-covid19-ita-regioni-'
data_vec = []
urls = []
for x in range(n):
el = datetime.today() - timedelta(x+1)
data_vec.append(el.strftime('%Y%m%d'))
url = url_path_base + el.strftime('%Y%m%d') + '.csv'
urls.append(url)
ds = []
#print(urls)
for f in urls:
s=requests.get(f).content
ds.append(pd.read_csv(io.StringIO(s.decode('utf-8'))))
frame = pd.concat(ds, axis=0, ignore_index=True)
frame.set_index("data")
'''
【问题讨论】: