【发布时间】:2020-07-28 13:55:22
【问题描述】:
大家好, 我正在尝试在 Dataframe 中导入许多 csv 文件。 我有一个错误:值错误:没有要连接的对象
这是我的代码:
from glob import iglob
import numpy as np
import pandas as pd
# read datas from github repository
path = r'https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_daily_reports'
df1 = pd.concat((pd.read_csv(f) for f in iglob(path+"/*.csv", recursive=True)), ignore_index=True)
感谢您的帮助。如果认为是由于路径定义?
【问题讨论】:
-
你不能像这样 glob 一个 web 路径。您也不应该使用来自 github.com 的 CSV,因为那实际上是 HTML。对于 csv,使用原始文件,例如 raw.githubusercontent.com/CSSEGISandData/COVID-19/master/…
-
谢谢,我如何获取 GitHub 文件列表?
-
您可以克隆存储库并在文件在您的计算机上后对其进行 glob。由于文件是日期,您还可以根据日期创建 URL 并在这些 URL 上使用
pd.read_csv
标签: python pandas git csv glob