【发布时间】:2016-04-24 18:55:10
【问题描述】:
我在一个目录中有 16 个不同的 csv 文件,我正在尝试将它们加载到一个 pandas 数据框中。每个文件都有datetime 和float64 列。所有 CSV 文件都没有列标题。目录
location = os.path.join(base_dir, "DirectoryName")
symbols = os.listdir(location)
df = pd.DataFrame(index=dates)
for symbol in symbols:
location = os.path.join(base_dir, "DirectoryName", symbol)
df_temp = pd.read_csv(location, index_col=0, parse_dates=True, dayfirst=True, na_values=['nan'])
df_temp.dropna()
df_temp.index = df_temp.index.normalize()
df_temp = normalize_data(df_temp)
df = df.join(df_temp)
我现在遇到的问题是最终的数据帧df,它的索引为datetime,但对应的行值作为列名,第一行填充有NaN
我必须删除df 的第一行,但这在执行其他操作时无济于事,因为会丢失一些数据。我无法重命名列标题,因为每个文件都不同,我只知道如何静态更改。
【问题讨论】:
-
如果您的列
is different for each file,您将如何将所有 CSV 文件合并/加入单个 DF?你想水平合并它们吗? -
如果您发布一个/两个 CSV 文件的链接或在此处以文本形式发布一个小数据示例,会更容易为您提供帮助...
-
所有文件都有第一列,我将其用作索引。这是文件的链接@MaxU drive.google.com/…