【发布时间】:2021-03-01 12:52:48
【问题描述】:
我必须创建一个应用程序,我必须在其中导入给定文件夹中的所有 excel 文件并将其添加到数据框中。数据框应如下所示:
如图所示,数据框的一列是文件名。
我已经在最终的dataframe中成功添加了该列,代码如下:
import pandas as pd
import os
import shutil
import re
path = 'C:/Users/Administrator/Desktop/Zerodha/Day2'
lst = os.listdir(path)
files = [os.path.join(path,x) for x in lst]
print(lst)
dataframes_lst = []
for file in files:
filename = file.split('/')[-1]
dataframe = pd.read_csv(file, usecols=[0,4], names ["date",filename],index_col=["date"])
dataframes_lst.append(dataframe)
df = pd.concat(dataframes_lst, axis=1)
print(df)
df.to_csv('data.csv')
使用此代码获得的数据框如下所示:
作为参考,我将附上其中一个 excel 文件的 sn-p:
还可以看到,获得了许多 nan 值。我尝试通过使用 pd.dropna(inplace = True) 函数以及按照这篇文章中的建议来删除它们:
但生成的数据框仍然包含 nan 值。
【问题讨论】:
-
我已经通过使用fillna函数解决了nan问题
标签: python excel pandas dataframe