【发布时间】:2019-03-25 10:24:29
【问题描述】:
我们正在尝试制作一个自动程序,该程序可以从一个文件夹中获取多个带有多张工作表的 Excel 文件,并将它们附加到一个数据框中。
我们的问题是我们不太确定如何执行此操作,因此该过程变得最自动化。而且由于工作表的名称不同,我们不能为它们指定任何变量。
所有文件都是*.xlsx,代码必须加载任意数量的文件。
我们尝试了不同类型的代码,主要是使用 pandas,但我们似乎无法将它们附加到一个数据帧中。
import numpy as np
import pandas as pd
import glob
all_data = pd.DataFrame()
for f in glob.glob("*.xlsx"):
df = pd.read_excel(f)
all_data = all_data.append(df, ignore_index=True)
# now save the data frame
writer = pd.ExcelWriter('output.xlsx')
all_data.to_excel(writer)
writer.save()
sheet1 = xls.parse(0)
我们希望有一个包含所有数据的数据框,这样我们就可以使用数据并提取不同的特征并进行统计。
【问题讨论】:
标签: excel python-3.x pandas dataframe load