【发布时间】:2018-01-16 09:53:59
【问题描述】:
我对python真的很陌生,所以请多多包涵!
我的桌面上有一个文件夹,其中包含一些名为“File 1.csv”、“File 2.csv”等的 csv 文件。在每个文件中,都有一个表格,如下所示:
Animal Level
Cat 1
Dog 2
Bird 3
Snake 4
但每个文件在“动物”列中都有一些不同之处。我编写了以下代码,一次只比较两个文件并返回匹配的动物:
def matchlist(file1, file2):
new_df = pd.DataFrame()
file_one = pd.read_csv(file1)
file_two = pd.read_csv(file2)
for i in file_one["Animal"]:
df_temp = file_two[file_two["Animal"] == i]
new_df = new_df.append(df_temp)
df_temp = pd.DataFrame()
return new_df
但这一次只能比较两个文件。有没有一种方法可以遍历该单个文件夹中的所有文件并返回与上面的 new_df 匹配的所有文件?
例如,new_df 比较文件 1 和文件 2。然后,我正在寻找将 new_df 与文件 3、文件 4、文件 5 等进行比较的代码。
谢谢!
【问题讨论】:
标签: python-3.x pandas csv dataframe iteration