【发布时间】:2021-07-13 21:26:48
【问题描述】:
我有一种情况需要合并多个数据帧,我可以使用以下代码轻松完成:
# Merge all the datasets together
df_prep1 = df_prep.merge(df1,on='e_id',how='left')
df_prep2 = df_prep1.merge(df2,on='e_id',how='left')
df_prep3 = df_prep2.merge(df3,on='e_id',how='left')
df_prep4 = df_prep3.merge(df_4,on='e_id',how='left')
df_prep5 = df_prep4.merge(df_5,on='e_id',how='left')
df_prep6 = df_prep5.merge(df_6,on='e_id',how='left')
但我想了解的是,如果有任何其他有效的方法来执行此合并,也许使用辅助函数?如果是,那我怎么能做到这一点?
【问题讨论】:
-
这取决于您的数据框...是否相同的列?没有他们每个人的样本,很难回答。
-
我在这里想问的是,是否有一种有效的方法来编写辅助函数并将所有这些数据合并语句传递给它。我相信,只要我正确创建了最终输出,所有列合并的内容并不重要。还是我在这里遗漏了什么?
-
始终避免类似结构的对象(如数字后缀集)淹没全局环境。使用
list或dict容器进行管理和组织。