【发布时间】:2018-02-05 12:21:19
【问题描述】:
我有 2 个数据帧(df1 和 df2)具有相同的 MultiIndex。 df1 有 A 列,df2 有 B 列。
我发现了 2 种“加入”这些数据框的方法:
df_joined = df1.join(df2, how='inner')
或
df1['B'] = df2['B']
第一个选项需要更长的时间。为什么? 选项 2 是否不查看索引而只是将列“附加”到右侧?
之后运行返回True,所以最终结果看起来是一样的,但这可能是因为df1和df2中的索引也是相同的顺序:
df_joined.equals(df1)
在知道索引相同的情况下,有没有更快的方法来加入数据帧?
【问题讨论】: