【发布时间】:2019-04-30 09:51:17
【问题描述】:
我有 2 个数据框。 df_A - 这是一个模板数据框,它按顺序具有特定数量的列。
例如:[emp_id、first_name、last_name、age、gender、dept]
df_B - 这是一个数据框,可能包含也可能不包含 df_A 的所有列。
例如:[emp_id, first_name, last_name, age,dept] = [ 001, john, mathew, 32, 047]
我想比较 df_B 和 df_A 来创建一个新的数据框 [001, john, mathew, None, 047] 列名与 df_A 相同。
我正在使用 python 3。我尝试使用
col_diff = df_A.columns.difference(df_B)
获取“性别”列。然后将其转换为列表
col_diff.tolist()
并将其添加到 df_B。但是这一列被添加到 df_B 的末尾,我得到了
[001,约翰,马修,047,无]
但我想保留与 df_A 相同的列顺序。
输出应该是: [001,约翰,马修,无,047]
你能帮忙吗?感谢您的宝贵时间。
【问题讨论】:
标签: python-3.x pandas