【发布时间】:2016-03-29 13:05:36
【问题描述】:
我有以下数据框:
amount catcode cid cycle date di feccandid type
0 1000 E1600 N00029285 2014 2014-05-15 D H8TX22107 24K
1 5000 G4600 N00026722 2014 2013-10-22 D H4TX28046 24K
2 4 C2100 N00030676 2014 2014-03-26 D H0MO07113 24Z
我想为type 列中的值创建虚拟变量。大约有 15 个。我试过这个:
pd.get_dummies(df['type'])
它返回这个:
24A 24C 24E 24F 24K 24N 24P 24R 24Z
date
2014-05-15 0 0 0 0 1 0 0 0 0
2013-10-22 0 0 0 0 1 0 0 0 0
2014-03-26 0 0 0 0 0 0 0 0 1
我想要为Type 中的每个唯一值创建一个虚拟变量列
【问题讨论】:
-
你不是说
pd.get_dummies(df['type'])吗? -
是的!谢谢你。现在有没有办法将它添加到我的 df 中,或者我应该只是加入?
-
你希望最终的 df 看起来像什么?
-
新的 fd 应该在新的 df 中包含虚拟列
-
所以你可以
join然后:df.join(pd.get_dummies(df['type']))
标签: python pandas dummy-variable