【发布时间】:2018-03-22 04:03:08
【问题描述】:
df = pd.DataFrame(["c", "b", "a p", NaN, "ap"])
df[0].str.get_dummies(' ')
上面的代码打印出类似这样的内容。
a p b c ap
0 0 0 0 1 0
1 0 0 1 0 0
2 1 1 0 0 0
3 0 0 0 0 0
4 0 0 0 0 1
所需的输出如下:
a p b c
0 0 0 0 1
1 0 0 1 0
2 1 1 0 0
3 0 0 0 0
4 1 1 0 0
我相信这有点棘手。任何帮助表示赞赏。
【问题讨论】:
-
问题顶部链接的答案很有帮助。即: # 创建一个虚拟变量数据帧 col0_dummy_df = df['0'].str.get_dummies(sep=',') # 将虚拟变量数据帧连接到主数据帧上。 pd.concat([df, col0_dummy_df], axis=1)
标签: python pandas one-hot-encoding