【发布时间】:2016-07-29 00:33:22
【问题描述】:
我有一个 Python Pandas DataFrame,如下所示:
1
0 a, b
1 c
2 d
3 e
a, b 是代表用户特征列表的字符串
如何将其转换为用户特征的二进制矩阵,如下所示:
a b c d e
0 1 1 0 0 0
1 0 0 1 0 0
2 0 0 0 1 0
3 0 0 0 0 1
我看到了一个类似的问题Creating boolean matrix from one column with pandas,但该列不包含列表条目。
我已经尝试了这些方法,有没有办法将两者合并:
pd.get_dummies()
pd.get_dummies(df[1])
a, b c d e
0 1 0 0 0
1 0 1 0 0
2 0 0 1 0
3 0 0 0 1
df[1].apply(lambda x: pd.Series(x.split()))
1
0 a, b
1 c
2 d
3 e
还对创建这种类型的二进制矩阵的不同方法感兴趣!
感谢任何帮助!
谢谢
【问题讨论】:
标签: python pandas dataframe sparse-matrix binary-matrix