【发布时间】:2019-10-15 18:14:20
【问题描述】:
如何获取 MultiLabelBinarizer 中的项目计数?
import pandas as pd
from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()
pd.DataFrame(mlb.fit_transform([(1,1,2), (3,3,2,5)]),columns=mlb.classes_)
Out[0]:
1 2 3 5
0 1 1 0 0
1 0 1 1 1
我想要得到的不是这个,而是
Out[0]:
1 2 3 5
0 2 1 0 0
1 0 1 2 1
因为 1 在第 1 行重复了 2 次,而 3 在第 2 行重复了 2 次p>
【问题讨论】:
标签: python-3.x machine-learning scikit-learn data-manipulation