【发布时间】:2021-04-23 13:29:14
【问题描述】:
我有一个预期的数组[1,1,3] 和一个预测的数组[1,2,2,4],我想要计算precision_recall_fscore_support,所以我需要一个格式如下的矩阵:
>> mlb = MultiLabelBinarizerWithDuplicates()
>> transformed = mlb.fit_transform([(1, 1, 3), (1, 2, 2, 4)])
array([[1,1,0,0,1,0],
[1,0,1,1,0,1]])
>> mlb.classes_
[1,1,2,2,3,4]
对于重复的值,我不关心打开了哪一个,这意味着这也是一个有效的结果:
array([[1,1,0,0,1,0],
[0,1,1,1,0,1]])
MultiLabelBinarizer 明确表示“所有条目都应该是唯一的(不能包含重复的类)”,因此它不支持此用例。
【问题讨论】:
标签: python scikit-learn data-science