【发布时间】:2018-12-20 21:11:17
【问题描述】:
我希望确定 sklearn LabelEncoder 的标签(即 0,1,2,3,...)以适应分类变量的可能值的特定顺序(例如 ['b', 'a', ' c','d'])。我猜 LabelEncoder 选择按字典顺序拟合标签,如本例所示:
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit(['b', 'a', 'c', 'd' ])
le.classes_
array(['a', 'b', 'c', 'd'], dtype='<U1')
le.transform(['a', 'b'])
array([0, 1])
如何强制编码器遵守 .fit 方法中第一次遇到的数据顺序(即将 'b' 编码为 0,'a' 编码为 1,'c' 编码为 2,以及' d' 到 3)?
【问题讨论】:
标签: python scikit-learn encoder