【发布时间】:2019-06-04 20:24:21
【问题描述】:
我有一个 pandas 数据框,左边是以下分类变量,右边是它们的具体实现,
(为低分辨率道歉)。
对于统计回归,我想标记所有这些分类变量,例如,LotShape,Reg 变为 0,IR1 变为 1,IR2 2和IR33。我发现scikit-learn的LabelEncoder可以做job,但是有问题。其中一些分类变量是隐含的序数,0、1、... 需要分配给正确的标签,而LotShape 恰好在那里按顺序排列。
所以我的问题是,我如何以我指定的某种顺序有效地标记大量分类变量?
【问题讨论】:
标签: python pandas machine-learning scikit-learn data-cleaning