【发布时间】:2018-03-11 22:15:28
【问题描述】:
我的数据中有一些分类特征以及连续特征。对类别特征进行热编码以找到它与标签以及其他连续生物的相关性是一个好主意还是绝对坏主意?
【问题讨论】:
-
二进制还是 n 元分类?有序还是无序?
-
“它与标签的相关性” => 它与分类响应变量的相关性(多少个值?)
标签: pandas machine-learning categorical-data feature-engineering