【发布时间】:2019-06-01 01:53:43
【问题描述】:
我想知道分箱后要做什么。例如,特征之一是年龄。所以我的数据是 [11, 12, 35, 26]。
然后我应用大小为 10 的分箱:
箱子,名称
[0, 10) --> 1
[10, 20) --> 2
[20, 30) -->3
[30, 40) --> 4
然后我的数据变成 [2, 2, 4, 3]。现在假设我想将此数据置于线性回归模式。我应该将 [2, 2, 4, 3] 视为数字特征吗?还是应该将它们视为分类特征,例如先进行一次热编码,然后将其提供给模型?
【问题讨论】:
标签: machine-learning binning feature-engineering