【发布时间】:2018-08-29 17:13:48
【问题描述】:
我想对一些机器学习算法(神经网络)和对数回归的预测变量进行归一化(z-score、minmax 等),我想知道:
1) 我是否应该标准化整个预测变量,即训练和测试数据?
2) 是否应该标准化我的预测变量,y?
【问题讨论】:
标签: machine-learning prediction normalize
我想对一些机器学习算法(神经网络)和对数回归的预测变量进行归一化(z-score、minmax 等),我想知道:
1) 我是否应该标准化整个预测变量,即训练和测试数据?
2) 是否应该标准化我的预测变量,y?
【问题讨论】:
标签: machine-learning prediction normalize
1) 正确的过程是对训练数据进行归一化,并使用转换参数对测试数据进行归一化。下面是一个具有一个特征的 minmax 归一化示例:
training = [1, 2, 3]
test = [0, 4]
归一化数据如下:
training_normalized = [0.0, 0.5, 1.0]
test_normalized = [-0.5, 1.5]
2) 通常答案是否定的,但在某些情况下它可能有助于转换目标变量。在任何情况下,您都应该确保模型的输出能够匹配目标变量。
【讨论】: