机器学习算法的规范化输入

【问题标题】：Normalizing Input for Machine Learning Algorithm机器学习算法的规范化输入
【发布时间】：2018-08-29 17:13:48
【问题描述】：

我想对一些机器学习算法（神经网络）和对数回归的预测变量进行归一化（z-score、minmax 等），我想知道：

1) 我是否应该标准化整个预测变量，即训练和测试数据？

2) 是否应该标准化我的预测变量，y？

【问题讨论】：

【解决方案1】：

1) 正确的过程是对训练数据进行归一化，并使用转换参数对测试数据进行归一化。下面是一个具有一个特征的 minmax 归一化示例：

training = [1, 2, 3]
test = [0, 4]

归一化数据如下：

training_normalized = [0.0, 0.5, 1.0]
test_normalized = [-0.5, 1.5]

2) 通常答案是否定的，但在某些情况下它可能有助于转换目标变量。在任何情况下，您都应该确保模型的输出能够匹配目标变量。

【讨论】：