是否有必要在 y_train 和 y_test 上使用 StandardScaler？如果是，案例？

【问题标题】：Is it necessary to use StandardScaler on y_train and y_test? If yes, cases?是否有必要在 y_train 和 y_test 上使用 StandardScaler？如果是，案例？
【发布时间】：2020-02-28 01:22:25
【问题描述】：

已经阅读了多个在 y_train 和 y_test 上使用 StandardScaler 以及不使用它的案例。有什么具体的规则应该在他们身上使用吗？

【问题讨论】：

当你的特征有不同的尺度时，你应该标准化它们的值。
这对于Cross Validated 或Data Science 堆栈站点来说是一个更好的问题，因为它与理论而不是特定的编码问题有关
stats.stackexchange.com/questions/111467/…

标签： python python-3.x pandas scikit-learn data-science

【解决方案1】：

引用here:

数据集的标准化是许多机器的共同要求学习估计者：如果个人功能或多或少看起来不像标准正态分布数据（例如，均值和单位方差为 0 的高斯）。

例如在目标函数中使用的许多元素学习算法（如支持向量机的 RBF 核）或线性模型的 L1 和 L2 正则化器）假设所有特征以 0 为中心，并且具有相同顺序的方差。如果一个特征的方差比它大几个数量级其他，它可能会主导目标函数并使估计器无法按预期正确地从其他特征中学习。

因此，当您的功能具有不同的比例/分布时，您应该标准化/缩放它们的值。

【讨论】：