【问题标题】:Is it necessary to use StandardScaler on y_train and y_test? If yes, cases?是否有必要在 y_train 和 y_test 上使用 StandardScaler?如果是,案例?
【发布时间】:2020-02-28 01:22:25
【问题描述】:

已经阅读了多个在 y_train 和 y_test 上使用 StandardScaler 以及不使用它的案例。有什么具体的规则应该在他们身上使用吗?

【问题讨论】:

标签: python python-3.x pandas scikit-learn data-science


【解决方案1】:

引用here:

数据集的标准化是许多机器的共同要求 学习估计者:如果个人 功能或多或少看起来不像标准正态分布 数据(例如,均值和单位方差为 0 的高斯)。

例如在目标函数中使用的许多元素 学习算法(如支持向量机的 RBF 核) 或线性模型的 L1 和 L2 正则化器)假设所有 特征以 0 为中心,并且具有相同顺序的方差。如果 一个特征的方差比它大几个数量级 其他,它可能会主导目标函数并使 估计器无法按预期正确地从其他特征中学习。

因此,当您的功能具有不同的比例/分布时,您应该标准化/缩放它们的值。

【讨论】:

    猜你喜欢
    • 2013-02-04
    • 2017-10-08
    • 1970-01-01
    • 2020-06-23
    • 2012-09-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-08-28
    相关资源
    最近更新 更多