【问题标题】:Can I tell a machine learning model that the dependent variable is normally distributed?我可以告诉机器学习模型因变量是正态分布的吗?
【发布时间】:2019-12-07 14:54:28
【问题描述】:

我正在尝试建立一个基于特征向量 (x1, x2, ..., xn) 预测连续变量 y 的机器学习模型。我从其他地方知道 y 服从正态分布。我可以以某种方式将其指定给模型并以这种方式增强其预测吗?是否有允许我这样做的特定模型?

我使用过线性模型、k-最近邻模型和随机森林模型(在 python 中)。他们都给出了一些预测,但我想知道它们是否可以被一些知道预测变量分布的模型所超越。

【问题讨论】:

  • 模型还从训练集的分布中学习。如果训练集是正态分布的(应该如此),模型会考虑到这一点。
  • 我知道它确实隐含地学习了它,但它仍然不会增强预测以直接告诉它分布是什么?

标签: python machine-learning scikit-learn regression supervised-learning


【解决方案1】:

您可以做到这一点的一种方法是创建一个自定义目标函数来惩罚非正态分布的预测。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-09-18
    • 1970-01-01
    • 2016-03-27
    • 2020-03-01
    • 2018-09-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多