【发布时间】:2019-12-07 14:54:28
【问题描述】:
我正在尝试建立一个基于特征向量 (x1, x2, ..., xn) 预测连续变量 y 的机器学习模型。我从其他地方知道 y 服从正态分布。我可以以某种方式将其指定给模型并以这种方式增强其预测吗?是否有允许我这样做的特定模型?
我使用过线性模型、k-最近邻模型和随机森林模型(在 python 中)。他们都给出了一些预测,但我想知道它们是否可以被一些知道预测变量分布的模型所超越。
【问题讨论】:
-
模型还从训练集的分布中学习。如果训练集是正态分布的(应该如此),模型会考虑到这一点。
-
我知道它确实隐含地学习了它,但它仍然不会增强预测以直接告诉它分布是什么?
标签: python machine-learning scikit-learn regression supervised-learning