【发布时间】:2016-10-19 15:35:21
【问题描述】:
我有一个数据,其中每个样本都有由 x 和大约 9000 个其他特征组成的特征向量以及对应的 y(目标值)。其中 x 和 y 都是连续值(介于 0 到 20 之间)。 x 噪声数据,但我们无法识别噪声源。目标是根据 x 和其他特征预测 y(特征没有噪声)。样本数量约为 900,000。我可以在这个问题中使用哪些机器学习方法。也是神经网络或深度学习中著名的网络。
【问题讨论】:
-
我有点困惑你在找什么?您是否需要有关算法、算法配置的建议?
-
我正在寻找可用于解决此问题的算法或常见机器学习方法。例如,这个问题可以看作是一个回归问题,但是输入数据 x 是嘈杂的,我们在回归中没有这个属性。我想知道机器学习中是否有一种通用的方法或算法来解决这类问题或靠近这个问题的问题。如果有任何我会很感激只是命名它。
-
在这种情况下,我想你自己回答了这个问题。我首先想到的方法是神经网络。数据集特征之间的交互将决定该网络的架构(因此我们无法对此发表评论),并且您将拥有一个处理回归的输出节点。
-
我读对了吗?您想仅根据 X 预测 Y,而不使用其他 9000 个特征?
-
看看“如何处理高维输入空间的机器学习问题?” stackoverflow.com/questions/2255833/…
标签: machine-learning neural-network deep-learning