【发布时间】:2018-01-19 03:56:11
【问题描述】:
我正在尝试在 Keras 中设置非线性回归问题。我有两组数据,例如 X1 和 X2,它们的 Y 值具有相似的均值和标准差。
正在执行以下程序:
- 组合数据集 X1 和 X2,对其进行打乱并在 30% 的数据上进行训练。 Keras 报告的训练分数为 3.20 RMSE,测试分数为 3.22 RMSE
- 使用上面的权重并针对 100% 的 X1 数据进行测试。 Keras 报告的测试分数为 23.97 RMSE
- 使用相同的权重并针对 100% 的 X2 数据进行测试。 Keras 报告的测试分数为 6.49 RMSE
我不清楚为什么 X1 和 X2 的测试分数会有如此大的差异。有什么办法可以改善结果吗?
为了咯咯笑,我重复了与上述相同的过程,但包括了整个 X1 和 X2 数据集,而不是占 30%。
- 结合 X1 和 X2,并在整个数据集上进行训练。 Keras 返回训练分数 1.81 RMSE
- 使用上面的权重并针对 100% 的 X1 数据进行测试。 Keras 报告的分数为 22.80 RMSE
- 在 X2 上的测试给出了 7.50 RMSE 的分数
与 X1 相比,X2 似乎再次表现不佳。
【问题讨论】:
-
你能分享完整的代码吗?您的数据规范化过程似乎不匹配。
-
@MarcinMożejko,感谢您指出这一点。不幸的是,缩放是问题所在。修复后我得到了很好的分数。
-
我制定了一个答案 - 我很乐意接受它:)
-
而且 - 如果你不介意 - 点赞会让我高兴 :) 我正在尝试在
keras中获得金徽章 :)
标签: neural-network keras training-data