机器学习查询 [关闭]答案

【问题标题】：Machine learning query [closed]机器学习查询 [关闭]
【发布时间】：2018-11-16 17:43:58
【问题描述】：

如果我错了，请纠正我。 “训练集用于计算机器学习模型的参数，验证数据用于计算同一模型的超参数（我们使用相同的权重和不同的超参数），测试集用于评估我们的模型”。如果属实，有人可以更详细地解释整个过程。 TIA。

【问题讨论】：

我认为这个问题更适合 CrossValidated 或 DataScience 堆栈交换。

标签： python validation machine-learning hyperparameters

【解决方案1】：

假设您使用 70% 的数据训练随机森林分类器，那么它将帮助您的分类器从这些训练数据中识别出对随机森林分类器有用的属性或特征。但是有很多超参数，例如随机森林分类器的深度，影响RF分类器的性能。您可以通过在验证集上绘制准确度图（比如另外 10% 的数据）来检查哪个深度可以提供最佳性能。在训练并找到正确的超参数值后，您可以在测试数据（剩余 20% 的数据）上测试分类器的性能。

【讨论】：

谢谢你这么好的回答。如果您能回答我在阅读您的答案后提出的两个问题，那将是一个很大的帮助。 1）如果验证步骤在训练集之后，模型如何训练？必须为训练初始化超参数，对吧。 2）超参数在验证集中选择什么值？这些是随机值还是由我们或通过某种详尽的方法分配的。