97.55 % 的准确度是否表明模型过拟合？答案

【问题标题】：Does an accuracy of 97.55 % indicate an overfitted model?97.55 % 的准确度是否表明模型过拟合？
【发布时间】：2020-06-14 23:12:47
【问题描述】：

我已实施逻辑回归模型来预测高风险索赔。我的模型给出了 97% 的准确率。这是否表明我的模型过度拟合？

【问题讨论】：

根据这么少的信息，实际上无法回答模型是否过度拟合。你至少应该告诉你在训练中每个类有多少数据点，你是否使用了单独的 tets 集，如果使用了这个测试集，模型在这个测试集上的结果是什么。
不，过拟合不是通过查看原始精度来确定的，通常您需要使用某种形式的cross validation。无论如何，这并不是关于堆栈溢出的真正主题问题，它是针对 programming 问题的，你可能想要...Cross Validated
@AlexanderPivovarov 很抱歉错过了细节。是的，我使用了单独的测试集。响应变量高度不平衡，因此我对训练集进行过采样以获得 2 个类别的平均分布。我的训练集有 213316 条记录，测试集有 26703 条记录。我的模型在测试集上的准确率为 97%，召回率为 94.24%，准确率为 99.9%。
评论不是提供此类信息的地方；请相应地编辑和更新您的问题。

【解决方案1】：

训练集中的准确率不足以导致过拟合。你在使用验证集吗？如果你不使用它，你应该将你的数据集分成三个部分：验证集、测试集和训练集。在训练期间，您应该使用训练和验证集。如果您的训练集准确率高而验证集准确率低，则您的模型过度拟合。

【讨论】：