【发布时间】:2020-06-14 23:12:47
【问题描述】:
我已实施逻辑回归模型来预测高风险索赔。我的模型给出了 97% 的准确率。这是否表明我的模型过度拟合?
【问题讨论】:
-
根据这么少的信息,实际上无法回答模型是否过度拟合。你至少应该告诉你在训练中每个类有多少数据点,你是否使用了单独的 tets 集,如果使用了这个测试集,模型在这个测试集上的结果是什么。
-
不,过拟合不是通过查看原始精度来确定的,通常您需要使用某种形式的cross validation。无论如何,这并不是关于堆栈溢出的真正主题问题,它是针对 programming 问题的,你可能想要...Cross Validated
-
@AlexanderPivovarov 很抱歉错过了细节。是的,我使用了单独的测试集。响应变量高度不平衡,因此我对训练集进行过采样以获得 2 个类别的平均分布。我的训练集有 213316 条记录,测试集有 26703 条记录。我的模型在测试集上的准确率为 97%,召回率为 94.24%,准确率为 99.9%。
-
评论不是提供此类信息的地方;请相应地编辑和更新您的问题。
标签: machine-learning logistic-regression evaluation