所谓过拟合(over-fitting)其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳。
如果模型很简单,但是要分的类型很多就会产生欠拟合。比如要求用一条直线将数据分成10类。 反之如果模型很复杂,但是分类很简单,就容易产生过拟合。比如,有一个复杂度很高的非线性分类器,用来分类猫和狗。训练久了以后,可能会出现有几个长得像狗的猫和长得像猫的狗的个例都能被正确分类了。这时候你的模型很可能已经过拟合了,因为训练成这样的模型在遇到新的数据的时候,将样本错误分类的可能性很大。