【发布时间】:2017-06-30 23:22:06
【问题描述】:
我知道,通常情况下,如果 k = 1,那么对象会简单地分配给该单个最近邻居的类。但是我发现了一个问题,它说一个点可以是它自己的邻居,它要求我找到一个 k 来最小化训练误差。所以我想知道在这种情况下,k可以为1吗?
【问题讨论】:
-
使用 k-NN 评估“训练集”时必须非常小心。
标签: machine-learning classification
我知道,通常情况下,如果 k = 1,那么对象会简单地分配给该单个最近邻居的类。但是我发现了一个问题,它说一个点可以是它自己的邻居,它要求我找到一个 k 来最小化训练误差。所以我想知道在这种情况下,k可以为1吗?
【问题讨论】:
标签: machine-learning classification
当使用 k-NN 评估训练错误时,您正在使用训练集本身对训练集中的每个实例进行分类。
如果一个点可以是它自己的邻居,那么使用k = 1 将产生完美的性能,因为它总是会为每个点预测该点自己的标签。所以,是的,使用k = 1 肯定会最大限度地减少训练错误。
【讨论】: