对于未知类别属性数据集中的点:

1、 计算已知类别数据集中的点与当前点的距离

2、 按照距离依次排序

3、选取与当前距离最小的K个点

4、确定前K个点所在类别的出现概率

5、 返回前K个点出现频率最高的类别作为当前点预测分类

一个很形象的例子可以理解:

K-近邻算法
KNN 是一种懒惰算法,分类器不需要使用训练集来进行训练,训练时间复杂度为0,KNN分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中文档总数为n,那么分类时间复杂度为O(n)

相关文章:

猜你喜欢
  • 2021-11-20
  • 2021-12-29
  • 2022-01-02
  • 2022-01-06
  • 2021-09-06
相关资源
相似解决方案