【问题标题】:Find the nearest neighbour with more than 3 dimension找到大于 3 维的最近邻
【发布时间】:2020-10-13 06:57:15
【问题描述】:

我有一个包含 2000 个数据和 15 个特征(列)的数据库,我想创建一个推荐系统来向我推荐与我选择的行最相似的行。

例如,我想在我的数据库中找到与第 150 行最相似的行。

你推荐哪种算法来帮助我完成这个项目?

KNN 对这个问题有用吗?


这是我的一行数据:

name1 = 12\241\42\0.4\0.5 ... \241

如您所见,我的所有数据集都是数字,但名称列除外。

【问题讨论】:

标签: python scikit-learn knn nearest-neighbor recommender-systems


【解决方案1】:

看来 KNN 就是您要找的东西。要实现多维 KNN,我建议您查看欧几里德距离方程:

Euclidean distance

这决定了一个“行”到另一个“行”的距离。然后,您可以使用此等式计算最接近的“k”行。

【讨论】:

  • KNN 会将您的数据放入您指定的集群数量中,但不会告诉您最近的点。为什么不从scipy.spatial.distance.cdist() 计算成对距离矩阵?
  • 我同意谢尔盖的观点。这是明智的。
猜你喜欢
  • 1970-01-01
  • 2015-02-24
  • 2011-12-06
  • 1970-01-01
  • 2014-12-25
  • 1970-01-01
  • 2020-06-15
  • 1970-01-01
  • 2011-08-10
相关资源
最近更新 更多