【发布时间】:2011-06-29 10:42:07
【问题描述】:
假设我有一个巨大的(几百万)个 n 向量列表,给定一个新向量,我需要从集合中找到一个非常接近的向量,但它不需要是最接近的。 (Nearest Neighbor 找到最近的并在 n 时间内运行)
有哪些算法可以以准确性为代价快速逼近最近邻?
编辑:因为它可能会有所帮助,所以我应该提到数据大部分时间都非常平滑,随机维度中出现尖峰的可能性很小。
【问题讨论】:
-
向量的维度是多少?你用的是什么距离函数?
-
5 维。我只是在使用勾股定理的概括。
标签: algorithm language-agnostic data-mining nearest-neighbor