【发布时间】:2011-05-10 09:21:34
【问题描述】:
我正在尝试找到一种方法来存储我的数据,并且可以快速访问(优于 O(n))。
我的数据库由数据(4096 字节字符串)组成,这些数据表示有关某些项目的一些信息。
问题是,查询永远不会准确。我得到一个项目,然后需要使用函数F(a,b) 找到最接近的匹配项。
只是一个例子:
1234
3456
6466
F(a,b) = return % of similar digits
GetClosest(1233,F) = 1234
问题在于 F(a,b) 是一个复杂的算法,(不是一个合适的度量)。
我现在所拥有的只是遍历整个数据库以搜索最佳匹配。
有没有一种树或其他集群数据库类型可以让我更快地找到复杂性?
更多信息:
F 以百分比返回相似度值。其中 100% 是完美匹配。
【问题讨论】:
-
是否可以在实际检索过程之前重新排列/存储数据 wrt 索引?
标签: database algorithm search approximation