【发布时间】:2013-11-17 21:10:16
【问题描述】:
假设我有一个如下所示的数据集:
{A:1, B:3, C:6, D:6}
我还有一个其他集合的列表来比较我的特定集合:
{A:1, B:3, C:6, D:6},
{A:2, B:3, C:6, D:6},
{A:99, B:3, C:6, D:6},
{A:5, B:1, C:6, D:9},
{A:4, B:2, C:2, D:6}
我的条目可以可视化为一个表格(有四列,A、B、C、D 和 E)。
如何找到最相似的集合? 对于此示例,第 1 行是完美匹配,第 2 行是紧随其后的,而第 3 行则相距甚远。
我正在考虑计算一个简单的增量,例如:Abs(a1 - a2) + Abs(b1 - b2) + etc 并且可能会为具有最佳增量的条目获取 correlation value。
这是一种有效的方式吗? 这个问题的名称是什么?
【问题讨论】:
-
tge 值 A、B、C 和 D 是否始终不变?
-
我将永远拥有 A B C D 列是的。他们推崇的价值观当然会改变,但总会有 4 个“列”
-
您将如何解决数千条记录的问题?您会将每个与另一个进行比较,以及存储在哪个 DS 中以便有效访问?
标签: algorithm correlation similarity