【发布时间】:2013-02-20 03:08:42
【问题描述】:
我在计算 Jaccard 相似度以使用 MySQL 销售交易数据库中的交易 ID 查找类似书籍时遇到这个问题:
t1=Java、Ruby、C
t2=Java、C#、Python
t3= C#、VB、C
....等
Java 交集的大小 = 2; (我们怎样才能找到它?)
联合大小 = 3,(我们怎样才能找到它?)
Jaccard 相似度 = (交集/并集) = 2/3
但我不明白如何找出两个向量的“交集”和“并集”,或者如何在 Java/JSP 中实现它。
请帮助我,非常感谢!
【问题讨论】:
-
MySQL 数据库中的数据是什么样的? union的解释是什么?交集的定义是什么?
-
MySQL 数据库中的数据是交易ID、书籍名称和客户ID/名称。我想找出所有销售交易(联合)中每笔交易中购买次数最多的书籍(交叉点)。
-
使用 Arraylist 可能是有用的相同方法 - stackoverflow.com/questions/5283047/…
标签: java mysql jsp similarity