【发布时间】:2016-08-16 17:14:29
【问题描述】:
假设您有两个具有如下属性集的用户:
userA = {"happy", "excited"}
userB = {"sad", "anxious"}
现在,如果我们要计算它的 Jaccard 相似度,它将为 0。但是,我们想要定义 excited 与 anxious 非常相似。
我的问题是,如何构建?
我要定义另一组与excited 同义的词吗?那么我如何将其纳入 Jaccard 指数计算中?
【问题讨论】:
标签: algorithm statistics data-mining similarity