【发布时间】:2017-01-12 14:44:47
【问题描述】:
我想知道有没有一种算法或模式可以让你比较和找到相似的词
如果我使用示例会更容易,这里是:
假设我们有一个字符串:
字符串关键字 = “妈妈的女孩”;
ArrayList = "妈妈,猫,狗,女朋友,房子,妈妈,女孩,火";
我想得到这些词的结果(因为它们在写作上相似或相同)=“妈妈,女朋友,妈妈,女孩,女孩”
【问题讨论】:
-
玩得开心Levenshtein distance 但是当然,你跑题了,所以不应该问外部来源
-
您可以使用 Levenshtein 距离作为基本的文本相似度度量,但是“Mummy's”与“Mom”的相似度是相当语义化的(如果将其视为没有意义的字符串,则不太相似) - 你需要一个同义词词典或同义词库。
标签: java algorithm string-comparison words