【问题标题】:calculate similarity between two lists of tags计算两个标签列表之间的相似度
【发布时间】:2021-08-24 20:25:16
【问题描述】:

如何计算两个标签列表之间的语义相似度? 例如:

输入

list1 = ['marketing', 'social medial', 'operations', 'management']
list2 = ['software development', 'system network', 'system design']

输出

5%

有没有我可以使用的 python 包/库来做到这一点?

【问题讨论】:

标签: python nlp nlu


【解决方案1】:

你无法计算“语义相似度”,只能计算两个列表的重叠程度。您有两个任意元素列表,并希望查看这些列表彼此之间的相似程度。

有几个指标可以做到这一点,例如Jaccard IndexSørensen–Dice coefficient。这些中的任何一个都应该适合您的目的。

这假定列表中的元素是任意的,但对于您的示例,相似性为零,因为根本没有重叠。如果您想查看术语的相似性,您需要一种不同的方法。

为此,您需要计算出两个术语的成对相似性,然后您可以用它们替换相应指标中的相等性。

【讨论】:

    猜你喜欢
    • 2012-03-11
    • 2018-08-09
    • 1970-01-01
    • 1970-01-01
    • 2011-10-06
    • 2017-08-22
    • 2019-08-05
    相关资源
    最近更新 更多