【发布时间】:2013-05-14 12:59:03
【问题描述】:
我需要一种算法来计算和衡量两个单词或短语的相关性,例如“苹果”和“iPad”。
谁能给我一些关于这些主题的提示或相关书籍?
谢谢。
【问题讨论】:
-
我想要的不是相关性,而是相关性的衡量标准。
我需要一种算法来计算和衡量两个单词或短语的相关性,例如“苹果”和“iPad”。
谁能给我一些关于这些主题的提示或相关书籍?
谢谢。
【问题讨论】:
看看mutual information 和tf-idf。这些是信息检索中经常使用的方法。前者量化了两个变量的相互依赖关系(每个变量都可以是一个短语)。搜索引擎传统上使用后者来确定与特定查询相关的结果的优先级。
【讨论】: