【发布时间】:2011-03-15 03:28:20
【问题描述】:
我正在 Wordnet 中搜索大量单词的同义词。我这样做的方式是,当某个单词有多个同义词时,结果按字母顺序返回。我需要的是按照它们的发生概率对它们进行排序,我只选择前 1 个同义词。
我已经使用 prolog wordnet 数据库和 Syns2Index 将其转换为 Lucene 类型索引以查询同义词。有没有办法以这种方式让它们按概率排序,或者我应该使用另一种方法?
速度不重要,这个同义词查找不会在线完成。
【问题讨论】:
-
这是非常具体的。我发现了这个:lucene.apache.org/java/2_0_0/api/org/apache/lucene/wordnet/… 但可能你已经知道了。
-
@Baltarsarq :thanx,是的,我用它来将 WordNet prolog 数据库转换为 lucene 同义词索引