【问题标题】:integrate wordnet with solr7.5.0将 wordnet 与 solr7.5.0 集成
【发布时间】:2019-03-04 06:06:35
【问题描述】:
我是 solr7.5.0 的初学者,我不了解它的每个模块。在构建问答系统时,我想集成 wordnet,以便获得更好的查询响应。我用谷歌搜索并找到了一些方法和以前的question,但我真的很困惑如何在 solr 版本 7.5.0 中逐步进行操作。
编辑:solr7.5.0 有WordnetSynonymParser 类,所以如果有人从事同样的工作,请指导我如何使用这个类,或者有其他方法吗?我可以用python来做吗?
提前致谢。
【问题讨论】:
标签:
java
python
solr
lucene
wordnet
【解决方案1】:
article 这个article 对这个问题很有用,wordnet 的集成可以通过,wordnet prolog file('wn_s.pl') 里面有synsets,我们可以把它转换成synonyms.txt 就可以了可被 Solr 消耗。因此,要转换 wn_s.pl 文件,我们可以使用Syns2Syms.java。它会生成 Synonyms.txt,我们可以将其索引到 solr。
但如果是针对特定领域的搜索,WordNet 扩展只会在相关性方面产生边际收益,因此只需根据索引中的常见标记创建自己的同义词列表即可获得更多相关性。