【问题标题】:Polish search for Sphinx?波兰语搜索狮身人面像?
【发布时间】:2011-02-03 19:05:11
【问题描述】:

我想为一个用 Django 编写的网站实现搜索解决方案。从可用的选项(我研究过 Solr、Sphinx、Xapian、PostgreSQL/Tsearch3、MySQL)来看,Sphinx 看起来是最好的。但是,它不支持波兰语的词干提取,这就是我想要搜索的数据语言。

在 Sphinx 中处理不受支持的语言的最佳方法是什么?我有一种直觉,我可以从 Ispell 词典中创建一个词干语料库。如何使用 Sphinx 进行这项工作?

【问题讨论】:

    标签: search full-text-search sphinx stemming polish


    【解决方案1】:

    http://snowball.tartarus.org/mailist 中搜索,如果有人尝试创建波兰语词干分析器,您可能会找到一些信息。有 2 个免费的词干分析器可用,但它们是用 java 制作的(我认为至少有一个是为 solr/lucene 制作的)。在 Ispell 中,我不确定词干提取语料库是否可以帮助您,您可以创建用于 wordforms 或 excepts 的文件。

    【讨论】:

      猜你喜欢
      • 2015-04-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多