【问题标题】:Search engine for web app - multi lingual and multibaseWeb 应用程序的搜索引擎 - 多语言和多数据库
【发布时间】:2010-10-01 13:35:35
【问题描述】:

我正在做一个网站项目。我们有一个 MySql 和一个 MongoDb 库。

  • 我们想在这些基础上添加一个全文搜索引擎(如果它可以与 PostgreSql 链接就更好了)。

  • 这些数据库包含多语言文本,但我们无法确定语言。

我看到了 Solr、ElasticSearch 和 Sphinx,但您对这个主题有什么建议?

  • Solr 和 Sphinx 有词干,但我不确定我们是否可以在不了解内容语言的情况下使用它...

  • Elastic 是完整的 JSON,如果我们使用越来越多的 mongoDb 会更好...

【问题讨论】:

    标签: mysql mongodb solr search-engine sphinx


    【解决方案1】:

    无论您使用什么搜索引擎,词干提取都高度依赖于语言。恕我直言,您必须以某种方式检测语言才能将文本提供给正确的词干分析器。

    【讨论】:

      【解决方案2】:

      Basis Technologies 有一款名为 Rosette 语言平台的产品,它可以自动检测您可能会研究的语言。

      Solr 支持 JSON 作为结果(和索引???),如果这是一个关键的集成机制。我会将“JSON”支持放在记分卡列表的更下方,并关注搜索引擎 X 的结果与我的域的相关性如何。

      【讨论】:

        猜你喜欢
        • 2016-05-27
        • 1970-01-01
        • 1970-01-01
        • 2014-01-05
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-07-05
        相关资源
        最近更新 更多