【问题标题】:Single or multi-core Solr单核或多核 Solr
【发布时间】:2011-06-22 11:24:46
【问题描述】:

我们计划部署 Solr 来搜索从通用 CMS 平台发布的多个站点。

每种语言都会有单独的网站,而其他语言的内容大多是从英语翻译过来的。

搜索要求包括 - 关键字突出显示、建议(“您的意思是吗?”)、停用词、分面。

我们正在评估使用单核与每种语言的多核 Solr 选项。这里推荐的方法是什么?

【问题讨论】:

    标签: solr multilingual


    【解决方案1】:

    您需要多核,因为您无法在多语言数据库上进行词干提取和停用词。

    英语中常见的停用词是“by”和“is”,但这些词在许多北欧语言中的意思是“town”和“ice”。

    如果您使用多核,则每种语言都可以在其自己的核心上使用自定义的 schema.xml 来选择正确的词干分析器、停用词和受保护的词。但是同一个 JVM 在同一个服务器上运行它,所以你不需要为一种特定语言的服务器花费任何额外的钱。然后,如果负载对于一台服务器来说太大,您复制您的多核设置,所有索引都将从副本中受益。

    【讨论】:

      【解决方案2】:

      您应该使用多核方法。 当您想一次查询多个核心时,您可以使用 shards 参数 http://wiki.apache.org/solr/DistributedSearch

      【讨论】:

        猜你喜欢
        • 2011-02-12
        • 1970-01-01
        • 2023-03-12
        • 2012-01-25
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多