【问题标题】:search result mismatch in solr 4.7 for spanish characterssolr 4.7 中西班牙语字符的搜索结果不匹配
【发布时间】:2014-05-07 23:15:48
【问题描述】:

对于 solr 4.7 中的 ñ 和 Ñ 等西班牙语字符,搜索未显示正确的结果。我在 solr 帮助中进行了搜索,发现字符不在 ASCII 范围内。

如何用 ASCII 字符映射非 ASCII 字符? 例如:在 solr 索引中,我们有 chars ñ、Ñ [LATIN CAPITAL LETTER N WITH TILDE] 或正常的 n,N 应该使用什么过滤器/标记来搜索 Normal N 或 Ñ 并且两者都应该被映射?

而字符 Ń [LATIN CAPITAL LETTER N WITH ACUTE] 是一个例外。

【问题讨论】:

  • 它不起作用,因为字符ñ和Ñ不在ASCII字符范围内,它们是非ASCII字符。我想要这样,当我搜索单词 Cañen 时,它应该为我提供包含单词“cañen”和“canen”的结果。

标签: solr


【解决方案1】:

我尝试使用the ICUFoldingFilterFactory 这对这些口音效果很好。如果这个设置起来很棘手,请查看 SO question Can not use ICUTokenizerFactory in Solr

这个分析器

<fieldType name="spanish" class="solr.TextField">
    <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory" />
        <filter class="solr.ICUFoldingFilterFactory" />
    </analyzer>
</fieldType>

得到这些分析结果,屏幕截图来自 solr-admin

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-10-26
    • 2023-03-18
    • 2013-07-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多