【问题标题】:solr puctuation issues解决波动问题
【发布时间】:2012-12-06 22:59:45
【问题描述】:

我有一个包含

的字段
... ung eignen sich auch Computer-Rechtschreibprogramme.   Deutsch Erweiterte ...

我是这样配置的

    <fieldType name="text" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="solr.WhitespaceTokenizerFactory" />
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
            <filter class="solr.WordDelimiterFilterFactory" 
                    generateWordParts="1" generateNumberParts="0" catenateWords="1"
                    catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"
                    splitOnNumerics="0" stemEnglishPossessive="0"/>
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.TrimFilterFactory" />   
            <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
            <filter class="solr.ReversedWildcardFilterFactory" />
            <filter class="solr.LengthFilterFactory" min="1" max="100" />
            <filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}]" replacement="" replace="all"/>
        </analyzer>
    </fieldType>

但是

q=volltext:Rechtschreibprogramm*
q=volltext:*Rechtschreibprogramm*

没有给出结果,为什么?

q=volltext:*echtschreibprogramm*

找到文档

我正在使用 solr 1.4

【问题讨论】:

    标签: solr schema case wildcard punctuation


    【解决方案1】:

    我已经安装了 Solr 1.4 并索引了您询问的数据。问题描述为here。通配符查询区分大小写,不进行分析。这就是为什么您在使用大写“R”进行搜索时没有找到任何结果的原因。它在 Solr 3.6 上得到解决。您可以使用小写字母发送通配符查询,它会返回您预期的结果。

    【讨论】:

    • 嗨,我删除了 PatternReplaceFilterFactory 但我面临同样的问题,升级 solr 是不可能的,因为我正在使用旧代码
    • 您可以使用 admin/analysis.jsp 页面查看您的字段是如何分析的以及导致问题的原因。我将安装 solr 1.4 并在那里试用。
    猜你喜欢
    • 2020-04-22
    • 2021-08-21
    • 1970-01-01
    • 2016-07-12
    • 1970-01-01
    • 2021-02-25
    • 2020-03-19
    • 2018-12-22
    • 1970-01-01
    相关资源
    最近更新 更多