解决波动问题答案

【问题标题】：solr puctuation issues解决波动问题
【发布时间】：2012-12-06 22:59:45
【问题描述】：

我有一个包含

的字段

... ung eignen sich auch Computer-Rechtschreibprogramme.   Deutsch Erweiterte ...

我是这样配置的

    <fieldType name="text" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="solr.WhitespaceTokenizerFactory" />
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
            <filter class="solr.WordDelimiterFilterFactory" 
                    generateWordParts="1" generateNumberParts="0" catenateWords="1"
                    catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"
                    splitOnNumerics="0" stemEnglishPossessive="0"/>
            <filter class="solr.LowerCaseFilterFactory" />
            <filter class="solr.TrimFilterFactory" />   
            <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
            <filter class="solr.ReversedWildcardFilterFactory" />
            <filter class="solr.LengthFilterFactory" min="1" max="100" />
            <filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}]" replacement="" replace="all"/>
        </analyzer>
    </fieldType>

但是

q=volltext:Rechtschreibprogramm*
q=volltext:*Rechtschreibprogramm*

没有给出结果，为什么？

q=volltext:*echtschreibprogramm*

找到文档

我正在使用 solr 1.4

【问题讨论】：

标签： solr schema case wildcard punctuation

【解决方案1】：

我已经安装了 Solr 1.4 并索引了您询问的数据。问题描述为here。通配符查询区分大小写，不进行分析。这就是为什么您在使用大写“R”进行搜索时没有找到任何结果的原因。它在 Solr 3.6 上得到解决。您可以使用小写字母发送通配符查询，它会返回您预期的结果。

【讨论】：

嗨，我删除了 PatternReplaceFilterFactory 但我面临同样的问题，升级 solr 是不可能的，因为我正在使用旧代码
您可以使用 admin/analysis.jsp 页面查看您的字段是如何分析的以及导致问题的原因。我将安装 solr 1.4 并在那里试用。