【问题标题】:Solr search German wordsSolr搜索德语单词
【发布时间】:2014-08-20 23:22:10
【问题描述】:

我对德语单词有疑问。 Solr(版本 4.0.0)tokenzie 单词 Kälte 成两个错误的标记。也许我对德语文本字段的定义有误。

字段定义如下。

<fieldType name="text_de" class="solr.TextField" positionIncrementGap="100">

<analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_de.txt" format="snowball" />
    <filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.GermanNormalizationFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="German2"/>
  </analyzer>

  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_de.txt" format="snowball" />
    <filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.GermanNormalizationFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="German2"/>

  </analyzer>

调试查询:

<str name="parsedquery">text_de:kã text_de:lte</str><str name="parsedquery_toString">text_de:kã text_de:lte</str>

【问题讨论】:

    标签: solr4


    【解决方案1】:

    如果您将 Tomcat 作为应用程序容器运行,您可以尝试在 AJP/1.3 连接器中修改 server.xml 文件并添加 URIEncoding="UTF8"。我找到了这个Solution

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-11-02
      • 2011-12-03
      相关资源
      最近更新 更多