首先将下载解压后的solr-4.9.0的目录里面F:\tools\开发工具\Lucene\solr-4.9.0\contrib\analysis-extras\lucene-libs找到lucene-analyzers-smartcn-4.9.0.jar文件,

Windows下面安装和配置Solr 4.9(三)支持中文分词器

将它复制到solr的Web应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib,

Windows下面安装和配置Solr 4.9(三)支持中文分词器

备注:网上很多文章使用IK中文分词器(IK_Analyzer2012_u6.jar)但是在solr-4.9.0版本中,我是一直没有配置成功。所以只能使用solr自带的中文分词器了。

在回到solr的应用程序目录(D:\Demos\Solr\collection1\conf)

Windows下面安装和配置Solr 4.9(三)支持中文分词器

修改schema.xml,让solr能够支持中文的分词。

Windows下面安装和配置Solr 4.9(三)支持中文分词器

 1 <fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
 2       <analyzer type="index">
 3       <!-- 此处需要配置主要的分词类 -->
 4         <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
 5         <!--
 6         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
 7         <filter class="solr.LowerCaseFilterFactory"/>
 8         -->
 9         <!-- in this example, we will only use synonyms at query time
10         <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
11         -->
12         <filter class="solr.SmartChineseWordTokenFilterFactory"/>
13       </analyzer>
14       <analyzer type="query">
15       <!-- 此处配置同上 -->
16         <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
17         <!--
18         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
19         <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
20         <filter class="solr.LowerCaseFilterFactory"/>
21         -->
22         <filter class="solr.SmartChineseWordTokenFilterFactory"/>
23       </analyzer>
24 </fieldType>
schema.xml

相关文章:

  • 2021-12-09
  • 2021-09-05
  • 2021-05-16
  • 2021-04-02
  • 2021-06-03
  • 2021-09-04
  • 2021-09-28
  • 2021-11-18
猜你喜欢
  • 2021-08-31
  • 2021-06-21
  • 2021-11-08
  • 2021-07-19
  • 2021-10-17
  • 2021-12-09
相关资源
相似解决方案