lic309

     solr中文分词器ik,

  推荐资料:http://iamyida.iteye.com/blog/2220474?utm_source=tuicool&utm_medium=referral

  使用ik的官方jar包总是有一些问题,个人使用上面博客中共享出来的jar包,

  1.将jar包放在solrhome\server\solr-webapp\webapp\WEB-INF\lib下

  2.将IKAnalyzer.cfg.xml和stopword.dic copy到solrhome\server\solr-webapp\webapp\WEB-INF\classes下

  

  3.打开schema.xml文件

    添加一个类型:

  

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">           
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"  />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>   
    </fieldType>

      即可将字段分配为这个类型。

 

  可在后台调试分词器:

  

 

分类:

技术点:

相关文章:

  • 2021-12-09
  • 2022-01-17
  • 2021-11-15
  • 2021-07-19
  • 2021-08-15
  • 2022-01-12
  • 2021-11-08
猜你喜欢
  • 2021-06-14
  • 2021-05-03
  • 2022-12-23
  • 2021-10-08
  • 2021-05-26
  • 2022-12-23
相关资源
相似解决方案