gyjx2016

1、solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考

https://github.com/zhuomingliang/mmseg4j

一定要注意版本

2、将这两个包直接拷贝到tomcat下的solr/lib中

 

3、在solr/java里新建dic目录将词库拷贝进去

 4、直接在浏览器http://127.0.0.1:8080/solr即可如下分词结果

 

 

 

ok,分词整合完毕!

 

分类:

技术点:

相关文章: