ucene的中文分词器到现在还没有好的解决办法。下边介绍了两个lucene自己提供的分词器和一个javaeye上的网友实现的分词器。关于各个分词器的不同见代码中的print信息。直接运行得到console的输出结果更容易对比不同。package analyzer;import java.io.Reader;import java.io.StringReader;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.StopFilter;import org.apache.lucene.analysis.Token;import org.apache.lucene.analysis.TokenFilter;import org.apache.lucene.analysis.TokenStream;import org.apache.lucene.analysis.cjk.CJKAnalyzer;import org.apache.lucene.analysis.cn.ChineseAnalyzer;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.mira.lucene.analysis.IK_CAnalyzer;import org.mira.lucene.analysis.MIK_CAnalyzer;import com.sohospace.lucene.analysis.xanalyzer.XAnalyzer;import com.sohospace.lucene.analysis.xanalyzer.XFactory;import com.sohospace.lucene.analysis.xanalyzer.XTokenizer;//中文分词使用了Paoding的分词技术,特表示感谢 相关文章: 2021-04-13 2021-09-08 2022-12-23 2022-12-23 2022-01-11 2022-12-23 2021-10-06 2021-11-29