这几天一直在做Lucene6和Ansj配合使用的一个项目,现在想要针对分词进行过滤。在网上看了不少资料,大部分都比较老,

细看了很长时间的源代码,发现旧的FilterRecognition类被StopRecognition类所代替,而更早的版本是 FilterModifWord类。


代码段:

...

forest = new Forest();

StopRecognition s = new StopRecognition();

s.insertStopWords(",");

s.insertStopWords("能");

String str = "洁面仪配合洁面深层清洁毛孔,清洁鼻孔面膜碎觉使劲挤才能出一点点皱纹!";

System.out.println(NlpAnalysis.parse(str,forest).recognition(s));

下面是官方文档的说明,后来才发现的,然而如何配置lucene插件目前还在研究中

Ansj5.1.1 过滤停用词的方法

相关文章:

  • 2021-10-13
  • 2022-02-27
  • 2022-12-23
  • 2021-10-05
  • 2021-12-22
  • 2022-12-23
  • 2022-12-23
  • 2022-02-02
猜你喜欢
  • 2021-07-30
  • 2021-05-27
  • 2021-12-23
  • 2021-11-25
  • 2022-12-23
相关资源
相似解决方案