好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了Lucene.Net 3.0.3(参考《基于MMSeg算法的中文分词类库》)。

然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于Lucene.Net 3.0.3更新了,顺便把它的词库给放到dll里面了,不然每次还要拷贝一个Dictionaries目录真麻烦。另外打包放到了Nuget上,方便下载。

https://github.com/JimLiu/Lucene.Net.Analysis.PanGu

 

另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。

 

相关文章:

  • 2022-01-03
  • 2021-12-26
  • 2021-06-26
  • 2021-05-17
  • 2021-06-25
猜你喜欢
  • 2022-12-23
  • 2021-07-09
  • 2022-02-26
  • 2021-10-20
  • 2021-11-02
相关资源
相似解决方案