sharpICTCLAS  参考:http://www.cnblogs.com/zhenyulu/archive/2007/04/18/718383.html
Lucene.net 参考:http://incubator.apache.org/lucene.net/

原子分词效率:短句,sharpICTCLAS快;超过1M的数据,Lucene.net快。
Lucene的优势:英文句子处理的好。
sharpICTCLAS的优势:只关注中文。

测试代码:
Lucene.net

.net下ICTCLAS原子分词和lucene的Token比较static void Main(string[] args)
        }

下一步考虑使用lucene的Token代替ICTCLAS的原子分词函数。

相关文章:

  • 2021-06-06
  • 2021-09-01
  • 2022-01-10
  • 2022-01-26
  • 2021-06-15
  • 2022-12-23
  • 2021-04-13
  • 2022-12-23
猜你喜欢
  • 2021-12-05
  • 2022-12-23
  • 2021-05-23
  • 2021-09-03
  • 2022-12-23
  • 2021-10-25
  • 2021-10-25
相关资源
相似解决方案