我利用了吕震宇根据Free版ICTCLAS改编而成.net平台下的ICTCLAS,把ICTCLAS的分词为lucene所用。以下是我写的程序,比较简单。大家看看评评,有什么要改进的地方,望大家指出
Analyzer类:
 1让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System;
 2让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.Collections.Generic;
 3让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.Text;
 4让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
 5让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using Lucene.Net.Analysis;
 6让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using Lucene.Net.Analysis.Standard;
 7让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.IO;
 8让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
 9让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)namespace ICTCLASForLucene
10

Tokenizer类:
 1让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System;
 2让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.Collections.Generic;
 3让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.Text;
 4让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
 5让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using Lucene.Net.Analysis;
 6让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using SharpICTCLAS;
 7让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)using System.IO;
 8让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
 9让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)namespace ICTCLASForLucene
10
分词郊果:
让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)需分词句子:***,***,中华人民共和国在1949年建立,从此开始了新中国的伟大篇章.长春市长春节发表致词汉字abc iphone 1265325.98921 fee1212@tom.com http://news.qq.com 100%
让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
分词结果:
让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)(***,
0,2)(***,4,6)(中华人民共和国,8,14)(1949年,16,20)(建立,21,22)(从此,24,25)(新,29,29)(中国,30,31)(伟大,33,34)(篇章,35,36)(长春市,38,40)(春节,42,43)(发表,44,45)(致词,46,47)(汉字,48,49)(abc,50,52)(iphone,53,58)(1265325.98921,59,71)(fee1212@tom,72,82)(com,84,86)(http://news,87,97)(qq,99,100)(com,102,104)(100%,105,108)
让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
耗时00:00:00.0937500


相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-01-24
  • 2021-04-24
  • 2022-01-04
猜你喜欢
  • 2021-08-22
  • 2022-12-23
  • 2021-08-14
  • 2021-12-29
  • 2021-06-15
  • 2021-11-27
相关资源
相似解决方案