我利用了吕震宇根据Free版ICTCLAS改编而成.net平台下的ICTCLAS,把ICTCLAS的分词为lucene所用。以下是我写的程序,比较简单。大家看看评评,有什么要改进的地方,望大家指出
Analyzer类:
1
using System;
2
using System.Collections.Generic;
3
using System.Text;
4
5
using Lucene.Net.Analysis;
6
using Lucene.Net.Analysis.Standard;
7
using System.IO;
8
9
namespace ICTCLASForLucene
10
Tokenizer类:
1
using System;
2
using System.Collections.Generic;
3
using System.Text;
4
5
using Lucene.Net.Analysis;
6
using SharpICTCLAS;
7
using System.IO;
8
9
namespace ICTCLASForLucene
10
分词郊果:
需分词句子:***,***,中华人民共和国在1949年建立,从此开始了新中国的伟大篇章.长春市长春节发表致词汉字abc iphone 1265325.98921 fee1212@tom.com http://news.qq.com 100%
分词结果:
(***,0,2)(***,4,6)(中华人民共和国,8,14)(1949年,16,20)(建立,21,22)(从此,24,25)(新,29,29)(中国,30,31)(伟大,33,34)(篇章,35,36)(长春市,38,40)(春节,42,43)(发表,44,45)(致词,46,47)(汉字,48,49)(abc,50,52)(iphone,53,58)(1265325.98921,59,71)(fee1212@tom,72,82)(com,84,86)(http://news,87,97)(qq,99,100)(com,102,104)(100%,105,108)
耗时00:00:00.0937500
相关文章:
-
2022-12-23
-
2022-12-23
-
2022-12-23
-
2022-12-23
-
2022-01-24
-
2021-04-24
-
2022-01-04
猜你喜欢
-
2021-08-22
-
2022-12-23
-
2021-08-14
-
2021-12-29
-
2021-06-15
-
2021-11-27
相关资源
-
下载
2022-12-17
-
下载
2023-03-30
-
下载
2022-12-08