1.建立索引
为60篇记事本文档的中文小说建立索引,分析器采用Lucene.Net.Analysis.Cn.ChineseAnalyzer()(这个索引器是从http://www.cnblogs.com/dudu/archive/2004/06/22/17783.aspx下载的,是dudu修正bug后的版本,感谢dudu.)统计索引的建立时间.同时,会更改IndexWriter的参数以感受相关参数对索引建立速度的影响.
2.关键字检索
当索引建立完毕后,对索引进行简单关键字的检索,查看响应时间
3.多线程检索
采用多线程对索引的检索,以查看多线程环境下lucene的工作效率
1.构建Document
在建立索引之前,首先要构建Document类型,它把文本文档转变成lucene可以识别的Document格式.
在上述代码中,一个共有的静态方法返回一个Document类型的对象,它的参数是FileInfo类型,在建立索引的时候,将获得的文件对象传入就可以得到与lucene相对应的Document类型.上面的代码一添加了四个不同的字段.
2.建立索引的代码
在上面的代码中,当通过getInstance()方法得到一个该类的实例后,则可以调用newWriter()方法来获得索引器的实例.在newWriter()方法中获取了两个IndexWriter的实例.一个是向文件系统创建的索引器,另一个则向内存中创建索引的索引器,因此对对应的创建了一个RAMDirectory和一贯FSDirectory的对象.这么做的目的是希望减少磁盘的I/O次数,当内存中累积的文档到达一定数量时候,就自动刷新内存,将其写入文件系统中,因此,需要一个内存中最大文档数量的限制,该值就是由私有类变量ramMaxFiles控制,它的默认为64.
addDocument(File file)是真正将文档加入索引的的代码,在它之中首先要判断当前内存中的文档数量是否已经大雨最大的文档数量.如果已经达到,则调用refreshRam方法刷新内存中的文档到磁盘上.如果未达到,则继续将文档假如内存中.
3:开始建立索引
在代码最后,有一个Main方法,他指定在e:\\source目录上建立索引.当运行它时,就可以执行索引建立的过程
上面测试中initWriter中仅仅调置了一个fsWriter的最大字段长度.如果用户有兴趣,可以调整mergeFactor和maxMergeDocs等参数来查看索引的建立速度