下面是今天初次看的一点Lucene,整理出笔记备忘~~
下载这个文件lucene-2.4.0.zip到任意目录并解压,得到lucene-core-2.4.0.jar。
这里有Lucene的API:http://hudson.zones.apache.org/hudson/job/Lucene-trunk/javadoc//index.html
注意:Lucene 2.0以上使用的JDK版本不能低于1.5.0。
在My Eclipse建立一个Java Project,可命名为"Hello Lucene"。
设置Project->Properties->Java Compiler, 选中"Enable project specific settings"。
在项目中建立一个Package,命名为"test",并添加一个名为"HelloWorld.java"的Class。
在项目中新建Folder,命名为lib。把lucene-core-2.4.0.jar用鼠标拖到lib中。
设置Project->Properties->Java Build Path,在Library选项卡中单击"Add JARs"按钮,把项目中的lucene-core-2.4.0.jar添加进去。使用项目内部的lucene-core-2.4.0.jar 就不用担心外部环境变量的影响了。
然后编写HelloWorld.java (直接拷贝代码了……)
1
package test;
2
3
import java.io.BufferedReader;
4
import java.io.File;
5
import java.io.FileReader;
6
import java.io.IOException;
7
import java.io.InputStreamReader;
8
import java.io.Reader;
9
import java.util.Date;
10
11
import org.apache.lucene.analysis.Analyzer;
12
import org.apache.lucene.analysis.standard.StandardAnalyzer;
13
import org.apache.lucene.document.Document;
14
import org.apache.lucene.document.Field;
15
import org.apache.lucene.index.CorruptIndexException;
16
import org.apache.lucene.index.IndexWriter;
17
import org.apache.lucene.index.Term;
18
import org.apache.lucene.queryParser.ParseException;
19
import org.apache.lucene.queryParser.QueryParser;
20
import org.apache.lucene.search.BooleanClause;
21
import org.apache.lucene.search.BooleanQuery;
22
import org.apache.lucene.search.IndexSearcher;
23
import org.apache.lucene.search.PhraseQuery;
24
import org.apache.lucene.search.Query;
25
import org.apache.lucene.search.ScoreDoc;
26
import org.apache.lucene.search.TermQuery;
27
import org.apache.lucene.search.TopDocCollector;
28
import org.apache.lucene.search.WildcardQuery;
29
import org.apache.lucene.store.FSDirectory;
30
import org.apache.lucene.store.LockObtainFailedException;
31
32
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
不同版本的Lucene支持的函数不同,写的时候需要根据版本修改一下。这个小例子没实现什么功能了。默认情况下中文被分成单个字。TermQuery是以字或单词为单位搜索,WildcardQuery是使用正则表达式匹配,可在单词内部进行深度优先搜索。