【发布时间】:2009-12-24 21:47:29
【问题描述】:
我的应用程序使用 Lucene.NET 来索引各种文本文件。由于每个文本文件的结构不同,因此每个文件的全部内容都存储在一个“内容”字段中。
某些文本文件包含 URL,例如:
http://domain1.co.uk/blah
http://domain2.co.ru/blahblah
等等
我用来索引每个文件的代码是:
Lucene.Net.Documents.Field fldContent = new Lucene.Net.Documents.Field("content", contents, Lucene.Net.Documents.Field.Store.YES, Lucene.Net.Documents.Field.Index.TOKENIZED, Lucene.Net.Documents.Field.TermVector.YES);
其中“contents”是文件内容。
查询文件时,Lucene 仅在搜索准确的域名(例如 domain1.co.uk)时返回结果,对于部分域名(例如 domain1.co)不返回任何结果。 用于构建查询的代码是:
Lucene.Net.Index.Term searchTerm = new Lucene.Net.Index.Term("content", "domain1.co");
Lucene.Net.Search.Query query = new Lucene.Net.Search.TermQuery(searchTerm);
您知道为什么我必须使用确切的域名进行搜索吗?
【问题讨论】:
标签: lucene.net