【发布时间】:2011-12-06 05:54:07
【问题描述】:
我正在使用 Lucene 来索引由片段组成的文档。 整个文档由描述它的字段组成(即作者、标题、发布日期)。 片段包含文本和标签(关键字)。我希望能够:
- 按作者搜索所有带有标签 Foo 的片段。
- 按标题搜索所有文档。
- 搜索所有包含一些单词的文档(在任何片段中)
我在 Lucene 中阅读了有关 BlockJoinQuery 的信息,但我不确定它是否适合我的问题:例如,有以下文档:
document: title="Hello World" author="Sam Brown"
fragment 1: tags="sunny" text="...."
fragment 2: tags="cloudy" text="moody and sleepy"
我能否通过查询找到此文档:
tags:sunny and text:sleepy?
这样的查询不会匹配任何子文档(片段),但它可能会匹配父文档 - lucene 文档并没有说明这一点。
【问题讨论】: