【发布时间】:2011-05-25 17:26:18
【问题描述】:
我使用 Lucene 来搜索 HTML 文档。我遇到的问题是索引文件的大小增加,我有大约 300-400MB 大小的 HTML 文件,但索引运行到 .98Gb。我之所以看到是因为我们有规范。就像我们为四个不同的字段索引相同的内容,我猜这就是问题所在(我们使用相同的内容,一个区分大小写,其他,一个区分特殊字符的大小写,其他)。
有没有办法减小索引的大小?保持相同的要求?是否有不同的方式我们索引相同的内容并进行不同的搜索以支持所有内容?
【问题讨论】:
标签: lucene