【问题标题】:Reducing the memory size of Index for Lucene减少 Lucene 的 Index 的内存大小
【发布时间】:2011-05-25 17:26:18
【问题描述】:

我使用 Lucene 来搜索 HTML 文档。我遇到的问题是索引文件的大​​小增加,我有大约 300-400MB 大小的 HTML 文件,但索引运行到 .98Gb。我之所以看到是因为我们有规范。就像我们为四个不同的字段索引相同的内容,我猜这就是问题所在(我们使用相同的内容,一个区分大小写,其他,一个区分特殊字符的大小写,其他)。

有没有办法减小索引的大小?保持相同的要求?是否有不同的方式我们索引相同的内容并进行不同的搜索以支持所有内容?

【问题讨论】:

    标签: lucene


    【解决方案1】:

    我假设您的问题是您正在存储这些字段,而不仅仅是索引它们。所以解决方案是:不要存储它们。

    【讨论】:

    • 啊,那是我的问题。这是一个巨大的大小变化,大约 200MB.. 非常感谢 Xodarap,不过我应该想到这一点..
    猜你喜欢
    • 2013-11-19
    • 2023-04-01
    • 1970-01-01
    • 2016-08-28
    • 2023-03-25
    • 2012-12-21
    • 2013-05-29
    • 1970-01-01
    • 2011-08-06
    相关资源
    最近更新 更多