【发布时间】:2015-01-21 18:33:04
【问题描述】:
在 lucene 索引部分,我开始使用 StoredField,我不需要索引字段(在我使用 StringField 为相同字段之前)。
这基本上是为了减少一些索引空间。
我正在处理包含 100 万条记录的文件,但我没有看到任何性能差异。但很快我可能不得不处理超过 1 亿条记录。
所以,我想知道当我使用 StoredField 与 StringField 相比时,性能会受到影响吗?
谢谢 尚卡尔
【问题讨论】:
在 lucene 索引部分,我开始使用 StoredField,我不需要索引字段(在我使用 StringField 为相同字段之前)。
这基本上是为了减少一些索引空间。
我正在处理包含 100 万条记录的文件,但我没有看到任何性能差异。但很快我可能不得不处理超过 1 亿条记录。
所以,我想知道当我使用 StoredField 与 StringField 相比时,性能会受到影响吗?
谢谢 尚卡尔
【问题讨论】:
我的猜测是您的任务是 I/O 密集型而不是 CPU 密集型,因为大部分时间都花在文档合并而不是简化索引上(这对于 StringField 来说非常便宜)。
分析可能有助于揭示这个猜测是否不正确。
【讨论】: