【发布时间】:2012-03-14 09:03:51
【问题描述】:
我有几个关于 Lucene/SOLR 索引架构的问题
-
这是我在 SOLR 架构中定义的文档 ID 字段 (UniqueKey):
我永远不会通过 Id 字段执行搜索,所以它需要被索引="true" 吗?顺便说一句,它是否需要存储=“true”(我认为它无论如何都会被存储,所以没关系)。
还有 2:单个 SOLR 索引中可以存储的最大文档数是多少?或者,更准确地说:它可以容纳 50 亿个小文档吗?
第三个问题:我需要对 2 个字段的组合执行搜索:一个 long 类型和一个 integer 类型。存储和索引这些字段的最有效方法是什么 - 分别存储和索引它们或基于它们预先计算一些哈希值并仅通过哈希搜索?由于我想要拥有数十亿个此类文档,因此我需要在保持搜索效率的同时最大限度地减少存储需求。
谢谢 RG
【问题讨论】: