【发布时间】:2014-01-15 04:24:23
【问题描述】:
这主要是弹性搜索的设计模式问题。
如果我想使用 Elastic Search 为 Internet 编制索引,组织此类任务的最有效方法是什么?
@kimchy 讨论了不同的模式,Rafal Kuc 讨论了扩展大规模集群,但是看了这些之后我并没有了解如何组织互联网的索引。
我认为从逻辑上讲,您可以通过为每个域创建一个新索引来组织这样的工作。因此,您可以在 Stackoverflow.com 等索引上大量分片,但对于 momandpopsite.com 等索引可能只有 1 个分片
在您的 ES 社区看来,这是否有效?我不确定,因为我们可以很快进入数百万个索引,更不用说它们各自的分片了。现在我想知道这种类型的设计是否会产生很多开销,并且会变得臃肿。 (也就是说,这种模式的结构是否会产生过多的开销?)。
我知道这个问题必须是理论上的,因为没有指定资源。但是,如果您可以发挥您的想象力并尝试纯粹地坚持设计策略——您将如何索引万维网?假设有 2.75 亿个域。使用 Elastic Search 对 Internet 进行索引的最有效设计模式是什么?
【问题讨论】:
标签: elasticsearch