【发布时间】:2013-12-03 10:16:42
【问题描述】:
我正在运行一个弹性搜索服务器以及 twitter River,以从 twitter 公共流中下载数据。最近,我添加了大约 40 条过滤后的河流,它们跟踪了 40 个与我的体验相关的不同关键词。但是,这导致服务器变得相当缓慢。当我在服务器上做一个顶部时,它总是显示 > 100% 的 CPU 消耗。
我的问题是,对于这样的系统,我需要多少台机器。每天下载的数据量为几 GB。目前,我在具有 8GB 内存的单个 8 核机器(Intel(R) Xeon(R) CPU E31280 @ 3.50GHz)上运行它。
另外,现在我有大约 800 个未分配的分片中的大约 437 个。我已经尝试重新启动服务器很多次,但它们仍然没有被分配。
【问题讨论】:
标签: twitter elasticsearch