【发布时间】:2015-11-14 07:28:30
【问题描述】:
我有一个 12 核和 10GB RAM 的 Spark 集群。 实际上是两台机器以集群模式运行。 在这两台机器上,我还设置了一个 ElasticSearch 集群。
我每秒写大约 150 000 条记录...分批 5000 条 但是,当 Batch insert 模式启动时,Elasticsearch 和 Spark 的 Java 进程都使用大约 300% 的 CPU :(
有人能解释一下发生了什么吗?
【问题讨论】:
-
十万是什么意思?
-
@eliasah,WoodChopper 正确指出 15 万 = 150,000
-
它告诉你增加批量大小:)
标签: java elasticsearch apache-spark