【发布时间】:2018-08-31 01:23:12
【问题描述】:
我正在尝试在我的 Hadoop 集群上使用 Zeppelin:
- 1 个边缘节点
- 1 个名称节点
- 1 个辅助节点
- 16 个数据节点。
节点规格: CPU:Intel(R) Xeon(R) CPU E5345 @ 2.33GHz,8 核 内存:32 GB DDR2
当超过 20 人想同时使用此工具时,我遇到了一些问题。 这主要是当我使用 pyspark - 1.6 或 2.0 时。 即使我设置 zeppelin.execution.memory = 512 mb 和 spark.executor memory = 512 mb 仍然相同。我已经尝试了一些解释器选项(用于 pyspark),例如 Per User in scoped/isolated 等,但仍然相同。使用全局选项会更好一些,但过了一段时间我仍然无法在那里做任何事情。我在看边缘节点,我看到内存增长得非常快。我只想将边缘节点用作接入点。
【问题讨论】:
标签: hadoop pyspark apache-zeppelin