【发布时间】:2018-01-16 22:13:24
【问题描述】:
我们使用 cloudera 来部署一个 zeppelin-spark-yarn-hdfs 集群。目前,只有一个 zeppelin 和 spark 的实例,所有 spark notebook 的执行都会影响到每个用户。例如,如果我们停止用户笔记本中的 spark 上下文,它会影响所有其他用户的笔记本。我已经看到 zeppelin 中有一个选项可以隔离口译员,但是有没有办法根据需要为每个用户提供自己的“集群”?也许使用 Docker 并为每个用户使用 zeppelin 和 spark 构建图像,并将他们的资源限制为用户集群提供的资源?对于如何实现它,或者是否有可能,我很迷茫,但我理想的情况是像 databricks 那样的方法。在那里您可以拥有自己的集群,并且所有资源都与其他用户隔离。
【问题讨论】:
标签: apache-spark hadoop hadoop-yarn cloudera apache-zeppelin