【问题标题】:Why is Spark2 running on only one node?为什么 Spark2 只在一个节点上运行?
【发布时间】:2018-05-08 13:20:12
【问题描述】:

我正在从 Zeppelin(HDP 2.6 中的 0.7)运行 Spark2,并且我正在执行一个 idf 转换,该转换在数小时后崩溃。它在具有主节点和 3 个数据节点的集群上运行:s1、s2 和 s3。所有节点都有一个 Spark2 客户端,每个都有 8 个内核和 16GB RAM。

我刚刚注意到它只在一个节点 s3 上运行,有 5 个执行器。

在 zeppelin-env.sh 中,我将 zeppelin.executor.instances 设置为 32 并将 zeppelin.executor.mem 设置为 12g,并且它具有以下行:

export MASTER=yarn-client

我已将yarn.resourcemanager.scheduler.class 设置为org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler

我还在 Spark2 解释器中将 spark.executor.instances 设置为 32。

任何人有什么想法我可以尝试让其他节点共享吗?

【问题讨论】:

    标签: hadoop-yarn hortonworks-data-platform apache-zeppelin apache-spark-2.0


    【解决方案1】:

    答案是因为我是个白痴。只有 S3 安装了 datanode 和 nodemanager。希望这可能对某人有所帮助。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-02-17
      • 2023-04-11
      • 2014-08-01
      • 1970-01-01
      • 2021-05-03
      • 1970-01-01
      • 2019-05-16
      相关资源
      最近更新 更多