【问题标题】:Spark not able to run in yarn cluster modeSpark 无法在纱线集群模式下运行
【发布时间】:2015-02-05 13:31:39
【问题描述】:

我正在尝试在纱线集群上执行我的代码

我使用的命令是

$SPARK_HOME/bin/spark-submit \
    --class "MyApp" \
    target/scala-2.10/my-application_2.10-1.0.jar \
    --master yarn-cluster \
    --num-executors 3 \
    --driver-memory 6g \
    --executor-memory 7g \
    <outputPath>

但是,我可以看到这个程序只在本地主机上运行。

它能够从 hdfs 读取文件。

我在独立模式下试过了,效果很好。

请指出哪里出了问题。

【问题讨论】:

  • Spark Web UI 说什么?您是如何在应用程序中加载文件的?
  • 如果您使用的是特定的大数据平台和您的集群架构,您能与我们分享一下吗?

标签: hadoop apache-spark hadoop-yarn


【解决方案1】:

我正在使用 Hadoop2.4 和 Spark 1.1.0 。我能够让它在集群模式下运行。

为了解决这个问题,我们简单地从所有从节点中删除了所有配置文件。早些时候我们在独立模式下运行,这导致在所有从站上复制配置。完成后,它在集群模式下按预期运行。虽然性能达不到单机模式。

谢谢。

【讨论】:

    猜你喜欢
    • 2023-04-08
    • 2016-04-09
    • 2020-09-06
    • 2015-10-22
    • 2021-12-23
    • 1970-01-01
    • 1970-01-01
    • 2018-10-25
    • 2014-12-06
    相关资源
    最近更新 更多