【问题标题】:Hadoop - Sqoop job stuck on ACCEPTED when there is a spark job RUNNINGHadoop - 当有一个 Spark 作业正在运行时,Sqoop 作业卡在 ACCEPTED 上
【发布时间】:2018-04-18 23:04:58
【问题描述】:

目前我有一个始终需要运行的 spark 作业 (java)。它不需要太多资源。但是,每当我运行一个 sqoop 作业 (MapReduce) 时,该作业都会卡在 ACCEPTED:等待 AM 容器被分配、启动并注册到 RM。

我检查了 Ambari,用于调度的 spark 配置是公平的。为了测试,我尝试运行 2 个相同的 spark 作业并且它没有运行任何问题(两者的状态都是 RUNNING)。应该有足够的内核和内存供 map reduce 作业运行。

Spark 提交命令:

/usr/hdp/current/spark-client/bin/spark-submit \
  --class com.some.App \
  --master yarn-cluster \
  --deploy-mode cluster \
  --num-executors 1 \
  /path/to/file.jar "some.server:6667" "Some_App" "Some_App_Parser" "some.server"
jdbc:jtds:sqlserver://some.server:1433/HL7_Metadata
&; done

我的 sqoop 命令,我添加了内存限制但没有帮助:

sqoop import -D mapreduce.map.memory.mb=2048 \
    --connect "jdbc:sqlserver://some.server\SQL2012;database=SomeDB;username=someUser;passwor =somePass" \
    --e "SELECT SOMETHING" where  \$CONDITIONS"\
    --fields-terminated-by \\002 \
    --escaped-by \\ \
    --check-column Message_Audit_Log_Id \
    --incremental append \
    --last-value 1 \
    --split-by Message_Audit_Log_Id \
    --target-dir /target/path/

以下是一些图片供参考:

【问题讨论】:

    标签: hadoop apache-spark mapreduce hadoop-yarn sqoop


    【解决方案1】:

    我在 Hortonworks 上找到了帮助。

    我不得不将 yarn.scheduler.capacity.maximum-am-resource-percent 从 0.2 更改为 0.4。

    之后,我可以同时运行 sqoop map reduce 作业和我的 spark 应用程序。

    回复https://community.hortonworks.com/questions/147101/hadoop-sqoop-job-stuck-on-accepted-when-there-is-a.html的链接

    【讨论】:

      猜你喜欢
      • 2017-10-16
      • 1970-01-01
      • 2018-10-29
      • 2019-03-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多