【发布时间】:2017-04-01 02:27:54
【问题描述】:
我有一个在 YARN 上运行的 spark 作业,它似乎只是挂起,没有进行任何计算。
当我yarn application -status <APPLICATIOM ID> 时,纱线是这样说的:
Application Report :
Application-Id : applicationID
Application-Name : test app
Application-Type : SPARK
User : ec2-user
Queue : default
Start-Time : 1491005660004
Finish-Time : 0
Progress : 10%
State : RUNNING
Final-State : UNDEFINED
Tracking-URL : http://<ip>:4040
RPC Port : 0
AM Host : <host ip>
Aggregate Resource Allocation : 36343926 MB-seconds, 9818 vcore-seconds
Log Aggregation Status : NOT_START
Diagnostics :
而且,当我检查yarn application -list 时,它说它是RUNNING。但我不确定我是否相信这一点。当我转到 spark webUI 时,我在运行它的整个几个小时内只看到一个阶段:
此外,当我单击“阶段”选项卡时,我看不到任何运行:
如何确保我的应用程序确实在运行并且YARN 没有对我撒谎?
实际上,我更希望这会引发错误,而不是让我等待查看作业是否正在实际运行。我该怎么做?
【问题讨论】:
标签: apache-spark pyspark hadoop-yarn