【问题标题】:Lots of ERROR ErrorMonitor: AssociationError on spark startup很多错误错误监视器:火花启动时的关联错误
【发布时间】:2015-09-17 09:59:29
【问题描述】:

我在 mesos 上使用 spark(使用 kafka 和 cassandra) 在启动时,我有很多错误(〜100)然后一切正常。 错误属于这种类型:

[Stage 0:=======> (24 + 26) / 50][Stage 3:> (0 + 24) / 24]15/09/17 09:48:35 ERROR ErrorMonitor: AssociationError [akka.tcp://sparkDriver@10.131.xx.xxx:58325]

此错误的原因可能是什么?我该如何解决?

【问题讨论】:

  • 当我们的 Hadoop 集群上的 Cloudera 版本与我提交 Spark 作业的机器不同步时,我遇到了这个问题,因为错误的 sudo apt-get update && sudo apt-get升级。可能是因为集群和提交机器之间的 Spark 主版本不同。仔细检查两个版本的 Spark 是否一致。

标签: apache-spark spark-streaming mesos


【解决方案1】:

日志似乎是噪音。

CDH 5.5.0 中的 Spark 1.5.0 也会出现此问题,Cloudera 如下所述。

http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/cdh_rn_spark_ki.html

在 YARN 上使用 Spark 时,驱动程序报告误导性错误消息 Spark 驱动程序报告误导性错误消息,例如:

ERROR ErrorMonitor: AssociationError [akka.tcp://sparkDriver@...] -> [akka.tcp://sparkExecutor@...]:错误 [与 [akka.tcp://sparkE xecutor@...] 的关联失败] [akka.remote.EndpointAssociationException:与 [akka.tcp://sparkExecutor@...] 的关联失败]]

解决方法:将以下属性添加到 Spark log4j 配置文件:log4j.logger.org.apache.spark.rpc.akka.ErrorMonitor=FATAL。请参阅配置 Spark 应用程序日志记录属性。

【讨论】:

猜你喜欢
  • 1970-01-01
  • 2017-10-08
  • 2017-07-08
  • 2016-03-30
  • 2020-07-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-01-13
相关资源
最近更新 更多