【问题标题】:java.io.InvalidClassException: org.apache.spark.internal.io.HadoopMapReduceCommitProtocol; local class incompatiblejava.io.InvalidClassException:org.apache.spark.internal.io.HadoopMapReduceCommitProtocol;本地类不兼容
【发布时间】:2018-07-20 05:26:46
【问题描述】:

上下文

我正在 Spark 集群上执行 Spark 工具(如果有兴趣,this 是 Spark 工具)。该工具正在从 HDFS 读取输入文件,并将在 HDFS 中生成输出文件。

我有 2 个 Azure VM,带有一个 Spark Master 容器、一个 Namenode 容器、两个 Spark Worker 容器和两个 Datanode 容器(更多两个容器来提供工具所需的文件,但我并不认为它很重要),使用 Docker Swarm 进行配置。

这是我用来运行 Spark 工具的 Bash 命令:

/gatk/gatk BwaAndMarkDuplicatesPipelineSpark \
--input hdfs://namenode:8020/PFC_0028_SW_CGTACG_R_fastqtosam.bam \
--reference hdfs://namenode:8020/hg19-ucsc/ucsc.hg19.2bit \
--bwa-mem-index-image /reference_image/ucsc.hg19.fasta.img \
--disable-sequence-dictionary-validation true \
--output hdfs://namenode:8020/PFC_0028_SW_CGTACG_R_dedup_reads.bam \
-- --spark-runner SPARK --spark-master spark://$SPARK_MASTER_HOST:7077 \
--driver-memory 30g --executor-cores 4 --executor-memory 15g

问题

几个小时后我收到此错误:

18/02/08 23:10:42 WARN TaskSetManager: Lost task 15.0 in stage 5.0 (TID 3087, 10.0.0.10, executor 0): 
java.io.InvalidClassException: org.apache.spark.internal.io.HadoopMapReduceCommitProtocol; 
local class incompatible: stream classdesc serialVersionUID = -3240062154626659006, local class serialVersionUID = 8531775026770993759

即使在 Stack Overflow 上搜索,我也发现这个 issue 有类似的异常,它基本上建议添加类似这样的内容

   private static final long serialVersionUID = 6529685098267757690L;

在 Java 代码中。但是我正在使用的Spark tool,实际上是在使用serialVerionUID,而且异常表明这是由org.apache.spark.internal.io.HadoopMapReduceCommitProtocol 引发的,它似乎扩展了Serializable,但不使用serialVerionUID;我应该在 Spark GitHub 上打开一个问题并报告此异常还是我做错了什么?

抱歉,如果太冗长,如有需要,请随时询问更多细节。

【问题讨论】:

    标签: java hadoop apache-spark cluster-computing


    【解决方案1】:

    我尝试检查 Spark Master 容器和 Spark Worker 容器的 Spark 版本,分别是 2.2.1 和 2.2.0

    所以我在他们两个中都使用了 2.2.0,这一次成功了。我认为问题在于 Worker 和 Master 之间的版本不匹配(即使我第一次启动该工具时,异常只是在执行几个小时后才引发)。

    【讨论】:

      猜你喜欢
      • 2020-01-06
      • 1970-01-01
      • 1970-01-01
      • 2022-08-10
      • 1970-01-01
      • 2012-01-28
      • 2015-02-07
      • 1970-01-01
      相关资源
      最近更新 更多