【发布时间】:2016-01-14 13:03:23
【问题描述】:
我正在使用 spark-redshift (https://github.com/databricks/spark-redshift),它使用 avro 进行传输。
从 Redshift 读取是可以的,而我正在写作
Caused by: java.lang.NoSuchMethodError: org.apache.avro.generic.GenericData.createDatumWriter(Lorg/apache/avro/Schema;)Lorg/apache/avro/io/DatumWriter
尝试使用 Amazon EMR 4.1.0 (Spark 1.5.0) 和 4.0.0 (Spark 1.4.1)。 做不到
import org.apache.avro.generic.GenericData.createDatumWriter
要么,只是
import org.apache.avro.generic.GenericData
我正在使用 scala shell 尝试下载其他几个 avro-mapred 和 avro jar,尝试设置
{"classification":"mapred-site","properties":{"mapreduce.job.user.classpath.first":"true"}},{"classification":"spark-env","properties":{"spark.executor.userClassPathFirst":"true","spark.driver.userClassPathFirst":"true"}}
并将这些 jars 添加到 spark 类路径中。可能需要以某种方式调整 Hadoop (EMR)。
这会给任何人敲响警钟吗?
【问题讨论】:
标签: java scala hadoop avro amazon-emr