【发布时间】:2016-09-28 22:14:40
【问题描述】:
我们有一个 MapR 集群,它正在运行,但现在它突然停止了,甚至在 mapr 演示集群上也不起作用。我们正在运行 MapR 5.1 和 Spark 1.6.1。
from pyspark import SparkConf, SparkContext
from pyspark import HiveContext
from pyspark.sql import DataFrameWriter
conf = SparkConf().setAppName('test')
sc = SparkContext(conf=conf)
sqlContext = HiveContext(sc)
df = sqlContext.createDataFrame([(2012, 8, "Batman", 9.8), (2012, 8, "Hero", 8.7), (2012, 7, "Robot", 5.5), (2011, 7, "Git", 2.0)],["year", "month", "title", "rating"])
df.show()
df.write.mode("append").format("com.databricks.spark.avro").save("/user/bedrock/output_avro")
sc.stop()
但是现在我收到了这个错误:
java.lang.IllegalAccessError: tried to access class org.apache.avro.SchemaBuilder$FieldDefault from class com.databricks.spark.avro.SchemaConverters$$anonfun$convertStructToAvro$1
有什么想法吗?这是按照databricks github上的说明进行的。我正在使用这些包调用 pyspark shell 或 spark-submit:
/opt/mapr/spark/spark-1.6.1/bin/pyspark --packages com.databricks:spark-avro_2.10:2.0.1 --driver-class-path /opt/mapr/spark/spark-1.6.1/lib/avro-1.7.7.jar --conf spark.executor.extraClassPath=/opt/mapr/spark/spark-1.6.1/lib/avro-1.7.7.jar --master yarn-client
【问题讨论】:
-
@zero323,您对此有意见吗?
标签: pyspark spark-dataframe mapr