【发布时间】:2015-02-07 23:40:29
【问题描述】:
我见过各种 spark 和 avro 问题(包括 How can I load Avros in Spark using the schema on-board the Avro file(s)?),但以下 avro 文件没有一个适合我的解决方案:
http://www.4shared.com/file/SxnYcdgJce/sample.html
当我尝试使用上述解决方案读取 avro 文件时,我收到关于它不可序列化的错误(spark java.io.NotSerializableException: org.apache.avro.mapred.AvroWrapper)。
如何设置 spark 1.1.0(使用 scala)来读取这个示例 avro 文件?
-- 更新--
【问题讨论】:
-
你是直接收集的吗?您应该将它们映射到一些 Serializable 类,因为它们不能被序列化。
标签: scala apache-spark