【发布时间】:2017-10-17 02:26:34
【问题描述】:
我被困在将 avro 数据帧转换为 GenericRecord/ByteArray 时,我在 google 中冲浪,它们反过来为我提供了解决方案。
有没有人尝试在 Scala 中将 AVRO RDD/Dataframes 转换为 GenericRecord 或 ByteArray?
我使用这个命令来读取我的 avro 文件。
spark.read.avro("/app/q.avro")
它会返回这样的数据帧。
res0: org.apache.spark.sql.DataFrame = [recordType: string, recordVersion: string ... 6 more fields]
那么如何将 sql.DataFrame 转换为 GenericRecord/ByteArray?
【问题讨论】:
-
为什么要将 Daraframe 转换为其他对象?我认为它应该是 Bytearray 的行而不是整个数据帧。
-
是的... Row to ByteArray 对我来说也很好...
标签: scala apache-spark