【发布时间】:2016-03-13 00:46:14
【问题描述】:
我想读取存储在特定位置的 zipfile 的内容。
所以我使用了SparkContext.readFile 方法,如下所示:
val zipFileRDD = sc.binaryFiles("./handsOn/repo~apache~storm~14135470~false~Java~master~2210.zip")
zipFileRDD: org.apache.spark.rdd.RDD[(String, org.apache.spark.input.PortableDataStream)] = ./handsOn/repo~apache~storm~14135470~false~Java~master~2210.zip BinaryFileRDD[4] at binaryFiles at <console>:21
我的问题是:
如何从此 RDD 中获取 PortableDataStream 实例。
【问题讨论】:
标签: scala apache-spark bigdata rdd