【发布时间】:2015-01-29 10:34:23
【问题描述】:
我有一个以这种方式创建的 Spark 图表
val graph = Graph(vertices, edges, defaultArticle).cache
我的顶点是RDD[(Long, (String, Option[String], List[String], Option[String])],我的边是RDD[Edge[Long]]
如何将此图形/边/顶点保存到 Hive/文本文件/其他任何内容,以及如何将其读回?我查看了 Spark SQL 文档和 Spark 核心文档,但仍然没有成功。如果我做saveAsTextFile(),那么当我读回它时,它就是RDD[String],这不是我需要的......
编辑: Daniel 提供了另存为对象文件的答案...我仍然有兴趣了解如何将上面的对象保存为 Hive 表并将其读取。谢谢!
【问题讨论】:
标签: hadoop hive apache-spark rdd