【发布时间】:2016-01-16 19:44:44
【问题描述】:
我有一个字符串数组缓冲区,其中包含我要创建的图形的所有顶点的标签。我需要创建一个 RDD 对象[(VertexId, String)],它将成为我未来图形的节点,其中每个节点的 VertexId = ArrayBuffer 中节点标签的索引。
我只找到了有关使用SparkContext.textFile(String fname) 创建 RDD 的信息,但没有找到有关如何从数据结构创建 RDD 的信息。
有没有办法做到这一点,还是我总是必须从文件创建 RDD?
【问题讨论】:
-
既然您发现“没有关于如何从数据结构创建 RDD”,我假设您不知道 Spark 的 scaladocs。这些对于使用 Spark 和 scala 非常重要——它们可以在这里找到。 spark.apache.org/docs/latest/api/scala/…
标签: scala apache-spark rdd