【发布时间】:2017-05-02 14:53:35
【问题描述】:
我很难理解我将如何在 Apache spark 的 GraphX 中创建以下内容。我得到以下信息:
一个 hdfs 文件,其中包含以下形式的大量数据:
节点:ConnectingNode1、ConnectingNode2..
例如:
123214:521345、235213、657323
我需要以某种方式将这些数据存储在 EdgeRDD 中,以便我可以在 GraphX 中创建我的图表,但我不知道我将如何去做。
【问题讨论】:
标签: scala hadoop apache-spark mapreduce spark-graphx