【发布时间】:2020-10-17 19:04:36
【问题描述】:
我有一个要加载到 Spark 中 Dataframe 的表,它具有以下架构:
verticesDf.printSchema
root
|-- id: integer (nullable = true)
|-- target: string (nullable = true)
|-- batch_id: integer (nullable = true)
|-- x: double (nullable = true)
|-- y: double (nullable = true)
|-- z: double (nullable = true)
|-- size: double (nullable = true)
如何将其转换为 VertexRDD,以便以后可以使用它构建 Graph?
我正在尝试以下方法:
case class SRow( target:String, batch_id:Double, x:Double, y:Double, z:Double, size:Double)
val sourceDS: Dataset[(VertexId, SRow)] = verticesDf.as[(VertexId, SRow)]
val vertVX=VertexRDD(sourceDS)
但是这个和许多其他的并没有给出结果——我总是遇到一些类型不匹配的问题。正确的方法是什么?
【问题讨论】:
标签: apache-spark apache-spark-sql spark-graphx