【发布时间】:2017-12-06 13:57:39
【问题描述】:
我有一个 DataFrame myDf,其中包含一组点对(即 x 和 y 坐标),它具有以下架构:
myDf.printSchema
root
|-- pts: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- x: float (nullable = true)
| | |-- y: float (nullable = true)
我想获得 x 和 y 作为单独的普通 Scala Array's。我想我需要应用爆炸功能,但我不知道如何。我尝试应用this 解决方案,但无法正常工作。
我正在使用 Spark 1.6.1 和 Scala 2.10
编辑:我意识到我误解了 Spark 的工作原理,只有在收集数据(或使用 UDF)时才能获取实际数组
【问题讨论】:
标签: scala apache-spark