【发布时间】:2018-05-15 01:55:31
【问题描述】:
我有一个包含一列的数据框。该列的每一行都有一个字符串值数组:
我的 Spark 2.2 数据框中的值
["123", "abc", "2017", "ABC"]
["456", "def", "2001", "ABC"]
["789", "ghi", "2017", "DEF"]
org.apache.spark.sql.DataFrame = [col: array]
root
|-- col: array (nullable = true)
| |-- element: string (containsNull = true)
访问数组中元素的最佳方式是什么?例如,我想在 2017 年的第四个元素中提取不同的值(回答“ABC”、“DEF”)。
【问题讨论】:
标签: scala apache-spark apache-spark-sql