【发布时间】:2020-12-06 22:12:27
【问题描述】:
我有一个包含 2 列的 DataFrame。我想删除每条记录中嵌套数组的第一个数组。示例:- 我有一个像这样的 DF
+---+-------+--------+-----------+-------------+
|id |arrayField |
+---+------------------------------------------+
|1 |[[Akash,Kunal],[Sonu,Monu],[Ravi,Kishan]] |
|2 |[[Kunal, Mrinal],[Priya,Diya]] |
|3 |[[Adi,Sadi]] |
+---+-------+---------+----------+-------------+
我想要这样的输出:-
+---+-------+------+------+-------+
|id |arrayField |
+---+-----------------------------+
|1 |[[Sonu,Monu],[Ravi,Kishan]] |
|2 |[[Priya,Diya]] |
|3 | null |
+---+-------+------+------+-------+
【问题讨论】:
标签: arrays scala dataframe apache-spark nested