【发布时间】:2019-11-27 14:23:00
【问题描述】:
我有 30 列。 26 个列名是字母的名称。我想把这 26 列做成一列作为一个字符串。
price dateCreate volume country A B C D E ..... Z
19 20190501 25 US 1 2 5 6 19 30
49 20190502 30 US 5 4 5 0 34 50
我想要这个:
price dateCreate volume country new_col
19 20190501 25 US "1,2,5,6,19,....30"
49 20190502 30 US "5,4,5,0,34,50"
我知道我可以这样做:
df.withColumn("new_col", concat($"A", $"B", ...$"Z"))
但是,将来在遇到此问题时,我想知道如何更轻松地连接许多列。有什么办法吗?
【问题讨论】:
标签: scala apache-spark