【发布时间】:2018-01-06 15:46:34
【问题描述】:
我有一个包含 7 天 24 小时数据的数据框,因此它有 144 列。
id d1h1 d1h2 d1h3 ..... d7h24
aaa 21 24 8 ..... 14
bbb 16 12 2 ..... 4
ccc 21 2 7 ..... 6
我想做的是找到每天最多 3 个值:
id d1 d2 d3 .... d7
aaa [22,2,2] [17,2,2] [21,8,3] [32,11,2]
bbb [32,22,12] [47,22,2] [31,14,3] [32,11,2]
ccc [12,7,4] [28,14,7] [11,2,1] [19,14,7]
【问题讨论】:
标签: scala apache-spark spark-dataframe