【发布时间】:2015-07-09 21:11:45
【问题描述】:
我有一个包含 MANY 列的 RDD(例如,数百个),如何在此 RDD 的末尾再添加一列?
例如,如果我的 RDD 如下所示:
123, 523, 534, ..., 893
536, 98, 1623, ..., 98472
537, 89, 83640, ..., 9265
7297, 98364, 9, ..., 735
......
29, 94, 956, ..., 758
如何向其中添加一列,其值为第二列和第三列之和?
非常感谢。
【问题讨论】:
-
请注意,数据帧是不可变的。你不能换一个,但你可以用旧的做一个新的……见stackoverflow.com/questions/29109916/…
标签: apache-spark rdd