【发布时间】:2016-11-09 13:44:23
【问题描述】:
问:在 PySpark 中有什么方法可以合并两个数据框或将一个数据框的一列复制到另一个?
例如,我有两个数据框:
DF1
C1 C2
23397414 20875.7353
5213970 20497.5582
41323308 20935.7956
123276113 18884.0477
76456078 18389.9269
第二个数据帧
DF2
C3 C4
2008-02-04 262.00
2008-02-05 257.25
2008-02-06 262.75
2008-02-07 237.00
2008-02-08 231.00
然后我想像这样将 DF2 的 C3 添加到 DF1:
New DF
C1 C2 C3
23397414 20875.7353 2008-02-04
5213970 20497.5582 2008-02-05
41323308 20935.7956 2008-02-06
123276113 18884.0477 2008-02-07
76456078 18389.9269 2008-02-08
我希望这个例子很清楚。
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql