【发布时间】:2019-01-14 00:32:15
【问题描述】:
我有两个数据框:
数据框1
DATE1|
+----------+
|2017-01-08|
|2017-10-10|
|2017-05-01|
dataframe2
|NAME | SID| DATE1| DATE2|ROLL| SCHOOL|
+------+----+----------+----------+----+--------+
| Sayam|22.0| 8/1/2017| 7 1 2017|3223| BHABHA|
|ADARSH| 2.0|10-10-2017|10.03.2017| 222|SUNSHINE|
| SADIM| 1.0| 1.5.2017| 1/2/2017| 111| DAV|
预期输出
| NAME| SID| DATE1| DATE2|ROLL| SCHOOL|
+------+----+----------+----------+----+--------+
| Sayam|22.0|2017-01-08| 7 1 2017|3223| BHABHA|
|ADARSH| 2.0|2017-10-10|10.03.2017| 222|SUNSHINE|
| SADIM| 1.0|2017-05-01| 1/2/2017| 111| DAV|
我想将 dataframe2 中的 DATE1 列替换为 dataframe1 的 DATE1 列。我需要一个通用的解决方案。
我们将不胜感激。
我试过withColumn方法如下
dataframe2.withColumn(newColumnTransformInfo._1, dataframe1.col("DATE1").cast(DateType))
但是,我收到一个错误:
org.apache.spark.sql.AnalysisException: resolved attribute(s)
【问题讨论】:
标签: scala apache-spark apache-spark-sql