【发布时间】:2017-09-21 02:55:14
【问题描述】:
我是 spark 新手,我有数据框 df:
+----------+------------+-----------+
| Column1 | Column2 | Sub |
+----------+------------+-----------+
| 1 | 2 | 1 |
+----------+------------+-----------+
| 4 | null | null |
+----------+------------+-----------+
| 5 | null | null |
+----------+------------+-----------+
| 6 | 8 | 2 |
+----------+------------+-----------+
当减去两列时,一列为空,因此结果列也为空。
df.withColumn("Sub", col(A)-col(B))
预期的输出应该是:
+----------+------------+-----------+
| Column1 | Column2 | Sub |
+----------+------------+-----------+
| 1 | 2 | 1 |
+----------+------------+-----------+
| 4 | null | 4 |
+----------+------------+-----------+
| 5 | null | 5 |
+----------+------------+-----------+
| 6 | 8 | 2 |
+----------+------------+-----------+
我不想将 column2 替换为 0,它应该仅为 null。 有人可以帮我解决这个问题吗?
【问题讨论】:
标签: scala apache-spark apache-spark-sql