【发布时间】:2019-03-24 00:59:54
【问题描述】:
原始数据框
0.2 0.3
+------+------------- -+
| name| country |
+------+---------------+
|Raju |UAS |
|Ram |Pak. |
|null |China |
|null |null |
+------+--------------+
I Need this
+------+--------------+
|Nwet|wet Con |
+------+--------------+
|0.2 | 0.3 |
|0.2 | 0.3 |
|0.0 | 0.3. |
|0.0 | 0.0 |
+------+--------------+
我想创建一个 Udf 。两列
这将适用于 Name Column 它检查它是否不为 null 然后它返回 0.2 返回 0.0 。
并且相同的 Udf 适用于国家列检查它是否返回 0.0 。不为 null 则返回 0.3
【问题讨论】:
-
你想只返回一个值还是基于两列返回两个值?
-
查看我对您重复帖子的回复:stackoverflow.com/questions/52887546/…
标签: scala apache-spark dataframe apache-spark-sql