【发布时间】:2019-08-01 07:50:16
【问题描述】:
我想根据以下条件过滤掉来自DataFramedf的数据。由于要求很少,我需要使用配置文件(或作为字符串变量)传递此条件。
DataFrame df
+----+------+----+-----+
| Id| Name|City|State|
+----+------+----+-----+
| 1| ABC| ADI| GUJ|
| 2| BCD|null| MAH|
| 3| null| ADI| GUJ|
| 4| AFDS| DEL| DEL|
|null| null| PUN| null|
| 6| DSF| MUM| MAH|
| 7|DSFDFS|null| RAJ|
| 8| null| PUN| MAH|
| 9| FDA| JAI| RAJ|
| 10| DFAD|null| GUJ|
| 11| null|null| null|
| 12| null|null| null|
+----+------+----+-----+
条件:
col("State").isNull && (col("City").isNull || col("Name").isNull)
我已检查filter 接受字符串条件,但在上述条件下它不适用于isNull。
请帮忙。
【问题讨论】:
标签: dataframe apache-spark filter