【发布时间】:2022-11-19 15:33:14
【问题描述】:
在 Java 中,我有一个 df 看起来像这样:
| NAME | COLUMN_1 | COLUMN_2 |
|---|---|---|
| name_1 | null | some_value |
| name_2 | some_value | null |
| name_3 | null | null |
我想过滤所有具有 COLUMN_1 和 COLUMN_2 空值的行,以便新数据集看起来像:
| NAME | COLUMN_1 | COLUMN_2 |
|---|---|---|
| name_1 | null | some_value |
| name_2 | some_value | null |
如何保留在 COLUMN_1 和 COLUMN_2 中至少有一个值的行
我尝试了以下过滤器,但 and 语句似乎是顺序的,并从 df 中删除了所有行:
Column filter = col("COLUMN_1").isNotNull().and(col( "COLUMN_2").isNotNull());
df.filter(filter).show();
如何保留在 COLUMN_1 和 COLUMN_2 中至少有一个值的行
【问题讨论】:
标签: java apache-spark apache-spark-sql apache-spark-dataset