【发布时间】:2022-01-24 04:13:17
【问题描述】:
b/w DataFilter 与 PushedFilter 有什么区别?
当不使用分区过滤器时,如果发生谓词下推,我希望过滤器转到 PushedFilter。这正在按预期发生。我还在物理计划中找到了DataFilter。
我想知道查询中的DataFilter 是什么?它与 PushedFilter 有何不同?
【问题讨论】:
标签: apache-spark pyspark
b/w DataFilter 与 PushedFilter 有什么区别?
当不使用分区过滤器时,如果发生谓词下推,我希望过滤器转到 PushedFilter。这正在按预期发生。我还在物理计划中找到了DataFilter。
我想知道查询中的DataFilter 是什么?它与 PushedFilter 有何不同?
【问题讨论】:
标签: apache-spark pyspark
与将文件读入内存然后应用过滤器(这会浪费 CPU 周期和带宽)相反,可以在从裸机读取文件时过滤数据。这就是 DataFilter。
【讨论】:
DataFilter 和 PushedFilter 都将为空,而我们将拥有 PartitionFilter。