【发布时间】:2021-07-30 22:12:15
【问题描述】:
我在 pyspark 中有一个数据框,如下所示:
df = spark.table('db.table')
.select(F.col('key').alias('key_a'),
F.to_date('move_out_date', 'yyyyMMdd').alias('move_out_date'))
现在我想将move_out_date 列与日期20151231 进行比较。但是下面的代码不起作用
from pyspark.sql import functions as F
df.filter(F.datediff(F.col('move_out_date'), F.to_date('20151231', 'yyyyMMdd')) > 0)
如何将 to_date 列与单个值进行比较?
【问题讨论】:
-
从代码差异看来您需要大于日期的记录
df.filter(df.move_out_date > f.to_date(f.lit('20151231'), 'yyyyMMdd'))
标签: apache-spark pyspark apache-spark-sql