【发布时间】:2021-08-16 07:22:15
【问题描述】:
我有一个 pyspark 数据框:
Year Month
2021 06/01/2021
2021 06/01/2021
2021 07/01/2021
2021 07/01/2021
2021 0/01/2021
2021 0/01/2021
我需要特定月份的数据框以及“0/01/2021”。尝试使用以下代码:
df=df.filter((col('Month')=='07/01/2021') & (col('Month')=='0/01/2021'))
display(df)
我需要的数据框是:
Year Month
2021 07/01/2021
2021 07/01/2021
2021 0/01/2021
2021 0/01/2021
但我得到:
Query returned no results
结果。
“月”列采用字符串格式。
如何过滤这些日期?
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql