【发布时间】:2020-05-11 12:37:40
【问题描述】:
我有一个包含 5 列 ColA、ColB、country、start_time、end_time 的数据框。在进行以下处理后,我需要从现有的 df 形成一个新的 df
If df.country == US then we have to do df.filter(start_time < todays date)
For remaining countries we have to do df.filter(end_time < todays date)
【问题讨论】:
-
您好,欢迎来到 Stackoverflow。这对我来说似乎是一些家庭作业,所以请看How do I ask and answer homework questions?。给出了伪代码,那么你尝试了什么,你在哪里卡住了?问题本身并没有显示出任何努力或任何研究。如果您不编辑此问题,它可能很快就会关闭。
标签: apache-spark pyspark apache-spark-sql