【发布时间】:2018-03-24 06:10:37
【问题描述】:
我有一个数据框 rawdata,我必须在 X 列上应用过滤条件,其值为 CB、CI 和 CR。所以我使用了下面的代码:
df = dfRawData.filter(col("X").between("CB","CI","CR"))
但我收到以下错误:
between() 正好有 3 个参数(给定 4 个)
请告诉我如何解决此问题。
【问题讨论】:
-
相关:stackoverflow.com/a/58541958/3712254。我发现
join的实现比where快。
标签: apache-spark pyspark apache-spark-sql spark-dataframe pyspark-sql