【发布时间】:2021-01-09 22:53:40
【问题描述】:
我有一个数据框 df 和一个列名 setp 来创建我写的列表
setp_list=df.select ('setp').distinct().collect()
setp_array=[row.setp for row in setp_list]
setp_array= str(setp_array)[1:-1]
我想在 spark.sql 语句中使用它
df1=spark.sql(f"select * from table where setp in ({setp_array})").
我不确定如何显示列表以查看它是如何创建的,但主要是我希望它包含在 spark sql 语句中。它在 spark sql 语句中作为无效语法引发错误
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql