【发布时间】:2018-08-14 09:30:10
【问题描述】:
当我尝试将连接元素作为 pyspark 数据框连接函数中的变量传递时,我遇到了一个问题。我正在从文件中获取主键字段,而我试图在连接语句中将其作为变量传递,它会引发错误,因为它是作为字符串传递的“无法解析列名”。请协助我。
for i in range(len(pr_list)):
if i != len(pr_list)-1:
pr_str += " (df_a." + pr_list[i] + " == df_b." +pr_list[i] +") & "
else:
pr_str += "(df_a." + pr_list[i] + " == df_b." +pr_list[i] +")"
print (pr_str)
df1_with_db2 = df_a.join(df_b, pr_str ,'inner').select('df_a.*')
【问题讨论】:
标签: string python-3.x apache-spark dataframe pyspark