【发布时间】:2017-09-04 00:05:04
【问题描述】:
我想在多列上动态加入两个 spark-scala 数据帧。我会避免硬编码列名比较,如以下语句所示;
val joinRes = df1.join(df2, df1("col1") == df2("col1") and df1("col2") == df2("col2"))
这个查询的解决方案已经存在于pyspark版本中——在以下链接中提供 PySpark DataFrame - Join on multiple columns dynamically
我想使用 spark-scala 编写相同的代码
【问题讨论】:
标签: scala join multiple-columns spark-dataframe