【发布时间】:2021-12-30 21:23:31
【问题描述】:
我正在尝试将一列添加到数据框中,使用来自特定列的值(假设它是一个 id)从另一个 df 中查找其实际值。
所以我设置了一个查找def
def lookup(id:String): String {
return lookupdf.select(“value”)
.where(s”id = ‘$id’”).as[String].first
}
如果我通过传递一个 id 字符串自行测试查找定义,它会返回相应的值。
但我很难找到在“withColumn”函数中使用它的方法。
dataDf
.withColumn(“lookupVal”, lit(lookup(col(“someId”))))
它正确地抱怨我正在传递一个列,而不是预期的字符串,问题是我如何从该列中给它实际值?
【问题讨论】:
标签: dataframe scala apache-spark apache-spark-sql