【发布时间】:2016-04-28 14:02:15
【问题描述】:
我有一个 spark 数据框 df。有没有办法使用这些列的列表子选择几列?
scala> df.columns
res0: Array[String] = Array("a", "b", "c", "d")
我知道我可以做类似df.select("b", "c") 的事情。但是假设我有一个包含几个列名val cols = List("b", "c") 的列表,有没有办法将它传递给 df.select? df.select(cols) 引发错误。类似于df.select(*cols) 在 python 中的东西
【问题讨论】:
标签: apache-spark apache-spark-sql spark-dataframe