【发布时间】:2015-10-04 18:12:06
【问题描述】:
我想不通,但猜它很简单。我有一个火花数据框 df。此 df 具有列“A”、“B”和“C”。现在假设我有一个包含此 df 列名称的数组:
column_names = Array("A","B","C")
我想以这样的方式创建df.select(),以便我可以指定不 选择哪些列。
示例:假设我不想选择列“B”。我试过了
df.select(column_names.filter(_!="B"))
但这不起作用,因为
org.apache.spark.sql.DataFrame 不能应用于 (Array[String])
所以,here 它说它应该与 Seq 一起使用。但是,尝试
df.select(column_names.filter(_!="B").toSeq)
结果
org.apache.spark.sql.DataFrame 不能应用于 (Seq[String])。
我做错了什么?
【问题讨论】:
标签: scala apache-spark dataframe apache-spark-sql