【发布时间】:2019-04-03 10:39:17
【问题描述】:
我正在尝试将求和函数应用于 spark 中数据框列的每个单元格。每个单元格都包含一个我想加起来的整数列表。 但是,我得到的错误是:
console:357: 错误:值总和不是 org.apache.spark.sql.ColumnName
下面的示例脚本。
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._
val spark = SparkSession.builder().getOrCreate()
val df = spark.createDataFrame(Seq(
(0, List(1,2,3)),
(1, List(2,2,3)),
(2, List(3,2,3)))).toDF("Id", "col_1")
val test = df.withColumn( "col_2", $"col_1".sum )
test.show()
【问题讨论】:
标签: scala list apache-spark dataframe sum