【发布时间】:2017-09-27 15:33:23
【问题描述】:
我想在数据框中创建一个“总计”行。
这将添加除 uid 单元格之外的所有行。
uid val1 val2 val3
3213 1 2 3
创建这个:
uid val1 val2 val3 Total
3213 1 2 3 6
所以,我需要过滤掉 UID,然后求和。但是,如果我在求和之前删除 UID,那么在求和之后我将无法重新加入表(因为加入必须在 UID 上)。
我在玩过滤器,但我找不到在过滤器中获取列名的方法。
所以我到目前为止是:
val dfvReducedTotalled = dfvReduced.withColumn("TOTAL", dfvReduced.columns
.filter(col=> !col.?????? == "UID")
.map(c => col(c)).reduce((c1, c2) => c1 + c2))
【问题讨论】:
标签: scala apache-spark apache-spark-sql