【发布时间】:2020-10-04 20:25:31
【问题描述】:
可能是一个非常愚蠢的问题,但是对于:
val ds3 = ds.groupBy($"ip")
.avg("humidity")
目前尚不清楚对于数据集(而不是数据框)如何像使用即时别名一样重命名列。我尝试了几件事,但无济于事。尝试时没有错误,但没有效果。
我想将“avg_humidity”作为列名。
扩展问题,如果我发出怎么办:
val ds3 = ds.groupBy($"ip")
.avg()
如何处理?
【问题讨论】:
标签: apache-spark apache-spark-dataset