【发布时间】:2016-03-17 21:21:33
【问题描述】:
我有一个数据框,其中有一列带有纪元秒数。
除此之外,我想添加一列,其中包含当前时间值和上一个时间值之间的差异 - 换句话说,自基于时间戳列的数据帧中最后一行以来的时间差异。
如何根据之前的值添加这样的列?
我正在使用 Scala API。
【问题讨论】:
-
您是否对数据进行分组/分区?
-
到目前为止 - 只是列出了日志中的所有行,并希望根据时间绘制一些测量值
-
如果您不对数据框进行分组,您将无法使用(我的意思是您可以,但您真的不想这样做)。改用滑动:stackoverflow.com/a/32679114/1560062。如果您决定分组,您可以使用如下所示的窗口函数:stackoverflow.com/q/34535833/1560062
标签: scala apache-spark dataframe apache-spark-sql