【发布时间】:2019-03-12 11:47:49
【问题描述】:
我要计算在pyspark两列之间小时的时差。 下面是示例数据框。列是字符串类型(YYYYMMDDHHMMSS)。 P>
time1 time2
20191020051010 20191019051010
要低于输出。这里24表示以小时TIME1和TIME2之间的差。 P>
time1 time2 diff
20191020051010 20191019051010 24
【问题讨论】:
标签: python-3.x apache-spark pyspark apache-spark-sql pyspark-sql