【发布时间】:2017-10-10 04:57:53
【问题描述】:
我在 unix 中使用 Spark 2.1.0,发现了一个奇怪的问题,即 unix_timestamp 正在更改一个特定时间戳的小时,我创建了一个如下所示的数据框
对于 df2 中的第一条记录,将“20170312020200”作为字符串,我后来将其转换为 df3 中的时间戳,小时数应为 02,但在 df3 中为 03。但是第二条记录在将字符串转换为时间戳时没有问题。
当我在本地系统中使用 Intellij 运行应用程序时,不会发生这种情况。当我们运行我们的应用程序时,这也发生在 spark-submit 中。
【问题讨论】:
标签: scala dataframe spark-dataframe unix-timestamp