【发布时间】:2018-06-11 09:49:20
【问题描述】:
问题与问题有点相似:Change the timestamp to UTC format in Pyspark
基本上,它是使用 scala 将带有偏移量的时间戳字符串格式 ISO8601 转换为 UTC 时间戳字符串(2017-08-01T14:30:00+05:30 -> 2017-08-01T09:00:00+00:00 )。
我是 scala/java 的新手,我检查了 spark 库,他们在不知道时区的情况下无法转换,我不知道时区,除非(我以丑陋的方式解析它或使用 java/ scala lib?)有人可以帮忙吗?
更新:更好的方法:在 spark 中设置时区会话,并使用 df.cast(DataTypes.TimestampType) 进行时区转换
【问题讨论】:
-
您能否说明输入和预期格式,并更新您尝试过的内容
标签: scala apache-spark utc timestamp-with-timezone