【发布时间】:2019-06-25 19:35:49
【问题描述】:
假设我有一个数据框,其列名 epoch 是从纪元时间开始的秒数,我想将其转换为 UTC 时间。如何在 Pyspark 中做到这一点?
我不想硬编码“GMT-7”,我想确保我使用正确的时间偏移量,基于夏令时的 GMT-7 或 GMT-8。我正在运行 Spark 2.1
myDF = myDF.withColumn("epoch_tmst",(myDF.epoch.cast(dataType=TimestampType()))
myDF = myDF.withColumn("epoch_tmst_utc",to_utc_timestamp(myDF.epoch_tmst,"GMT-7"))
【问题讨论】:
-
欢迎来到 SO。您能否提供您的数据样本和预期输出?提供帮助会更容易。
标签: python-2.7 apache-spark pyspark pyspark-sql