【问题标题】:How can we find 2 timestamp difference in minutes using PySpark SQL?我们如何使用 PySpark SQL 在分钟内找到 2 个时间戳差异?
【发布时间】:2020-04-09 22:23:07
【问题描述】:

SQL: DATEDIFF(mi, ClockInUTC_End,ClockInUTC_Snd) TimeinMinutes

我想在 PySpark SQL 中替代它。 spark.sql("")

【问题讨论】:

    标签: apache-spark pyspark apache-spark-sql bigdata pyspark-sql


    【解决方案1】:

    您可以使用 unix_timestamp 函数来执行此操作,该函数基本上转换为 UTC 中的 UNIX 纪元值。请参考以下代码。

    spark.sql("""
    SELECT  "2019-12-18 06:30:00" AS ClockInUTC_End,
            "2019-12-18 06:00:00" AS ClockInUTC_Snd, 
            CAST((unix_timestamp("2019-12-18 06:30:00", "yyyy-MM-dd HH:mm:ss") 
                    - unix_timestamp("2019-12-18 06:00:00", "yyyy-MM-dd HH:mm:ss"))/60 AS INT) AS Diff_In_Minutes  
    """).show(20,False)
    
    
    Output :
    +-------------------+-------------------+---------------+
    |ClockInUTC_End     |ClockInUTC_Snd     |Diff_In_Minutes|
    +-------------------+-------------------+---------------+
    |2019-12-18 06:30:00|2019-12-18 06:00:00|30             |
    +-------------------+-------------------+---------------+
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-02-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-07-04
      • 1970-01-01
      • 2021-09-07
      相关资源
      最近更新 更多