【发布时间】:2019-03-31 00:28:16
【问题描述】:
当我执行时
sparkSession.sql("SELECT to_timestamp('2018-08-04.11:18:29 AM', 'yyyy-MM-dd.hh:mm:ss a') as timestamp")
答案中缺少上午/下午
+-------------------+
| timestamp|
+-------------------+
|2018-08-04 11:18:29|
+-------------------+
但如果 AM/PM 不存在,那么它会给出正确的答案。
使用 unix_timestamp
sparkSession.sql("select from_unixtime(unix_timestamp('08-04-2018.11:18:29 AM','dd-MM-yyyy.HH:mm:ss a'), 'dd-MM-yyyy.HH:mm:ss a') as timestamp")
给出了正确的答案,但是数据类型变成了字符串,而我的要求是将数据类型转换为时间戳而不丢失数据。
有人有建议吗?
提前致谢。
【问题讨论】:
标签: apache-spark dataframe timestamp