【发布时间】:2019-01-24 19:25:35
【问题描述】:
我的 DataFrame 如下所示:
+----------------+-------------+
| Business_Date| Code|
+----------------+-------------+
|1539129600000000| BSD|
|1539129600000000| BTN|
|1539129600000000| BVI|
|1539129600000000| BWP|
|1539129600000000| BYB|
+----------------+-------------+
在将数据加载到 hive 表时,我想将 Business_Date 列从 bigint 转换为 timestamp 值。
我该怎么做?
【问题讨论】:
-
如何从 parquet 文件中读取 bigint 时间戳字段?我收到错误“无法为 Parquet 类型为可选 int64 时间戳的数据类型“时间戳”创建 Parquet 转换器?
标签: apache-spark hive pyspark apache-spark-sql pyspark-sql