【发布时间】:2020-01-13 11:07:03
【问题描述】:
我正在尝试将 pandas 数据帧上传到 S3 存储桶,然后使用 Athena 进行查询。 我已按以下格式上传日期时间:
pd.to_datetime(df["myDateTime"], format='%Y-%m-%d %H:%M:%S')
2019-08-07 08:04:43.942000+00:00
df.dtypes
myDateTime datetime64[ns, UTC]
当我尝试在 Athena 中查询结果时,我得到了这样的结果:
+51568-02-09 14:52:22.000
CREATE EXTERNAL TABLE IF NOT EXISTS default.dashboardtable(
`myDateTime` timestamp,
我尝试在 Pandas 中更改日期格式以排除微秒,但这似乎不起作用。
【问题讨论】:
-
你确定是同一条记录吗?输入输出?
-
是的,是同一条记录
-
@davo777 您的问题似乎类似于 stackoverflow.com/questions/56430840/… 。我猜你正在使用 Parquet,对吗?
-
我解决它的方法是将我的日期时间列转换回字符串,删除此位“000+00:00”,并在 Athena 中将格式更改为时间戳
标签: python pandas amazon-web-services datetime amazon-athena