【发布时间】:2020-09-29 19:04:36
【问题描述】:
我在转换数据框中的日期时遇到问题。
例子:
col1 col2
1 2018-10-02 2018-07-03
09:00:00+00 23:56:09.134+00
2 2018-07-03 2018-10-02
23:56:09.134+00 09:00:00+00
df.dtypes
col1 object
col2 object
由于我需要对数据集做一些 ML,我需要将日期转换为浮点数,所以是 julian 格式。
我尝试了很多方法,例如: Calculating julian date in python 或
df['col1'] = df['col1'].dt.strftime("%y%j")
上面的示例在将列转换为 to_datetime 后运行良好,但如果我通过 df[['col1', "col2"]] 会引发错误:
AttributeError: 'DataFrame' object has no attribute 'dt'
我的格式也有问题,因为有些 obs 确实有毫秒,有些没有。我想我可以放弃它们,但在这种情况下我也不知道怎么做。
我也找不到能延长到秒的朱利安格式(%y%j 是不够的,我不知道我需要哪种格式的字母)
我的 df 中有许多其他列带有日期,所以有一种简单的方法可以将它们全部转换吗?
谢谢
【问题讨论】:
标签: python pandas date datetime julian-date