【发布时间】:2021-10-11 12:10:07
【问题描述】:
所以我对来自 Excel 工作表的日期有疑问,我将其转换为 CSV,然后加载到数据框中。基本上我每天处理的数据可以有两种不同的格式。这两个日期列称为Appointment Date 和Attended Date
我正在处理 (DD/MM/YYYY HH:MM) 和 (YYYY/MM/DD HH:MM) 以及它来自第三方,所以我无法设置日期格式结构。我需要做的是解析数据并删除 HH:MM 并输出只有 DD/MM/YYYY 的数据。
我目前的代码如下:
df['Appointment Date'] = df['Appointment Date'].str.replace(' ', '/', regex=True)
df['Attended Date'] = df['Attended Date'].str.replace(' ', '/', regex=True)
df['Appointment Date'] = pd.to_datetime(df['Appointment Date'], format="%d/%m/%Y/%H:%M").dt.strftime("%d/%m/%Y")
df['Attended Date'] = pd.to_datetime(df['Attended Date'], format="%d/%m/%Y/%H:%M").dt.strftime("%d/%m/%Y")
但是当数据以 YYYY/MM/DD HH:MM 出现时,我无法解析数据 异常错误:
time data '2021-10-08/00:00:00' does not match format '%d/%m/%Y/%H:%M' (match)
关于如何解决这个问题的任何想法?
【问题讨论】:
标签: python csv date datetime-parsing