【发布时间】:2020-02-16 18:54:43
【问题描述】:
df = pd.read_csv(
'https://media-doselect.s3.amazonaws.com/generic/MJjpYqLzv08xAkjqLp1ga1Aq/Historical_Data.csv')
df.head()
Date Article_ID Country_Code Sold_Units
0 20170817 1132 AT 1
1 20170818 1132 AT 1
2 20170821 1132 AT 1
3 20170822 1132 AT 1
4 20170906 1132 AT 1
我有上面给出的 DataFrame。请注意,日期列的类型为 int64,并且缺少日期 19 日和 20 日。
我想将其转换为 yyyy-mm-dd 格式,并在文章 ID、出口代码和销售单位中将缺失的日期归为 0。
到目前为止我已经尝试过:
df['Date'] = pd.to_datetime(df['Date'].astype(str), format='%Y-%m-%d')
获取所需格式的日期。
Date Article_ID Outlet_Code Sold_Units
0 2017-08-17 1132 AT 1
1 2017-08-18 1132 AT 1
2 2017-08-21 1132 AT 1
3 2017-08-22 1132 AT 1
4 2017-09-06 1132 AT 1
但是,我如何推算缺失的 19 日和 20 日,并在新添加的日期行下推算带有 0 的行?
这是我所做的一个 sn-p,它返回一个值错误:无法从重复的轴重新索引。
【问题讨论】:
标签: python pandas dataframe datetime