【发布时间】:2020-02-17 07:33:46
【问题描述】:
以下是将日期设置为索引的 DataSet 的 df.head()。
Article_ID Country_Code Sold_Units
Date
2017-01-01 3576 AT 1
2017-01-02 1579 FR 1
2017-01-02 332 FI 2
2017-01-03 3576 AT 1
2017-01-03 332 SE 1
国家代码有 4 个值“AT、FR、FI、SE”。如果这 4 个国家/地区代码在这些日期不存在,我想将它们附加到每个日期,并在 Article_ID 和 Sold_Units 中将它们的值归为 0。
示例输出基本上应该是这样的:
Article_ID Country_Code Sold_Units
Date
2017-01-01 3576 AT 1
2017-01-01 0 FR 0 # FR FI SE added with 0s.
2017-01-01 0 FI 0
2017-01-01 0 SE 0
2017-01-02 0 AT 0 # AT, SE added
2017-01-02 1579 FR 1
2017-01-02 332 FI 2
2017-01-02 0 SE 0
2017-01-03 3576 AT 1
2017-01-03 0 FR 0 # FR, FI added
2017-01-03 0 FI 0
2017-01-03 332 SE 1
如何为每个国家/地区代码添加这样的默认值?
【问题讨论】:
标签: python pandas dataframe imputation