【发布时间】:2019-09-24 16:52:31
【问题描述】:
我有一个这样的多索引数据框
bill
City Month
3 01 14586
02 14316
03 17261
04 16642
05 14977
06 14237
07 14486
08 14216
09 17461
10 16742
11 14677
12 14637
4 01 24586
02 24316
03 27261
04 26642
05 24977
06 24337
07 24486
08 24216
09 27461
10 26742
11 24677
12 24637
我从这行代码中得到的
df = df.groupby(['City', 'Month']).sum()
我想为Month 索引获取一个热编码并将其转换为 12 列以便拥有这样的数据帧
City M1 M2 M3 ... M12 bill
3 1 0 0 0 46
3 0 1 0 0 64
3 0 0 1 0 386
...
4 1 0 0 0 546
4 0 1 0 0 686
...
数字不匹配,但我认为想法很明确。我的目标是bill 和
Month 是 ML 模型的特征
【问题讨论】: