【发布时间】:2020-08-22 00:18:04
【问题描述】:
''' 我正在用熊猫编写代码。卡在下面我需要使用缺失行的部分。 ''' df
A B C D E E G H
0 US BENIN 1995 5 10 15 40
1 US BENIN 1996 6 12 12 12
2 US BENIN 2000 4 13 12 12
3 US Hungary 1998 5 19 23 23
4 US Hungary 1999 3 23 12 3
5 UK Chile 2000 5 10 15 40
6 UK Chile 2002 6 12 12 12
7 UK Chile 2004 4 13 12 12
8 UK Iceland 2004 5 19 23 23
89UK Iceland 2005 3 23 12 3
''' 我想使用循环在这些行之间添加从 1995 年到 2000 年缺失年份的空白行 ''' 期望的输出:
A B C D E F G H
0 US BENIN 1995 5 10 15 40
1 US BENIN 1996 6 12 12 12
2 US BENIN 1997
3 US BENIN 1998
4 US BENIN 1999
5 US BENIN 2000 4 13 12 12
6 US BENIN 2001
7 US BENIN 2002
8 US BENIN 2003
9 US BENIN 2004
10US BENIN 2005
11US Hungary 1995
12US Hungary 1996
13US Hungary 1997
14US Hungary 1998 5 19 23 23
15US Hungary 1999 3 23 12 3
16US Hungary 1999
17US Hungary 2000
18US Hungary 2001
19US Hungary 2002
20US Hungary 2003
21US Hungary 2004
22US Hungary 2005
23UK Chile 1995
24UK Chile 1996
25UK Chile 1997
26UK Chile 1998
27UK Chile 1999
28UK Chile 2000 5 10 15 40
29UK Chile 2001
30UK Chile 2002 6 12 12 12
31UK Chile 2003
32UK Chile 2004 4 13 12 12
33UK Chile 2005
:
:
:
:
43 UK Iceland 2004 5 19 23 23
44 UK Iceland 2005 3 23 12 3
【问题讨论】:
-
欢迎您!您能否展示您解决问题的尝试?
-
我创建了一个不同的数据框,其中包含所有年份。尝试使用左连接加入,但我无法在所有国家/地区都这样做
-
我也尝试过使用列表。我创建了一个包含所有年份的列表。编写了一个函数来检查 D 列是否包含该列表中的值。如果是,则忽略它,如果不是,则添加一行,其中缺少年份和国家/地区。但似乎循环在熊猫中不起作用
-
这可能不是最好的方法,但是如何:附加所有要添加的行(如
9 US BENIN 2004),对DataFrame进行排序,删除具有缺失值的重复项,然后重置索引? -
这只是我数据框的一小部分。我的数据框包含超过 60000 行,我需要为所有 B 和 C 对添加缺失年份
标签: python pandas function loops dataframe