【发布时间】:2021-09-03 11:26:58
【问题描述】:
我有一个 Pandas 数据框,其中一列 director_name 包含电影导演,另一列 death_year 包含 NaN 或描述他们去世年份的浮点数(例如:1996.00)。如何删除所有拥有已死亡董事的行,如 death_year 列中的浮点数所表示的那样?
nconst director_name birth_year death_year
0 nm0061671 Mary Ellen Bauder 1967.00 NaN
1 nm0061865 Joseph Bauer NaN 1996.00
2 nm0062070 Bruce Baum 1981.00 NaN
3 nm0062195 Axel Baumann NaN 2015.00
4 nm0062798 Pete Baxter 1954.00 NaN
因此,在上面的数据框中,第 1 行和第 3 行将被删除,因为 Joseph Bauer 于 1996 年去世,Axel Baumann 于 2015 年去世。结果是只有在世董事的数据框:
nconst director_name birth_year death_year
0 nm0061671 Mary Ellen Bauder 1967.00 NaN
1 nm0062070 Bruce Baum 1981.00 NaN
2 nm0062798 Pete Baxter 1954.00 NaN
DataFrame 很大,它包含太多行,无法通过物理方式检查并确保有人没有错误地输入死亡年份,例如 0000.000。
【问题讨论】:
-
不完全一样@Chris。如果有人输入错误的信息并输入 0000.00 来表示某人死亡的年份怎么办?所以问题不同。请删除您的反对票。谢谢
-
我上述评论@Chris 的 0000.00 部分的任何输入?
标签: python pandas dataframe multiple-columns rows