【发布时间】:2020-11-10 11:31:34
【问题描述】:
在我的数据集中,有一个名为 AdminRegion2 的列,它有数千个不同的值,每个值都在不同的行中,它们都是美国的县。我需要从每个县名中删除某些单词,以便将数据集链接到 GeoJSON 文件。
有些县将这些词写在“自治市镇、人口普查区或县”的名称之后。我需要从可能包含其中任何一个的每一行中删除所有三个单词。所以它只是“鲍德温”
这是人口普查区的代码我累了,但所有最后有人口普查区的县仍然有它。我不知道为什么它不起作用。
only_counties = usa_only[usa_only['AdminRegion2'].str.contains("", na = False)]
only_counties = only_counties['AdminRegion2'].str.strip().str.replace("Census Area", '')
only_counties.to_csv("counties_only.csv")
【问题讨论】:
-
你想用
only_counties = usa_only[usa_only['AdminRegion2'].str.contains("", na = False)]实现什么? -
我试图让数据集只显示县数据。因为它包含州和县级的数据。这行代码有效。
-
好的。如果没有看到州级别的样本,我真的无法理解,但我已经更改了答案以使用 only_county 数据。
-
给我一个错误,我把错误贴在你的回答下面。
-
见下文。我希望这会有所帮助
标签: python pandas replace dataset