【发布时间】:2019-06-05 12:39:58
【问题描述】:
我有包含多个国家的数据集。 如何过滤它以使其仅包含特定国家/地区?
例如现在它包含英国、比利时、法国等
我想对其进行过滤,使其仅显示法国和比利时。
到目前为止,我已经尝试过:
dataset = dataset.loc[dataset.Country == "France"].copy()
dataset.head()
它有效,因为它只过滤法国的数据,但如果我添加比利时
dataset = dataset.loc[dataset.Country == "France","Belgium"].copy()
dataset.head()
它不再起作用了。 我收到以下错误:
'the label [Belgium] is not in the [columns]'
我们将不胜感激。
【问题讨论】:
-
你想要
dataset = dataset[dataset['Country'].isin([ "France","Belgium"])].copy()你尝试的是寻找一个不存在的列Belgium,逗号后面的参数寻找一个列 -
像
dataset = dataset.loc[dataset.Country == "France" or dataset.Country == "Belgium"].copy()这样的东西有用吗?很久没用熊猫了。