【发布时间】:2018-04-28 04:31:50
【问题描述】:
我觉得有人问过这个问题,但我找不到确切的答案。
我有一个包含几十列的大型数据集。当任何列中的值大于 5 时,我试图从数据集中删除行,但我不想搜索前两列(前两列的值可以大于 5)。我知道可以命名特定列,例如(df.colname > 5),但是如何为一系列列命名?
像这样:
df = df[df.columns[2:34] > 5]
【问题讨论】:
我觉得有人问过这个问题,但我找不到确切的答案。
我有一个包含几十列的大型数据集。当任何列中的值大于 5 时,我试图从数据集中删除行,但我不想搜索前两列(前两列的值可以大于 5)。我知道可以命名特定列,例如(df.colname > 5),但是如何为一系列列命名?
像这样:
df = df[df.columns[2:34] > 5]
【问题讨论】:
通过使用来自pandas 的.any 和来自Brad 的数据框
df[~(df.iloc[:,2:]>5).any(1)]
Out[403]:
a b c d e
0 0.0 0.0 0.0 0.0 0.0
2 0.0 0.0 0.0 0.0 0.0
3 0.0 0.0 0.0 0.0 0.0
【讨论】: