【发布时间】:2012-11-06 22:37:36
【问题描述】:
我正在尝试从数据框中删除出现次数少于 100 次的条目。
数据框data 如下所示:
pid tag
1 23
1 45
1 62
2 24
2 45
3 34
3 25
3 62
现在我像这样计算标签出现的次数:
bytag = data.groupby('tag').aggregate(np.count_nonzero)
但是我不知道如何删除那些计数低的条目...
【问题讨论】:
-
作为@unutbu suggests,请考虑更改接受的答案(过滤方法更简单:))
标签: python numpy python-2.7 pandas