【发布时间】:2019-04-07 21:37:47
【问题描述】:
如何从pandas.DataFrame 中的列中删除很少发生(即频率较低)的值?示例:
In [4]: df[col_1].value_counts()
Out[4]: 0 189096
1 110500
2 77218
3 61372
...
2065 1
2067 1
1569 1
dtype: int64
所以,我的问题是:如何删除 2065, 2067, 1569 等值?我怎样才能对所有包含 .value_counts() 这样的列执行此操作?
更新:关于“低”,我的意思是像 2065 这样的值。这个值出现在col_1 1(一)次,我想删除这样的值。
【问题讨论】:
-
“很少见面”是什么意思?你可以说得更详细点吗?添加一些您已经尝试过的代码可能会有所帮助。
-
我不明白怎么能“更具体”?在
col_1值中,如0遇到189096次。并且像1569这样的价值会见一次。我想在col_1中删除1569和其他类似的值。 -
啊哈!你的意思是“发生”,而不是“满足”。
-
现在,如果你提供一段自包含的代码来生成类似的数据结构,那么想出答案会容易得多。
-
好的。我的英语不好,我知道。但我正在努力解决它=)。那么,我的问题呢?