【发布时间】:2019-10-17 21:12:34
【问题描述】:
我在pandas 中有一个大数据框。我想在绘制直方图时删除具有较低频率的某些值范围(不是单个值)。
对于下面的图片,假设我要删除对应于计数/频率低于 20 的 Dataframe 变量的所有值。有人对此有任何解决方案吗?
# PR has value between 0 to 1700
data['PR'].hist(bins = 160) #image on the left
data_openforest['PR'].hist(bins = 160) #image on the right
【问题讨论】:
-
您可以使用
np.histogram或pd.cut来计算直方图并过滤计数。 -
你有一个例子吗?我到了
ranges = [i for i in np.arange(0,1600,10)]和count = data_openforest.groupby(pd.cut(data_openforest['Count'], ranges)).count()。但是我现在如何将它应用到我的原始数据框。