【发布时间】:2016-04-21 18:15:56
【问题描述】:
我有一个大数据框:
peak.count purity.score material
0 10.0 0.134814 ADB
1 10.0 0.134814 ADB
2 17.0 0.116754 ADB
3 17.0 0.116754 ADB
4 17.0 0.102921 ADB
... ... ... ...
1269 14.0 0.166039 SSA
1270 14.0 0.166039 SSA
1271 14.0 0.166039 SSA
1272 12.0 0.169396 SSA
1273 12.0 0.169396 SSA
1274 12.0 0.169396 SSA
我很好奇将 pure.score 按范围分组,然后计算范围内的这些值。例如,如果我的 15 个值介于 0.1 和 0.2 之间,我希望输出在 1 处反映 15。我尝试了将 value_counts 与 numpy 范围结合使用的方法,但不计算组内的值:
首先我这样做:s = pd.Series(df['purity.score'])
pd.value_counts(s).reindex(np.arange(0,1,0.1)).fillna(0)
0.0 362.0
0.1 0.0
0.2 0.0
0.3 0.0
0.4 0.0
0.5 0.0
0.6 0.0
0.7 0.0
0.8 0.0
0.9 0.0
如何对这些值进行分组?注意我希望使用此表来提供 API 以呈现 javascript 直方图,但不希望使用 Bokeh 或 Matplotlib。我需要访问桌子。
【问题讨论】:
标签: python numpy pandas histogram