【发布时间】:2012-08-16 20:24:42
【问题描述】:
我必须使用直方图绘制一些数据。我的数据在 [0,1] 之间,在任何特定点上都没有大的浓度。
样本数与箱数(等长)之间的最佳比例是多少?
【问题讨论】:
标签: plot matplotlib histogram bin binning
我必须使用直方图绘制一些数据。我的数据在 [0,1] 之间,在任何特定点上都没有大的浓度。
样本数与箱数(等长)之间的最佳比例是多少?
【问题讨论】:
标签: plot matplotlib histogram bin binning
我一般用样本数的平方根作为分箱数。这是在Wikipedia histogram article 中讨论适当数量的垃圾箱时列出的最简单的选择。来自这篇文章
没有“最佳”的 bin 数量,不同的 bin 大小可以揭示数据的不同特征。一些理论家试图确定最佳的 bin 数量,但这些方法通常对分布的形状做出强有力的假设。
如果您不想对数据的分布做出假设,使用样本数的平方根通常是一个不错的起点。
【讨论】: