【问题标题】:how many bins given some data给定一些数据有多少个 bin
【发布时间】:2012-08-16 20:24:42
【问题描述】:

我必须使用直方图绘制一些数据。我的数据在 [0,1] 之间,在任何特定点上都没有大的浓度。

样本数与箱数(等长)之间的最佳比例是多少?

【问题讨论】:

    标签: plot matplotlib histogram bin binning


    【解决方案1】:

    我一般用样本数的平方根作为分箱数。这是在Wikipedia histogram article 中讨论适当数量的垃圾箱时列出的最简单的选择。来自这篇文章

    没有“最佳”的 bin 数量,不同的 bin 大小可以揭示数据的不同特征。一些理论家试图确定最佳的 bin 数量,但这些方法通常对分布的形状做出强有力的假设。

    如果您不想对数据的分布做出假设,使用样本数的平方根通常是一个不错的起点。

    【讨论】:

    • 谢谢,这正是我的情况。对我的数据分布没有任何假设。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-07-24
    • 1970-01-01
    • 2020-12-24
    • 2020-03-31
    • 2020-01-19
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多