【发布时间】:2013-02-26 14:19:51
【问题描述】:
我在 excel 中有大量数据集。我想知道Java中的数字是跟在Poisson Distribution还是Binomial distribution后面。是否有任何开源库可以帮助我完成这项工作。我在看 Apache Common Math。
任何指针都会有帮助吗?
【问题讨论】:
标签: java statistics
我在 excel 中有大量数据集。我想知道Java中的数字是跟在Poisson Distribution还是Binomial distribution后面。是否有任何开源库可以帮助我完成这项工作。我在看 Apache Common Math。
任何指针都会有帮助吗?
【问题讨论】:
标签: java statistics
听起来您有一个(相对简单的)模型拟合问题,并且您正试图在两个分布之间进行选择。您通常会这样做的方式如下。
p_poisson 用于您数据的泊松分布p_binomial 用于您数据的二项式分布。p(data | p_poisson) 和p(data | p_binomial)(似然函数)并选择概率较高的那个。为了更笼统,我建议查看AIC、BIC 和model selection 的一般信息。在这种情况下,如果您没有大量数据,则应该对二项式分布进行轻微的惩罚,因为它可能会过度拟合,因为它的参数比 Poisson 多。
【讨论】: