【发布时间】:2016-07-30 18:55:12
【问题描述】:
我想在 R 中计算卡方统计量,定义为
sum[(O_i-E_i)^2/E_i],其中 O_i 和 E_i 是类别 i 中的概率质量。
但问题是我只有一个变量的经验累积分布。假设我有一个向量,我可以计算它的经验累积分布,我也有一个预测的累积分布。那么在R中,如何利用这两个累积概率计算卡方统计量呢?
例如,下面是我使用的代码,
require(VGAM)
X <- rpareto(100,1.5,2.5)
# Empricial distribution of X, P is the true probability
P <- ecdf(X)
#MLEs
scale <- min(X)
shape <- length(X)/sum(log(X/scale))
estimated_prob <- ppareto(X,scale,shape)
我首先模拟 100 个值分布的帕累托,然后计算 MLE,这样我就有了真实数据和预测分布。
【问题讨论】:
-
这看起来很有希望,谢谢。但问题是,我没有这样的两个变量,而是一个变量有两个概率分布。在这种情况下,如何做到这一点
-
您不想做 Kolmogorov-Smirnov 测试吗?如果是这样,请使用
stats包中的ks.test。也许 Cross-Validated 是解决这个问题的更好论坛? -
在 CrossValidated.com 上会出现重复:stats.stackexchange.com/questions/78168/… 卡方检验是为离散分布而设计的,而帕累托分布是连续的..
标签: r statistics distribution chi-squared