【问题标题】:Find probability of skewed distribution找出偏态分布的概率
【发布时间】:2017-11-03 07:21:24
【问题描述】:
我有一个变量 X,下面给出了摘要。从分布来看,它似乎是偏态的正态分布。我想知道如何找到与 R 中变量 X 的每个值相关联的 p 值?
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.5 318.3 399.9 367.1 447.4 500.0
【问题讨论】:
标签:
r
statistics
distribution
skew
【解决方案1】:
根据您的情节判断,我假设您有一些称为averageRank 的数字序列,您尝试使用density.default() 拟合核密度估计器。
基本上你有一个概率密度函数的估计值(density.default() 的输出)。你的问题是:
我想知道如何找到与 R 中变量 X 的每个值相关联的 p 值?
这是density.default() 间接给你的,除了 512 个等距点,而不是连续的。对于特定值x,您可以找到density.default() 和相应的y 输出的最接近的值:
# Create some random data:
set.seed(123)
averageRank <- rnorm(100, mean = 300, sd = 75)
x <- 250
kde <- density.default(averageRank)
closeness <- abs(kde$x - x)
kde$y[which(closeness == min(closeness))]
# [1] 0.004370022 # is P(X = 250)
但是,从您提出问题的方式来看,我感觉您正在寻找累积分布函数:
sum(kde$y[1:which(closeness == min(closeness))]/sum(kde$y)
# [1] 0.2138626 # is P(X < 250)