【问题标题】:Find probability of skewed distribution找出偏态分布的概率
【发布时间】:2017-11-03 07:21:24
【问题描述】:

我有一个变量 X,下面给出了摘要。从分布来看,它似乎是偏态的正态分布。我想知道如何找到与 R 中变量 X 的每个值相关联的 p 值?

Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
1.5   318.3   399.9   367.1   447.4   500.0 

【问题讨论】:

  • 这听起来更像是一个统计问题而不是编程问题,所以在stats.stackexchange.com 上会更好。但这个问题也很不清楚,我无法理解你所要求的 p 值应该代表什么。

标签: r statistics distribution skew


【解决方案1】:

根据您的情节判断,我假设您有一些称为averageRank 的数字序列,您尝试使用density.default() 拟合核密度估计器。

基本上你有一个概率密度函数的估计值(density.default() 的输出)。你的问题是:

我想知道如何找到与 R 中变量 X 的每个值相关联的 p 值?

这是density.default() 间接给你的,除了 512 个等距点,而不是连续的。对于特定值x,您可以找到density.default() 和相应的y 输出的最接近的值:

# Create some random data:
set.seed(123)
averageRank <- rnorm(100, mean = 300, sd = 75)
x           <- 250

kde       <- density.default(averageRank)
closeness <- abs(kde$x - x)
kde$y[which(closeness == min(closeness))]
# [1] 0.004370022    # is P(X = 250) 

但是,从您提出问题的方式来看,我感觉您正在寻找累积分布函数:

sum(kde$y[1:which(closeness == min(closeness))]/sum(kde$y)
# [1] 0.2138626     # is P(X < 250)

【讨论】:

    猜你喜欢
    • 2018-05-17
    • 2014-01-28
    • 2018-12-23
    • 1970-01-01
    • 2014-09-11
    • 1970-01-01
    • 2020-09-20
    • 2021-12-21
    相关资源
    最近更新 更多