【问题标题】:Goodness of fit through Kolmogorov–Smirnov test using R Language [closed]使用 R 语言通过 Kolmogorov–Smirnov 检验的拟合优度 [关闭]
【发布时间】:2014-06-21 21:22:25
【问题描述】:

拟合优度检验允许我们测试变量的经验分布(此处为城市规模)是否遵循已知的理论分布(此处为帕累托分布)。

此检验的原假设是假设分布是可接受的,而备择假设是数据不遵循此分布。

我想用 R 语言对此进行编程。我想做蒙特卡洛模拟来检查我的数据的拟合优度,其中包括美国城市规模。

我在这里的经验分布是美国城市规模的分布。我想测试我的数据是否符合帕累托分布。在上面给定的图像中,定义了所有函数来计算 P.value。我知道有一个包名为"dgof",运行Kolmogorov-Smirnow 测试的命令是ks.test(x, y,alternative = c("two.sided", "less", "greater")),但我不知道如何将其应用于上述情况。

data<-read.csv("C:/Users/Shah/Desktop/US data 452 cities 2000.csv") 
attach(data) 
y<-Population 
require(dgof) 
x<-rlnorm(100,5,1) 
ks.test(x, y,alternative = c("two.sided", "less", "greater"), 
   exact = NULL, tol=1e-8, simulate.p.value=TRUE, B=1000)

【问题讨论】:

  • 一些评论:首先,我相信您的问题与 StackOverflow 无关,可能更适合 Cross Validated。其次,在问之前,你应该做一些研究; R 是一款很棒的软件,但使用它需要付出一些努力;我建议你找一个好的 R 教程(我个人推荐:Quick-R)。
  • 第三:提问前可以google一些答案。两个推荐读物:Fitting distributions with R和前面提到的Quick R tutorial...和this other article
  • 感谢您的回复.. 我已经在 stackflow 上搜索过了。但是这个问题还没有在stackflow上讨论过。如果你能帮忙,请。 .
  • 这个问题似乎是题外话,因为它是关于统计的,也许应该迁移到 stats.stackexchange.com 。此外,它没有显示在提出问题之前努力寻找解决方案的证据。
  • StackOverflow 不是唯一的信息来源...特别是在 R 上,还有许多其他地方可以找到解决方案,特别是如果您是新手。检查我在 cmets 中提供的链接。此外,与统计相关的问题可能更适合 stats.stackexchange.com ,并且那里可能已经有了一些答案。

标签: r


【解决方案1】:

首先,了解ks.test() 函数的工作原理。 Read the reference for ks.test().

因此,假设您将数据加载到名为 datadata.frame,并且您想要对名为 population 的列执行 KS 测试,并且您想要测试您的数据是否适合帕累托分布。请注意,actuar 包包含两参数帕累托分布。当然,你需要估计这些参数的值(我把它留给你)。

现在,只需这样做:

library(actuar)
library(stats)
ks.test(data$population, 'ppareto', shape=yourShapeEstimate, scale=yourScaleEstimate)

【讨论】:

  • 单样本 Kolmogorov-Smirnov 检验数据:data$population D = 0.8335,p-value
  • 虽然我认为之前关于您的问题的一些 cmets 有点苛刻,但关于结果的问题可能确实属于 stats.stackexchange.com。
  • 是的,答案很苛刻,我认为如果人们不想提供帮助,那么他们就没有任何权利羞辱提出问题的人。我的帖子已在 stats.stackexchange.com 上转移,但我收到了相同类型的无用 cmets。
  • 考虑使用替代的拟合优度检验...卡方检验也是一个很好的检验。并考虑到这一点:“对于这个检验 (KS) 和 Anderson-Darling 检验 [...],只有当零假设完全指定模型时,临界值才是正确的。当数据集用于估计参数时零假设分布 [...] 正确的临界值更小”(Klugman, S. “损失模型”)
  • 我建议您不要得出任何预期的结论:进行完整的统计分析:制作直方图并将其与某些分布进行比较。阅读有关该主题的一些文本。我向您推荐 Stuart Klugman et al 的上述“损失模型”。另外,检查参数的估计值。我的回答可能很苛刻,但这并不会使他们错。如果您正在尝试解决问题(在统计或任何其他领域),您需要努力工作。进行探索性分析并得出自己的结论。
猜你喜欢
  • 2021-01-14
  • 1970-01-01
  • 1970-01-01
  • 2014-12-30
  • 2015-03-25
  • 2020-08-02
  • 2014-09-21
  • 1970-01-01
  • 2021-06-18
相关资源
最近更新 更多