【发布时间】:2015-03-20 13:54:18
【问题描述】:
我正在尝试使用 R 中的“密度”函数找到具有未知分布的连续数据的最佳 PDF。现在,给定一个新数据点,我想根据以下公式找到该数据点的概率密度我从“密度”函数结果中得到的核密度估计器。 我该怎么做?
【问题讨论】:
-
@whuber;您可能会提醒提问者 密度 不是概率。 (当我第一次阅读你的答案时,我以为你会说答案是微不足道的,因为任何时候的概率都是(微不足道的)零。)
-
这是离散分布吗?对于连续分布,观察到任何特定值的概率为 0。不确定为什么将其迁移到此处。似乎挂断仍在统计理解上,而不是编程。
-
@whuber 你是说显而易见的理论答案是 0 吗?这如何使它成为一个编程问题。
-
@MrFlick 理解 OP 的“概率”实际上是指“概率密度”,显而易见的理论答案是该点的核密度估计值——而不是零。问题是关于在
R中计算内核密度估计:这就是使它成为编程问题的原因。这也不是一个完全微不足道的编程问题(尽管它确实有一个非常简单的解决方案),因为R将其 KDE 作为一个等距值的数组返回,因此需要额外的东西来获得任意值的值论据。 -
@MrFlick
R默认返回的内容不能回答有关“在新数据点”查找 KDE 的问题。 (我已经咨询了density的帮助页面以确认这一点。)需要一些编程:要么让R以任意参数提供KDE,要么插值的方式(也许extrapolate) 来自density返回的数组。 (“编程”可能相当于将可选的n、from和to参数设置为合适的值。)
标签: r probability