【发布时间】:2017-09-04 06:24:04
【问题描述】:
我正在尝试获取一个新列,例如 duration_probablity,它获取值落在 6 到 12 小时之间的概率。 P(6 < Origin_Duration ≤ 12)
dput(df)
structure(list(CRD_NUM = c(1000120005478330, 1000130009109199,
1000140001635234, 1000140002374747, 1000140003618308, 1000140007236959,
1000140015078086, 1000140026268650, 1000140027281272, 1000148000012215
), Origin_Duration = c("10:48:38", "07:41:34", "11:16:41", "09:19:35",
"17:09:19", "08:59:05", "11:27:28", "12:17:41", "10:45:42", "12:19:05"
)), .Names = c("CRD_NUM", "Origin_Duration"), class = c("data.table",
"data.frame"), row.names = c(NA, -10L))
CRD_NUM Origin_Duration
1: 1000120005478330 10:48:38
2: 1000130009109199 07:41:34
3: 1000140001635234 11:16:41
4: 1000140002374747 09:19:35
5: 1000140003618308 17:09:19
6: 1000140007236959 08:59:05
7: 1000140015078086 11:27:28
8: 1000140026268650 12:17:41
9: 1000140027281272 10:45:42
10: 1000148000012215 12:19:05
我不确定如何在 R 中做到这一点。我正在尝试获得标准正态分布的累积分布函数。通勤者在某个车站停留时间在 6 到 12 小时之间的概率。 输出例如 0.96 持续时间 11:16:41
我的 CDF 类似于 - P(6 <X≤ 12) = Φ((12−μ)/σ)−Φ((6−μ)/σ)
【问题讨论】:
-
你有什么尝试吗?计算这些概率的方法是什么?预期的输出是什么?
-
@Sotos 我不确定如何在 R 中做到这一点。我正在尝试获取标准正态分布的累积分布函数。通勤者在某个车站停留时间在 6 到 12 小时之间的概率。输出例如 0.96 持续时间 11:16:41
-
那么什么是 CDF 公式?它是如何定义的?你期望最终的结果是什么?您需要明确并提供尽可能多的信息
-
@Sotos
P(6 <X≤ 12) = Φ((12−μ)/σ)−Φ((6−μ)/σ) -
请参阅
pnorm,但您的公式中缺少一些内容:数据与分布参数之间的联系。
标签: r normal-distribution