【发布时间】:2016-05-10 17:09:55
【问题描述】:
我有一个时间序列数据,对应的变量在某个范围内从先前的值增加或减少,例如 +- 10%。时间序列中的某些数据点与时间序列中的先前或以后的值不相符。
例如:
time v1
13:01:30 0.689
13:01:31 0.697
13:01:32 0.701
13:01:33 0.713
**13:01:34 0.235**
13:01:35 0.799
13:01:36 0.813
13:01:37 0.822
**13:01:38 0**
13:01:39 0.865
13:01:40 0.869
是否有任何库可以帮助识别 R 中的这些异常值[数据中的 0.235 和 0]?
更新 - dput 的输出:
structure(list(time = c("13:01:30", "13:01:31", "13:01:32", "13:01:33",
"13:01:34", "13:01:35", "13:01:36", "13:01:37", "13:01:38", "13:01:39",
"13:01:40"), v1 = c(0.689, 0.697, 0.701, 0.713, 0.235, 0.799,
0.813, 0.822, 0, 0.865, 0.869)), .Names = c("time", "v1"), row.names = c(NA,
11L), class = c("tbl_df", "tbl", "data.frame"))
【问题讨论】:
-
@akrun - 不可否认,一组数据的异常值与本地化异常值不同。对于这个简化的示例,它们将给出相同的结果,但是在
lm拟合上检查residuals甚至可能是值得的,或者diff比较... -
@thelatemail 我重新打开了帖子
标签: r time-series outliers