【发布时间】:2021-01-27 07:09:54
【问题描述】:
我有一个带有地理坐标的空气质量传感器测量值列表,我想实施异常值检测。传感器列表相对较小(约 50 个)。
空气质量可以随着距离逐渐变化,但突然的局部峰值可能是异常值。如果靠近位置的传感器组中的一个传感器显示更高的值,则它可能是异常值。如果更远的传感器显示相同的更高值,则可能没问题。
当然,我可以忽略坐标并假设正态分布进行简单的异常值检测,但我希望做一些更复杂的事情。对此进行建模并实施异常值检测的好的统计方法是什么?
【问题讨论】:
-
另一个简单的选择是将每个坐标的空气质量估计为 k 个(例如 k=3)最近传感器的中值。另外,也许试试stats.stackexchange
标签: statistics spatial outliers unsupervised-learning