【发布时间】:2015-01-09 05:15:34
【问题描述】:
我正在使用 ELKI 数据挖掘软件进行异常值检测。它有许多异常值检测技术,但都提供相同的结果(所有技术的异常值相同,唯一的区别在于点周围的圆圈大小,如下图所示)。我使用 ELKI 网站上提供的鼠标头数据集。在数据集中,所有点都标有其各自的集群名称,无论是来自 ear_left 或 ear_right 还是 head 或 noise。如果我将噪声标签更改为 ear_right,则它将异常点显示为 ear_right。我已将 10 个噪声标签中的 5 个更改为 ear_right。
这是在修改数据集和 ELKI 中使用 KNN 和 LDOF 异常值检测技术的结果:
是软件有问题还是我做错了什么?有人试过用它来检测异常值吗?是否有任何好的软件可以使用 LOF、LDOF、KNN 等不同算法执行异常值检测,或者我可以在哪里找到这些技术的算法源代码?
【问题讨论】:
标签: algorithm data-mining detection outliers elki