【问题标题】:Using ELKI MiniGUI for anomaly detection with training set and test set使用 ELKI MiniGUI 进行带有训练集和测试集的异常检测
【发布时间】:2015-04-21 02:01:11
【问题描述】:

我有:

  1. 一个文件training.arff,它只包含正常行为的样本。

  2. 一个文件test.arff,其中包含正常和异常行为的样本。

我想使用 ELKI MiniGUI 通过半监督学习进行异常检测。

我相信通常我应该使用training.arff 构建/训练模型,然后将模型应用于test.arff

我使用哪种算法并不重要。

我似乎无法在 ELKI MiniGUI 中找到将这两个文件放在哪里,所以我会得到我想要的结果。 (只有dbc.in

*PS:尝试使用 weka 一周后我放弃了,但我不限于 ELKI。

谢谢!!

【问题讨论】:

    标签: machine-learning weka supervised-learning unsupervised-learning elki


    【解决方案1】:

    您的场景是一种监督学习方法。

    ELKI 目前只包括无监督异常值检测方法,不利用“仅正常”训练数据的先验信息。

    您可以将训练和测试文件连接到一个文件中,然后运行异常值检测。该领域中大多数已发布的算法都是无监督的。在无监督学习中,没有训练数据集——只有一种数据。

    请注意,截至 2014 年,ELKI 中可用的大多数算法都是为数值数据设计的。如果您的数据是分类数据,您将能够使用其中的许多数据,但您需要实现适合您的数据类型的数据类型和距离函数。有一些解析器和距离可用于非数字数据(例如文本数据),但 ARFF 解析器不支持,目前也没有混合数据的距离函数。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-11-01
      • 2013-06-18
      • 2011-12-16
      • 2018-06-03
      • 2015-01-17
      • 2019-08-15
      • 2016-02-27
      • 1970-01-01
      相关资源
      最近更新 更多