【问题标题】:Classification based on order of feature occurence基于特征出现顺序的分类
【发布时间】:2018-01-08 15:07:19
【问题描述】:

我有来自源的输入顺序。当输入匹配特定顺序时,它被分类到特定组中。基于此,我构建了我的培训文件,如下所示。

LABEL FEATURE1,FEATURE2,FEATURE3,FEATURE4
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,

我正在尝试使用决策树进行分类,但问题是在构建模型时没有考虑顺序。决策树是解决问题的正确方法吗,其中特征的顺序对于分类很重要,而不是每个特征的权重,还是有更好的算法/方法可用于解决这类问题。

【问题讨论】:

    标签: machine-learning decision-tree


    【解决方案1】:

    决策树对此很棒,但您选择的算法似乎在处理输入时没有考虑顺序。如果您使用的是预先打包的算法,您可能会发现编辑输入文件并使用其顺序标记每个特征更容易:将顺序视为特征值。例如,您的输入可能如下所示:

    CLASS_A 1 2 3 4 0 0
    CLASS_B 0 0 1 2 0 0
    CLASS_C 1 2 0 3 0 0
    CLASS_D 0 0 0 0 1 2
    

    这将允许您从多种训练算法中进行选择:决策树、朴素贝叶斯、SVM,甚至是 k-means 聚类。

    【讨论】:

      猜你喜欢
      • 2021-10-23
      • 2023-01-15
      • 2019-07-31
      • 1970-01-01
      • 2019-08-09
      • 2017-04-09
      • 2020-07-27
      • 2011-06-26
      • 1970-01-01
      相关资源
      最近更新 更多