基于特征出现顺序的分类答案

【问题标题】：Classification based on order of feature occurence基于特征出现顺序的分类
【发布时间】：2018-01-08 15:07:19
【问题描述】：

我有来自源的输入顺序。当输入匹配特定顺序时，它被分类到特定组中。基于此，我构建了我的培训文件，如下所示。

LABEL FEATURE1,FEATURE2,FEATURE3,FEATURE4
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_B INPUT_C,INPUT_D,,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_C INPUT_A,INPUT_B,INPUT_D,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,
CLASS_D INPUT_E,INPUT_F,,

我正在尝试使用决策树进行分类，但问题是在构建模型时没有考虑顺序。决策树是解决问题的正确方法吗，其中特征的顺序对于分类很重要，而不是每个特征的权重，还是有更好的算法/方法可用于解决这类问题。

【问题讨论】：

标签： machine-learning decision-tree

【解决方案1】：

决策树对此很棒，但您选择的算法似乎在处理输入时没有考虑顺序。如果您使用的是预先打包的算法，您可能会发现编辑输入文件并使用其顺序标记每个特征更容易：将顺序视为特征值。例如，您的输入可能如下所示：

CLASS_A 1 2 3 4 0 0
CLASS_B 0 0 1 2 0 0
CLASS_C 1 2 0 3 0 0
CLASS_D 0 0 0 0 1 2

这将允许您从多种训练算法中进行选择：决策树、朴素贝叶斯、SVM，甚至是 k-means 聚类。

【讨论】：