【发布时间】:2012-07-05 09:59:33
【问题描述】:
我有一个 2 类数据集,我应该在其上应用二进制分类算法。数据集如下所示:
a1、a2、a3、……+1
......
b1, b2, b3, .......-1
.......
其中每个特征/属性值都是一个 2 元组。例如,a1 是 (a1_1, a1_2)。 a1_1 和 a1_2 之间存在依赖关系(尽管此时我不确定它们是如何相关的)并且它们的顺序并不重要。类似的情况也适用于负类实例。
我正在寻找对这些实例进行分类的方法。请让我知道是否存在这样的算法。
首先,我尝试拆分元组 - a1_1 和 a1_2 为一个实例形成两个单独的列,导致每个实例的特征值数量增加一倍 - 并使用了 LIBSVM (C/C++) 库,但结果不是好的。我认为拆分元组并因此寻找合适的方法是没有意义的。
【问题讨论】:
标签: algorithm dataset machine-learning classification