【问题标题】:Machine learning, classification type机器学习,分类类型
【发布时间】:2013-03-08 19:51:41
【问题描述】:

我正在为我的机器学习 (ML) 课程学习,但我有一个问题,我无法以我目前的知识找到答案。假设我有以下数据集,

att1 att2 att3 class
5    6    10   a
2    1    5    b
47   8    4    c
4    9    8    a
4    5    6    b

上面的数据集很清楚,我想我可以在训练我的数据集后对新传入的数据应用分类算法。由于每个实例都有一个标签,因此很容易理解每​​个实例都有一个带有标签的类。现在,我的问题是,如果我们有一个由不同实例(例如手势识别数据)组成的类会怎样。任何类都会有多个指定其类的实例。例如,

xcor ycord depth 
45   100   10
50   20    45
10   51    12

以上三个实例属于A类,下面三个实例属于B类作为一个组,我的意思是这三个数据实例一起构成了该类。对于手势数据,您的手的移动坐标。

xcor ycord depth 
45   100   10
50   20    45
10   51    12

现在,我希望将每个传入的三个实例分组为 A 还是 B?是否可以在不单独标记每个实例的情况下将所有这些标记为 A 或 B?例如,假设以下组属于 B,所以我希望所有实例一起标记为 B,而不是单独标记为 B,因为它们与 A 类或 B 类的独立相似性?如果可能,我们怎么称呼它?

xcor ycord depth 
45   10    10
5    20    87
10   51    44

【问题讨论】:

    标签: machine-learning classification gesture-recognition pattern-recognition


    【解决方案1】:

    我没有看到您可能希望将数据集中不确定数量的行分组为给定类的特征的情况。它们要么与一个类独立关联,要么都是特征,因此是唯一的行。比如:

    Instead of
    xcor ycord depth 
    45   10    10
    5    20    87
    10   51    44
    

    应该是这样的:

    xcor1 ycord1 depth1 xcor2 ycord2 depth2 xcor3 ycord3 depth3  
    45      10    10      5    20     87     10     51    44
    

    这与用于建模时间序列的方法几乎相同

    【讨论】:

    • 谢谢。我想学的就是这么简单。我刚开始为我的课学习,我只是好奇如果遇到这种问题,我该如何建模我的数据。我只是无法自己弄清楚。
    • @JohnDavid 没问题,我们都有这样的疑问。我只是不确定这是否是你想知道的。干杯!
    【解决方案2】:

    您似乎对不同类型的机器学习感到困惑。

    您班级中给出的数据集是 supervised 分类 算法的示例。也就是说,给定一些数据和一些类,学习一个分类器,该分类器可以预测新的、看不见的数据的类。您可以应用于此问题的分类器包括

    您描述的第二个问题是 unsupervised 分类 问题的示例。也就是说,给定一些没有标签的数据,我们希望找到一种自动方法来通过算法分离不同类型的数据(您的 A 和 B)。解决这个问题的算法包括

    我会考虑运行因子分析或规范化您的数据,然后运行 ​​K 均值或高斯混合模型。如果它们是可区分的,这应该会发现您的数据的 A 和 B 类型。

    【讨论】:

      【解决方案3】:

      看看neural networks for recognizing hand-written text的用法。您可以将手势视为带有额外时间组件的手写图形(因此,给每个像素一个“年龄”。)如果您的训练数据也包含类似的时间数据,那么我认为该技术应该很好地延续。

      【讨论】:

      • 例如,我们有一个在线手写文本识别数据集。可能它将包含每个笔划的数据坐标 (x, y)。因此,一组实例将被标记为 A,而其他一组实例将被标记为 B。因此,对于任意一组坐标,我们是否可以将所有输入坐标分类为 A 或 B 而无需将每个单个坐标标记为 A还是 B?如果你不理解我,别介意。也许,我仍然不知道我在说什么。
      猜你喜欢
      • 2020-05-04
      • 1970-01-01
      • 2023-04-04
      • 2021-04-14
      • 2011-10-04
      • 2020-06-28
      • 2017-09-28
      • 2012-03-14
      • 1970-01-01
      相关资源
      最近更新 更多