【问题标题】:how can i classify attributes themselves instead the values我如何分类属性本身而不是值
【发布时间】:2016-05-10 02:57:37
【问题描述】:

我有一个数据集,我需要根据属性本身而不是值对这个数据集进行分类。

描述情况的

图片

【问题讨论】:

    标签: machine-learning artificial-intelligence supervised-learning unsupervised-learning


    【解决方案1】:

    您可以创建一个元类,它使用类的属性作为其值,并以此为基础进行分类。

    例如,使用你的两个类:

         MetaClass
    Name    | Attributes
    -------------------------------------
    class 1 | temperature, humidite, vent
    class 2 | nom, prenom, age
    

    或者其他方式:

         MetaClass
    Name    | Temperature | Humidite | Vent  |  Nom  | Prenom | Age
    ------------------------------------------------------------------
    class 1 | True        | True     | True  | False | False  | False
    class 2 | False       | False    | False | True  | True   | True
    

    制作这个元类的细节当然取决于你的实现。

    【讨论】:

    • 非常感谢您的回答。但是我需要一个科学的方法,比如在数据挖掘中有很多聚类和分类的算法。不幸的是,该算法仅适用于属性值,而不适用于属性本身。如果我理解你我做一个元类然后我把它分类吗?请给我你的意见
    • 是的,这就是我会尝试的。根据您编写它的方式,您还可以将类的属性包含为每一行的另一个属性,而不是仅在元类上构建分类器。当然,这可能没有意义,因为您混合了类级别和值级别属性 - 就像我说的那样,细节将取决于您的具体实现。
    • 根据您的建议,我认为我应该使用监督分类。但问题是如何混合类级别和值级别属性?例如,我会说温度 (24,12,23,10) --> class1..... 然后 humidité (23, 23,10,11) -->class1...... 和相同对于其他属性。之后,我如何对包含这两个数据的新注册进行分类,例如 (23,12,10, John, Pharel, 34) 我需要将 (23,12,10) 添加到 class1 和 (John, Pharel, 10) ) 到第 2 类。请帮我用这个例子做这个分类,非常感谢
    • 我不确定我是否理解。您是说您在同一数据中连接了温度和名称,并且想将一部分分类为 1 类,将另一部分分类为 2 类?我不确定你会怎么做。我想说的是,如果你有第 2 类的列 (Nom, Prenom, Age) 也许你可以附加伪值,这样你的数据线看起来像 (John, Pharel , 34, Nom, Prenom, Age)。
    • 看朋友。我说我想要根据主题进行分类。我想对列进行分类(温度、湿度、通风)-> 天气。 (nom, prenom, age) --> 人。我认为我应该使用数据挖掘技术。监督分类或非监督分类。我认为使用监督分类。在这种情况下,例如,我应该定义一个类,例如:温度(24,12,23,10)-> class1..... 然后是湿气(23,23,10,11)->class1, Nom (Aladin, Rfael, Jack, Mrck) -->class2.
    猜你喜欢
    • 2015-11-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-10-05
    • 2014-10-21
    • 2023-02-16
    • 1970-01-01
    相关资源
    最近更新 更多