【问题标题】:What classifier with Weka?Weka 的分类器是什么?
【发布时间】:2015-05-09 21:52:31
【问题描述】:

我正在寻找一个带有 Weka 的分类器来解决这个问题:
实例是实数(或非实数)的三元组(或更多):x y 和 z。
我只知道阳性实例(所以我可以训练)。

示例:

3.524, -4.529875, 3.6295626
2.7670588, -3.4611764, 6.03
3.878375, -4.47225, 4.6831875
4.6477776, -4.3755555, 3.6093333
3.8646667, -4.043389, 3.3882778

所以,现在我想创建一个分类器。如果是或否(以百分比表示)一个新实例在这个“同一个家庭”中,它可以告诉我。
提前感谢您的回答。

【问题讨论】:

    标签: classification weka


    【解决方案1】:

    进行有监督二元分类的最佳方法是使用来自两个类的数据来训练分类器。虽然有报告只对正数据训练分类器,但我的经验并不那么好。这两个类的人工标记数据与未标记数据池中负类数据的自动标记过程之间存在巨大差异。

    可以在herehere 找到这些方法。但是这些方法有局限性,我的建议是由专家标记合理数量的负面数据实例。如果这变得太昂贵,那么您可以从小的负数据开始,应用半监督学习来增加负数据或使用 SMOTE 综合地增加负数据。但是这些也有其自身的局限性。

    【讨论】:

    • 再次感谢 Rushdi,假设我的负面实例与正面实例一样多。不幸的是,这些负面数据差异太大,无法拥有一个好的分类器。我可以说一个新实例吗? : 好的,如果你是阳性的,那很好(概率超过 0.5),但如果你不是 -> 没有其他测试的阴性。总而言之,我只想使用积极的概率。
    • 是的,如果负实例的特征值与正值相同,那么它是可行的。如果正面和负面数据的性质不同,那么这是一个质量问题。但从数量上看,这是非常可行的。
    猜你喜欢
    • 1970-01-01
    • 2014-12-31
    • 2023-04-08
    • 2015-02-11
    • 1970-01-01
    • 2014-02-16
    • 2014-05-07
    • 2013-01-29
    • 2013-09-22
    相关资源
    最近更新 更多