【问题标题】:Which class to predict for imbalanced data?哪个类预测不平衡数据?
【发布时间】:2018-11-24 20:09:43
【问题描述】:

对于具有不平衡类的机器学习二元分类问题,将哪个类视为正类是否重要?因此,如果 A 类是多数类,按照惯例,我要预测它还是少数类(B 类)?这还重要吗?

【问题讨论】:

    标签: machine-learning binary classification prediction


    【解决方案1】:

    其实没关系,但这取决于你的根本问题。例如,如果您想对医学测试进行分类,其中阳性对应于“存在疾病”,并且我们假设阳性样本是少数,您可能想要预测一个人生病/属于少数的概率有多高.

    【讨论】:

    • 感谢您的回复!如果没有明确的是或否的情况(例如,疾病存在/不存在,打/错过一枪,健康/不健康)怎么办。我不一定有一个例子,但是如果没有那种层次结构或结构,只有 A 组和 B 组——那么你倾向于选择多数派吗?
    • 如果您只有 A 组和 B 组,这完全取决于您。一般来说,少数类更难预测,因此更有趣。我建议您阅读 He 等人的论文“从不平衡数据中学习”。 (2009),它对这个主题提供了很好的见解。
    猜你喜欢
    • 2018-12-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-02-14
    • 1970-01-01
    • 2017-11-23
    • 2019-01-25
    相关资源
    最近更新 更多