【问题标题】:sklearn SGDClassifier, results a label when no match available?sklearn SGDClassifier,当没有匹配时产生标签?
【发布时间】:2017-06-16 13:03:05
【问题描述】:

我正在使用 sklearn SGDClassifier 来预测我的数据集。 我有不应归类为任何标签/类别的文本,但我很惊讶,如果我将测试数据提供为“kjhd askdhajksdh asd askh”,它仍然被归类为给定类别之一。

我也处理过概率,但对于这个垃圾文本仍然有一个有价值的概率。

我的问题是,对于这种情况,分类器能否返回“未找到匹配项”等内容?

【问题讨论】:

    标签: python python-3.x scikit-learn classification


    【解决方案1】:

    没有。分类器将以最高概率将任何输入分类到训练中的标签之一,无论这些概率有多小。

    您可以使用decision_function 设置标签的阈值。 类似的东西:

    threshold = 0.25
    if confidence_score < threshold:
        print("No match found")
    

    【讨论】:

      猜你喜欢
      • 2013-06-08
      • 2012-07-23
      • 2017-04-02
      • 2014-08-06
      • 2014-12-08
      • 2014-08-28
      • 1970-01-01
      • 2021-01-16
      • 1970-01-01
      相关资源
      最近更新 更多