【发布时间】:2017-06-16 13:03:05
【问题描述】:
我正在使用 sklearn SGDClassifier 来预测我的数据集。 我有不应归类为任何标签/类别的文本,但我很惊讶,如果我将测试数据提供为“kjhd askdhajksdh asd askh”,它仍然被归类为给定类别之一。
我也处理过概率,但对于这个垃圾文本仍然有一个有价值的概率。
我的问题是,对于这种情况,分类器能否返回“未找到匹配项”等内容?
【问题讨论】:
标签: python python-3.x scikit-learn classification