【发布时间】:2015-06-28 15:37:26
【问题描述】:
假设我在 Python 中有一个训练有素的 SVM 分类器,其标志为“Probability=True”:
classifier = SVC(C = 1000000, gamma = 10, probability=True)
classifier.fit(my_data, the_labels)
当我对新数据进行分类时,我只想保留概率高于阈值的分类新数据,比如 0.90。我怎样才能做到这一点?直到现在我正在做这样的事情,但我被卡住了:
labels_predicted = classifier.predict(new_data)
probabilities = classifier.predict_proba(new_data)
第一个命令返回实际标签,第二个命令返回其标签的概率。因此,对于每个数据点,我都有它的最大似然标签以及属于所有标签的所有相关概率。但最大似然标签可能是 0.4,我不想要它。如何仅保留具有特定阈值的标签?
【问题讨论】:
标签: python classification