【发布时间】:2016-05-28 02:09:15
【问题描述】:
基本上,我正在使用 python sk-learn 库中的一些数据挖掘算法进行分类。
但是,我得到了一些非常不平衡的结果,例如,大约 0.99 召回率和低于 0.1 准确率。
从概念上讲,分类算法依赖于一些“阈值”来做出决定,这意味着我应该能够通过调整这个“阈值”来平衡准确率和召回率。
但是,我在 sklearn 中找不到一些 API 来帮助解决这个问题,所以我的问题是:如何操纵 sklearn 库中的底层“阈值”来平衡精度和召回率?
【问题讨论】:
-
我不知道
sklearn有这种阈值,但是在开始搜索之前,您能告诉我您的数据是否不平衡?我只是想确保您没有完全不平衡的东西,例如分类中的比例90:1(例如,对于 A 类中的每 90 个样本,只有 1 个属于 B) -
@Guiem 谢谢,我有 50:50 的样本。
标签: python machine-learning scikit-learn classification