【发布时间】:2018-02-23 18:30:43
【问题描述】:
我知道 Precision 的概念以及 Recall 的概念。但我发现很难理解使任何 P-R 曲线成为可能的“阈值”的概念。
想象一下,我有一个模型要构建,该模型使用一些关于相关特征的体面分类算法来预测患者癌症的再次发生(是或否)。我将数据拆分用于训练和测试。假设我使用训练数据训练了模型,并使用测试数据获得了我的 Precision 和 Recall 指标。
但是我现在如何绘制 P-R 曲线?依据是什么?我只有两个值,一个精度和一个召回。我读到它的“阈值”可以让你获得几个精确召回对。但这个门槛是多少?我仍然是初学者,我无法理解阈值的概念。
我在很多分类模型比较中看到过,如下所示。但是他们是如何得到这么多对的呢?
【问题讨论】:
标签: machine-learning classification auc precision-recall model-comparison