不同组大小的精确率和召回率计算答案

【问题标题】：Precision and Recall computation for different group sizes不同组大小的精确率和召回率计算
【发布时间】：2016-03-26 08:17:39
【问题描述】：

我在任何地方都找不到这个问题的答案，所以我希望这里的人可以帮助我以及其他有同样问题的人。

假设我有 1000 个正样本和 1500 个负样本。

现在，假设有 950 个真阳性（正确分类为阳性的阳性样本）和 100 个假阳性（负样本被错误地归类为正样本）。

我应该使用这些原始数字来计算精度，还是应该考虑不同的组大小？

换句话说，我的精度应该是：

TruePositive / (TruePositive + FalsePositive) = 950 / (950 + 100) = 90.476%

或应该是：

(TruePositive / 1000) / [(TruePositive / 1000) + (FalsePositive / 1500)] = 0.95 / (0.95 + 0.067) = 93.44%

在第一次计算中，我不考虑每组中的样本数量，取原始数字，而在第二次计算中，我使用每个度量与其对应组的比例，以消除由组的大小不同

【问题讨论】：

【解决方案1】：

回答上述问题：definition，精度由第一个公式计算：TP/(TP+FP)。

但是，这并不意味着您必须使用这个公式，即精确测量。还有许多其他措施，请查看this wiki page 上的表格并选择最适合您任务的一项。

例如，positive likelihood ratio 似乎与您的第二个公式最相似。

【讨论】：