【发布时间】:2012-09-14 02:53:55
【问题描述】:
假设我正在使用“A”和“B”两种方法评估某个文本分类研究项目。使用方法“A”时,精度提高了 x%,而使用“B”时,召回率提高了 x%。我怎样才能说 A 或 B 方法更好?
【问题讨论】:
标签: machine-learning classification document-classification precision-recall
假设我正在使用“A”和“B”两种方法评估某个文本分类研究项目。使用方法“A”时,精度提高了 x%,而使用“B”时,召回率提高了 x%。我怎样才能说 A 或 B 方法更好?
【问题讨论】:
标签: machine-learning classification document-classification precision-recall
这取决于你的目标。如果您需要前几个返回的类是正确的,那么您应该追求精确度,如果您想专注于返回所有相关的类,那么请尝试增加召回率。
如果精度和召回率对您来说都很重要,那么一个常用的衡量标准是F1 score,它将精度和召回率组合成一个衡量标准。
【讨论】:
我完全同意@Sicco 写的内容。
另外,我建议观看 this video,它来自 Coursera 的机器学习课程。来自视频:在某些情况下,您可以通过更改阈值来控制精度和召回率。如果您不确定什么对您更重要,请坚持 F1。
【讨论】: