【发布时间】:2022-01-16 09:23:00
【问题描述】:
f1 分数真的取决于哪个类被给予正面标签吗?
当我使用 scikit learn 的 f1 指标时,似乎:
>>> from sklearn import metrics as m
>>> m.f1_score([0,0,0,1,1,1],[0,0,0,1,1,0])
0.8
>>> m.f1_score([1,1,1,0,0,0],[1,1,1,0,0,1])
0.8571428571428571
第一种和第二种情况的唯一区别是 0 和 1 交换了。但我得到了不同的答案。
这看起来很糟糕。这意味着,如果我报告猫/狗分类器的 f1 分数,则该值取决于猫或狗是否获得正面标签。
这是真的吗,还是我搞砸了?
【问题讨论】:
-
为什么这个问题有 2 票作为“需要细节或明确性”结束?问题很明确,还加了一个minimal reproducible example...
-
可能是因为这个问题在审稿人的头脑中并不清楚。我不确定,也许 stackoverflow 的评分正在鼓励人们结束问题。我认为有些人看到票数接近并投票立即关闭。不止一次发生这种情况,在我写答案时,问题已关闭。
-
在这种情况下,该问题将得到因任何原因弄错的人的近距离投票,以及受到影响的人的第二次投票。
标签: python machine-learning scikit-learn