【发布时间】:2019-01-24 15:50:03
【问题描述】:
我的 FCN 被训练来检测 10 个不同的类别,并产生500x500x10 的输出,每个最终维度都是不同类别的预测概率。
通常,我看到使用统一阈值(例如0.5)来二值化概率矩阵。然而,在我的情况下,这并没有完全削减它,因为当阈值为0.3 时,某些类的 IoU 会增加,而对于其他类,它是0.8。
因此,我不必为每个类别任意选择阈值,而是使用概率更高的方法来最终确定阈值。我曾想过使用 CRF,但这也需要已经完成阈值处理。关于如何进行的任何想法?
示例:考虑一张有 5 种不同鸟类的森林图像。现在我试图输出一个分割了森林和五只鸟的图像,6 个类别,每个类别都有一个单独的标签。网络输出 6 个混淆矩阵,指示像素属于特定类别的置信度。现在,像素的正确答案并不总是具有最高置信度值的类别。因此,一刀切的方法或最大值方法将不起作用。
【问题讨论】:
-
您是否正在寻找 "Otsu Thresholding",您可以在其中计算分离两个类的最佳阈值,以使它们的组合分布(类内方差)最小... en.wikipedia.org/wiki/Otsu%27s_method
-
有 10 个不同的类,但最终输出的通道数是 3(
500X500是height X width)。假设每个频道代表每个班级,那不是500X500X10吗? -
是的,你是对的,我修好了。
标签: image-processing machine-learning neural-network computer-vision