【发布时间】:2020-04-12 23:44:04
【问题描述】:
在 OpenCV 或对象检测模型中,它们将边界框表示为 4 个数字,例如x,y,宽度,高度或 x1,y1,x2,y2。
这些数字似乎定义不明确,但分辨率很大时没问题。 但这让我想到图像的分辨率非常低,例如8x8,一个像素的错误可能会导致事情变得非常错误。
所以我想知道,当您说边界框具有 x1=0、x2=100 时,究竟是什么意思?
具体来说,我想在理解好的情况下消除这些困惑:
- 边界框的边界是占据第 0 个像素还是围绕第 0 个像素(其边界在 x=-1)?
- 边界框的确切末端在哪里?如果图像的 shape=(8,8),结束是在 7 还是 8?
- 如果要表示占据整个图像的边界框,它的值应该是多少?
所以我认为正确的问题应该是,我如何直观地考虑边界框,这样我就不会感到困惑?
【问题讨论】:
标签: opencv deep-learning object-detection bounding-box yolo