【发布时间】:2021-05-06 22:24:12
【问题描述】:
我正在阅读一篇关于差异的论文,并遇到了以下短语:
“我们使用深度一元特征来计算立体 通过形成成本量来匹配成本。”
我在文献中查找了“一元特征”和“成本量”的定义,但很难找到任何东西。有人可以澄清这些术语在计算机视觉背景下的含义吗?
【问题讨论】:
标签: python machine-learning computer-vision feature-extraction vision
我正在阅读一篇关于差异的论文,并遇到了以下短语:
“我们使用深度一元特征来计算立体 通过形成成本量来匹配成本。”
我在文献中查找了“一元特征”和“成本量”的定义,但很难找到任何东西。有人可以澄清这些术语在计算机视觉背景下的含义吗?
【问题讨论】:
标签: python machine-learning computer-vision feature-extraction vision
对于单个 2D 补丁 (wxwx1),如果您要在另一张图像中寻找其最相似的兄弟,则每个像素都是候选像素,因此如果您将它们的相似度写在另一张图像中,它将是一个 2D 图像相似之处。您可以将其称为相似面或成本面(如果您将距离放入其中)。
在论文中,我似乎无法正确访问(我确实看到了它的存档 HTML 版本),对于 WxH 图像,它们存储了一个图像中一个特征之间的成本或距离,所有它周围的窗口中的像素。由于我们有 WxH 像素,并且窗口是 DXxDY,那么整个数组就是 WxHxDXxDY 的成本。所以它是 4D,但他们通过类比将其称为“成本体积”。
您还可以找到立体成本量,对于 WxH 图像和 D 种可能的深度或差异,我们可以构建 WxHxD 成本量。如果您要找到每个像素的最小成本,则不需要完整的体积,但如果您还将像素一起考虑(两个相邻像素可能具有相同的深度),那么您会查看完整的成本体积,而不仅仅是小体积切片。
【讨论】: