一元特征和成本量（计算机视觉）答案

【问题标题】：Unary Features and Cost Volume (Computer Vision)一元特征和成本量（计算机视觉）
【发布时间】：2021-05-06 22:24:12
【问题描述】：

我正在阅读一篇关于差异的论文，并遇到了以下短语：

“我们使用深度一元特征来计算立体通过形成成本量来匹配成本。”

我在文献中查找了“一元特征”和“成本量”的定义，但很难找到任何东西。有人可以澄清这些术语在计算机视觉背景下的含义吗？

【问题讨论】：

标签： python machine-learning computer-vision feature-extraction vision

【解决方案1】：

对于单个 2D 补丁 (wxwx1)，如果您要在另一张图像中寻找其最相似的兄弟，则每个像素都是候选像素，因此如果您将它们的相似度写在另一张图像中，它将是一个 2D 图像相似之处。您可以将其称为相似面或成本面（如果您将距离放入其中）。

在论文中，我似乎无法正确访问（我确实看到了它的存档 HTML 版本），对于 WxH 图像，它们存储了一个图像中一个特征之间的成本或距离，所有它周围的窗口中的像素。由于我们有 WxH 像素，并且窗口是 DXxDY，那么整个数组就是 WxHxDXxDY 的成本。所以它是 4D，但他们通过类比将其称为“成本体积”。

您还可以找到立体成本量，对于 WxH 图像和 D 种可能的深度或差异，我们可以构建 WxHxD 成本量。如果您要找到每个像素的最小成本，则不需要完整的体积，但如果您还将像素一起考虑（两个相邻像素可能具有相同的深度），那么您会查看完整的成本体积，而不仅仅是小体积切片。

【讨论】：

你好，你的解释可能很好，但我还是不明白，可能你可以添加一些架构或图片，或者如果你制作一个关于它的视频，那就太好了:)