SSPCV-Net(语义立体匹配网络)
目的:进一步捕捉视差的细节
主要模块:
数据集:Scene Flow, KITTI 2012, KITTI 2015, Cityscape(比较泛化能力)
-------------------------------------------------------------------------------------------------------
Concate volume(PSMNet) / correlation volume(DispNet)
特点:在单级别构建cost volume,而不考虑分别位于立体图像对下面的多尺度空间信息
Tip: PSMNNet是提取多级图像信息来构建一个single cost volume (匹配代价卷)
问题:对于所考虑的特征图,单级cost volume,可能不足以捕获立体图像之间的空间关系
多级指空间信息级的多个cost volume
-------------------------------------------------------------------------------------------------------
Q:为什么加入语义信息?
语义分割不同的对象和他们在图像中的边界,显示出视差图很多空间和强度相关性,一个准确的语义分割可以帮助沿对象边界矫正视差值,立体匹配中这些差异很容易出错
SegStereo也有合并语义信息,本文的结构将语义和图像特征融合得到cost volume
Multi-level cost volumes + 3D multi-cost aggregation:更好的为视差估计捕捉全局上下问信息
-------------------------------------------------------------------------------------------------------
Network architecture
利用ResNet-50和扩展卷积来从立体图像对中提取特征,适应性平均池化将特征压缩到3个规模,1*1卷积来改变特征图的维度,金字塔特征同时送入两个子网络处理。产生空间金字塔代价卷和语义代价卷。结合两个代价卷共同组成金字塔代价卷,送入3D聚合模块来聚合和正则化,优化代价量,回归层产生最终的视差图。
-------------------------------------------------------------------------------------------------------
Pyramid cost volumes
空间特征的分层规模组成了不同级的cost volume,对每个级的空间特征图,在每个视差级别上级联左右图的特征组成代价卷,打包到一个4D卷,为推断这个级别的视差包含了所有的空间上下文信息。
-------------------------------------------------------------------------------------------------------
Semantic cost volume
结构像PSPNet,结果是语义分割图
流程:
特征提取,子网络将地位特征图上采样到和原图同样大小,级联所有特征图,卷积层产生对语义分割图的最终预测
优点:以简单的方式捕捉上下文线索,从左右语义分割特征中学习对象像素的相似性
Q:怎么得到cost volume?
级联左右图的语义特征在不同的视差水平,打包到4D volume,得到语义cost volume
-------------------------------------------------------------------------------------------------------
3D multi-cost aggregation module
沙漏模块 + 3D FFM(特征融合模块):编解码结构学习不同级的金字塔上下文信息
过程: 对低级volume上采样到和上一级同样的大小,融合送入FFM模块,融合的cost volume接着与更高层的cost volume融合,最后一级的空间代价卷接着与语义代价卷融合,最终结果双线性插值上采样到原始图像大小
FFM过程:
像残差块结构,适应性平均池化将级联特征转变到特征向量。通过Relu-fc-sigmoid结构计算权重向量,两个代价卷中上采样的那个加权后和另一个代价卷组成FFM模块的输出。
-------------------------------------------------------------------------------------------------------
Disparity regression and loss function