介绍
- 卷积网络得到的边缘检测图,是高度“正确”,但并不那么“清晰”的,这是由于,首先,在更具鉴别性的卷积顶层,特征的空间分辨率急剧降低,导致边缘输出模糊,再次,全卷积会导致相邻像素的相似应答(线性插值方式),因此也会影响细边缘的产生。
- 提出了一种新的细化体系结构,灵感来自最近在密集图像标记方面的进展,细化路径为网络增加了额外的非线性,进一步减少了相邻像素内边缘响应之间的相关性。
- 本文对ConvNet的边缘图进行了系统的研究。结果表明,ConvNet具有良好的边缘像素分类能力,但定位能力较差;
- 本文将细化方案和亚像素卷积组合成一种新的体系结构,这是专门为学习脆边检测器而设计的;
在BSDS500上的结果在所有匹配距离上都优于最先进的方法。本文还表明,清晰的边缘映射可以改善光流估计和目标提案的生成。
相关工作介绍:
- 早期的边缘检测,手动设计的,基于强度、颜色、纹理等
- 近期的边缘检测,基于有监督的学习,被认为是像素点二值标记问题,例如Sketch Tokens、随机森林、结构性随机森林、SVM等进行学习
- 最近的边缘检测,基于卷积神经网络,如HED及其扩展等
- 本文提出的CED,跟HED网络不一样, 提出了用于分割对象的细化体系结构,采用自顶向下的路径来标记边缘的稀疏二元信号, 用亚像素卷积代替双线性插值(反卷积),这对于产生更好的局部化、锐利的边缘输出至关重要。
从卷积网络中学到的:
- 为什么HED可以得到这么高的分数,作者认为是评价标准的问题,匹配方式由最大允许距离d控制,如果边缘像素与label像素距离小于d,也会被认为是正确的。 “脆度”可以通过降低基准中的d来衡量。人类的表现随d的下降更快,而HED随d的下降,比人类下降更快
CED网络结构
- 一方面是前馈传播,获取丰富的网络特征图,而一大特点是,用了一个反向细化路径(backward-refining path,也就是图中的橙色框,扩展开就是第二个虚线框中的结构)来补充HED网络,它使用有效的亚像素卷积逐步提高样本特征, 反向细化路径将特征映射与沿前向传播路径的中间特征融合,这个细化方式由多个细化模块一起组成,最终达到原图的分辨率。
- 细化模块融合了一个自顶向下的特征映射和前传上的特征映射,并使用亚像素卷积向上采样。在进行融合的时候,通过减少两个特征映射的维数来实现融合(即降维,由于通道数不同,不得不这样做)。
- 将输入前向路径特征映射的通道数表示为kh。 经过卷积和RELU运算后,信道被简化为k‘h,远小于kh。同样的操作从先前的细化模块对特征映射进行校正,从ku生成k‘u。将上述特征映射连接到一个新的具有k‘u+k’h通道的特征映射中,并将其减少,用k‘d通道通过3×3卷积层进行特征映射。从而降低了总体计算成本,平衡了两个输入特征映射。
- 对于上采样,采用亚像素卷积操作,而非流行的反卷积操作,这样对于边缘的定位表现似乎更好。亚像素卷积不是通过单个反卷积层直接输出放大特征映射,而是由一个卷积层和一个跟随相移层组成的一种网络层。总体上看,参数量也比HED少了许多。
实验结果:
总结:
一句话概述本文特点就是,研究了HED网络,CED提出了细化的方案,即一、反向细化路径模块,以及二、采用亚像素卷积替代线性插值的全卷积,对于边缘定位效果更好。