Deep Crisp Boundaries（CED）论文学习笔记

介绍

卷积网络得到的边缘检测图，是高度“正确”，但并不那么“清晰”的，这是由于，首先，在更具鉴别性的卷积顶层，特征的空间分辨率急剧降低，导致边缘输出模糊，再次，全卷积会导致相邻像素的相似应答（线性插值方式），因此也会影响细边缘的产生。
提出了一种新的细化体系结构，灵感来自最近在密集图像标记方面的进展，细化路径为网络增加了额外的非线性，进一步减少了相邻像素内边缘响应之间的相关性。
本文对ConvNet的边缘图进行了系统的研究。结果表明，ConvNet具有良好的边缘像素分类能力，但定位能力较差；
本文将细化方案和亚像素卷积组合成一种新的体系结构，这是专门为学习脆边检测器而设计的；
在BSDS500上的结果在所有匹配距离上都优于最先进的方法。本文还表明，清晰的边缘映射可以改善光流估计和目标提案的生成。

从卷积网络中学到的：

为什么HED可以得到这么高的分数，作者认为是评价标准的问题，匹配方式由最大允许距离d控制，如果边缘像素与label像素距离小于d，也会被认为是正确的。 “脆度”可以通过降低基准中的d来衡量。人类的表现随d的下降更快，而HED随d的下降，比人类下降更快

CED网络结构

Deep Crisp Boundaries（CED）论文学习笔记

一方面是前馈传播，获取丰富的网络特征图，而一大特点是，用了一个反向细化路径（backward-refining path，也就是图中的橙色框，扩展开就是第二个虚线框中的结构）来补充HED网络，它使用有效的亚像素卷积逐步提高样本特征，反向细化路径将特征映射与沿前向传播路径的中间特征融合，这个细化方式由多个细化模块一起组成，最终达到原图的分辨率。
细化模块融合了一个自顶向下的特征映射和前传上的特征映射，并使用亚像素卷积向上采样。在进行融合的时候，通过减少两个特征映射的维数来实现融合（即降维，由于通道数不同，不得不这样做）。
将输入前向路径特征映射的通道数表示为kh。经过卷积和RELU运算后，信道被简化为k‘h，远小于kh。同样的操作从先前的细化模块对特征映射进行校正，从ku生成k‘u。将上述特征映射连接到一个新的具有k‘u+k’h通道的特征映射中，并将其减少，用k‘d通道通过3×3卷积层进行特征映射。从而降低了总体计算成本，平衡了两个输入特征映射。
对于上采样，采用亚像素卷积操作，而非流行的反卷积操作，这样对于边缘的定位表现似乎更好。亚像素卷积不是通过单个反卷积层直接输出放大特征映射，而是由一个卷积层和一个跟随相移层组成的一种网络层。总体上看，参数量也比HED少了许多。