论文链接
这篇文章中作者提出了一个支持动态特征聚合的网络DAR-Net。DAR-Net的核心思想是生成一个自适应的pooling skeleton,这个结构既考虑了场景的复杂结构也结合了局部几何特征。skeleton提供可变的半局部感受野和权重,成为了连接局部卷积特征提取器和全局循环特征聚合器的桥梁。
![DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv] DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]](/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpFek1DODRNREZtTURVeE4yUTJabU16TkRFNVl6WmxPRFl6T1RJME5tSTNaV0V4TWk1d2JtYz0=)
skeleton如上图所示,我的理解所谓skeleton就是一些能够反映点云集合特征的keypoint。
![DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv] DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]](/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THprNE5DODFPREUxWm1FeFpUUXlNbUUzWVdRNU1tUTRaRFprTlRZeE9XSmxNalZoTUM1d2JtYz0=)
网络的pipeline如上图所示,首先根据点云无监督、自适应地学习skeleton,使其合理分布在点云中。这个过程作用类似于从下图的a到b(node个数应人为指定)。
![DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv] DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]](/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTl3YVdGdWMyaGxiaTVqYjIwdmFXMWhaMlZ6THpnM05TOWhaalF5WmpZMU0yWmxZVEZpTmpBNVlqQmxNVGMzWlRobFltRTRNalptWWk1d2JtYz0=)
然后从点云中学习局部的逐点特征,编码后的局部特征被动态地聚合到骨架中,作为信息抽象的中间尺度,得到node-wise的特征。
定义PN={pi∣0<i≤N}为点云,SM={sj∣0<j≤M}为pooling skeleton。Fagg−i为pointwise特征空间,Fagg−o为node-wise特征空间。Tj:0<Tj≤N为属于第j个node的点的个数,用于控制node的感受野。全局干涉因子 g。
特征的动态聚合就是将与每个node相关的点的特征使用聚合函数整合到node上。 可以表示为:
fjagg−o=fjagg−o(fi1jagg−i,...,fiTjjagg−i,g),0<itj≤N
属于每个node的点的索引可以通过构建每个点对node的k近邻索引矩阵I⊂NN×K来得到。I(i,k)表示点pi的第k个近邻node。属于node sj的点的索引可以表示为{itj}={i∣I(i,k)=sj}。特征的聚合函数表示如下:
{fjagg−o=∑j(fi1jagg−i,...,fiTjjagg−i)/gg=∑j∣itj∣/M=∑jTj/M
在此基础上,利用全局神经网络对中间接受域独立对应的节点特征进行处理,可以有效地学习远程知识。将全局整合的信息传回点云进行局部特征连接和分层解码。最后使用1×1的pointwise卷积生成语义预测结果。