DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]论文链接
\qquad这篇文章中作者提出了一个支持动态特征聚合的网络DAR-NetDAR-Net的核心思想是生成一个自适应的pooling skeleton,这个结构既考虑了场景的复杂结构也结合了局部几何特征。skeleton提供可变的半局部感受野和权重,成为了连接局部卷积特征提取器和全局循环特征聚合器的桥梁。
DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]
\qquadskeleton如上图所示,我的理解所谓skeleton就是一些能够反映点云集合特征的keypoint。
DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]
\qquad网络的pipeline如上图所示,首先根据点云无监督、自适应地学习skeleton,使其合理分布在点云中。这个过程作用类似于从下图的a到b(node个数应人为指定)。
DAR-Net: Dynamic Aggregation Network for Semantic Scene Segmentation[Arxiv]
\qquad然后从点云中学习局部的逐点特征,编码后的局部特征被动态地聚合到骨架中,作为信息抽象的中间尺度,得到node-wise的特征。

\qquad定义PN={pi0<iN}P_N=\{p_i|0<i\leq N\}为点云,SM={sj0<jM}S_M=\{s_j|0<j\leq M\}为pooling skeleton。FaggiF^{agg-i}为pointwise特征空间,FaggoF^{agg-o}为node-wise特征空间。Tj:0<TjNT_j:0<Tj\leq N为属于第jj个node的点的个数,用于控制node的感受野。全局干涉因子 gg

\qquad特征的动态聚合就是将与每个node相关的点的特征使用聚合函数整合到node上。 可以表示为:
fjaggo=fjaggo(fi1jaggi,...,fiTjjaggi,g),0<itjN \begin{array}{c} f_{j}^{agg-o}=f_{j}^{agg-o}(f_{i_1^{j}}^{agg-i},...,f_{i_{T_j}^{j}}^{agg-i},g),0<i_t^j\leq N \end{array}
\qquad属于每个node的点的索引可以通过构建每个点对node的k近邻索引矩阵INN×KI\subset \mathbb{N}^{N\times K}来得到。I(i,k)I(i,k)表示点pip_i的第k个近邻node。属于node sjs_j的点的索引可以表示为{itj}={iI(i,k)=sj}\{i_t^j\}=\{i|I(i,k)=s_j\}。特征的聚合函数表示如下:
{fjaggo=j(fi1jaggi,...,fiTjjaggi)/gg=jitj/M=jTj/M \left\{ \begin{array}{l} f_{j}^{agg-o}=\sum_j(f_{i_1^{j}}^{agg-i},...,f_{i_{T_j}^{j}}^{agg-i})/g\\ g=\sum_j|{i_t^j}|/M=\sum_jT_j/M \end{array} \right.
\qquad在此基础上,利用全局神经网络对中间接受域独立对应的节点特征进行处理,可以有效地学习远程知识。将全局整合的信息传回点云进行局部特征连接和分层解码。最后使用1×1的pointwise卷积生成语义预测结果。

相关文章:

  • 2021-08-14
  • 2021-08-01
  • 2021-05-02
  • 2022-01-13
  • 2021-08-17
  • 2021-12-01
猜你喜欢
  • 2022-12-23
  • 2021-04-08
  • 2021-05-26
  • 2021-06-24
  • 2021-06-26
  • 2021-09-17
相关资源
相似解决方案