1 网络结构

Pixel Aggregation Network (PAN)
训练阶段,网络生成三个预测:

  1. Text Region
  2. Kenel
  3. Similarity Vector

其中 1 和 2 为监督学习,3 为无监督学习(聚类)。

预测阶段,遵循以下步骤来使用相似度向量引导像素聚合到Kenel中

  1. 得到多个 Kenel;
  2. 对于每个 Kenel 的上下左右四个方向的像素,为 Text Region 内的每个像素找到与 Kenel 的欧式距离小于 dd (作者设置为 6 )的像素并将其聚合;
  3. 重复步骤 2 知道没有可用的像素。

    Pixel Aggregation Network (PAN)        Pixel Aggregation Network (PAN)

Kernel 是在 Text Region 里面的。

2 损失函数

Pixel Aggregation Network (PAN)

相关文章: