这篇文章主要的贡献点主要有两个:

1)在RROI 阶段,多尺度的pooling (7x7,3x11,11x3).

2)除了坐标对齐的bbox坐标回归,添加了inclined box的坐标回归(x1,y1,x2,y2,h)。[注:x1,y1,x2,y2分布是bbox按顺时针方向定义的两个角点]

网络结构如下:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

该方法的训练集:1000(icdar15_trainingset)+ 2000(focused scene text images that authors collected)+data-augmentation=39000

在ICDAR15上的性能:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

PK其它方法:

ICDAR15:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

ICDAR13:

【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

相关文章:

  • 2021-09-04
  • 2021-07-08
  • 2021-12-22
  • 2021-12-10
  • 2021-12-21
  • 2021-10-03
  • 2021-04-12
  • 2021-07-21
猜你喜欢
  • 2021-09-05
  • 2022-12-23
  • 2021-04-15
  • 2018-03-16
  • 2022-12-23
  • 2021-10-22
  • 2021-04-30
相关资源
相似解决方案