TextBoxes++是基于SSD和TextBoxes的。论文:https://arxiv.org/pdf/1801.02765.pdf

前言

文本检测和其他物体检测的区别:

(1) 文本检测有比较大的长宽比;

(2) 一半的convolutional filter无法全部检测到;

可能的解决方案:

(1) 长的卷积核;

(2) inception convolutional kernels;

(3) part detection and grouping.

textboxes

与SSD区别:

(1) 把SSD的defaultbox的比例改成(1,2,3,5,7,10)的长矩形。

(2) 如下图所示,把原来的作为分类的卷积核3*3改成了1*5,更适合文本检测。

TextBoxes++

(3) 从多尺度变换成单尺度(textboxes系列算法对尺度的严重依赖性,对于不同尺度的图片,要调整不同的尺度效果才好)。

TextBoxes++

textboxes网络结构

TextBoxes++

SSD网络结构

TextBoxes++

代码:https://github.com/MhLiao/TextBoxes_plusplus




参考:

[1] https://zhuanlan.zhihu.com/p/34131821

相关文章:

  • 2021-07-16
  • 2021-07-08
  • 2021-10-07
  • 2022-12-23
  • 2021-07-28
  • 2021-11-29
  • 2021-07-28
  • 2021-07-05
猜你喜欢
  • 2022-12-23
  • 2021-10-17
  • 2021-11-09
  • 2021-06-27
  • 2021-11-16
  • 2021-10-04
  • 2021-04-24
相关资源
相似解决方案